Exadata磁盘写入性能差,导致数据库出现大量free buffer waits

1、故障概述

某客户的Exadata上,运行着很多套ORACLE数据库,在每个月的征期内,业务系统经常出现卡顿的现象,主要表现为业务数据写入慢,甚至出现业务写入超时的情况。

 

2、故障分析

2.1 AWR分析

(1).分析数据库的AWR报告。(本报告取自于业务高峰期)

从数据库的TOP10等待事件可以看出,当前最为严重的等待事件为:free buffer waits和write complete waits.

free buffer waits等待事件,简单来说,就是ORACLE要进行物理读时,在内存中没有找到合适的空闲内存块,此时就需要唤醒DBWN进程将内存中的脏数据刷回磁盘,然后释放内存,在等待脏数据刷回磁盘的这一过程中,请求空闲内存的进程就进入睡眠状态进行等待,等待事件就为free buffer waits.

write complete waits等待事件,当内存中的一个脏数据块正在被刷回磁盘的过程中,另外一个进程对这个数据块同时发起IO请求,这个IO请求就需要等待,等其被写入磁盘完成后,才能再次访问,这一过程就会产生write complete waits等待事件。

从等待事件大概可以看出,问题在于磁盘的写入性能太差,业务系统的数据变化比较大,导致内存中的脏数据刷回磁盘比较慢。

 

(2).分析后台进程的等待事件。

可以看到,db file parallel write等待事件占用了近80%的数据库时间。平均延迟为11207ms,这也表明,磁盘的写入性能非常非常差。

 

2.2 存储软件日志分析

检查存储软件日志,发现“自动磁盘擦洗和修复”特性已经开启。

“自动磁盘擦洗和修复”特性,主要是为了尽早地发现和解决硬盘的坏道问题,默认每两个星期会自动运行。但是,这个特性带来的负面问题是:磁盘擦洗时,会消耗大量IO,在业务高峰期时,会造成IO耗尽,业务不可使用。

在其他省份,相应的做法是:手动关闭该特性,在每月的征期结束后,手动启动该特性,等磁盘擦洗工作结束,再次关闭该特性。

 

2.3 存储配置检查

检查当前的存储配置,如下所示。

 从存储软件的配置来看,当前FlashCache闪存的配置为WriteThough模式。

WriteThough模式:刷内存中的脏数据时,是直接刷入机械磁盘,才完成刷脏数据操作。

WriteBack模式:刷内存中的脏数据时,是先刷加到闪存卡中,就完成刷脏数据操作,后期再慢慢地将闪存中的数据刷回机械磁盘。

闪存的IOPS远远高于机械磁盘,所以需要开启存储的WriteBack模式,解决写入慢的问题。

 

2.4 GoldenGate配置检查

目前,是从存储节点的机械磁盘所在的磁盘组中划分一部分空间,做成DBFS文件系统,GoldenGate就存放在这个DBFS文件系统中。

由于GoldenGate抽取数据时,会产生大量的IO写操作,并且GoldenGate产生的IO写操作无法使用到存储节点中的闪存资源,这进一步加剧了机械磁盘的压力。

 

3 建议:

3.1 手动控制存储节点的“自动磁盘擦洗和修复”特性.

3.2 调整所有存储节点,开启闪存的WriteBack模式。

3.3 将GoldenGate改成本地的文件系统,减轻存储节点机械磁盘的压力。

 

最终,开启闪存的WriteBack模式后,故障得以解决。

 

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.hqwc.cn/news/876015.html

如若内容造成侵权/违法违规/事实不符,请联系编程知识网进行投诉反馈email:809451989@qq.com,一经查实,立即删除!

相关文章

zkap_春节赛

题目情况web welcome_to_zkaqctf nodejs题目。给出附件包含后端源码,app listen部分根据本地nodejs监听调式需要,自行添加,用node --inspect app.js命令启动调试监听 // const host = 127.0.0.1; // 主机名或IP地址 // const port = 9999; // const app = fastify(); app.l…

AI 语音独角兽 ElevenLabs C 轮融资估值超 30 亿美元;港科大 Llasa TTS:15 秒声音克隆支持中英双语

开发者朋友们大家好:这里是 「RTE 开发者日报」 ,每天和大家一起看新闻、聊八卦。我们的社区编辑团队会整理分享 RTE(Real-Time Engagement) 领域内「有话题的 新闻 」、「有态度的 观点 」、「有意思的 数据 」、「有思考的 文章 」、「有看点的 会议 」,但内容仅代表编辑…

The Locker Puzzle

The Locker Puzzle 今天刷到一个很有趣的著名概率题,如果有和我一样闲的人可以一起看看。 Philippe Flajolet和Robert Sedgewick在2009年提出了“百囚犯问题(The Locker Puzzle)”。 问题描述 在监狱中有100名囚犯,被编号为1-100号。典狱长决定给囚犯们一次特赦的机会,条件…

DDR3 memory type not supported

问题现象 电脑开机之后无法进入系统,而是显示下图: 解决方法 以为是内存条金手指有灰尘导致无法正常读取,插拔擦拭之后问题依旧。在网上查阅资料之后发现可能是内存条的电压与原装的不同,把加装的第二根内存取下之后,电脑正常。hp技术支持中心:https://h30434.www3.hp.co…

Python数据格式转换神器-提高办公效率

Python办公技巧,数据转换神器,提升工作效率一、引言在工作日常里,数据转换总是让人头疼?别急,今天揭秘一个超级实用的Python技巧,帮你轻松搞定各种数据格式转换,提升工作效率不是梦! 场景1:你手头有一堆CSV格式的(逗号分隔符)数据,其他部门或公司需要你提供其中几列关…

Python Functools模块

代码:#coding=utf-8import functools from functools import cache from functools import cached_property, lru_cache from functools import partial, partialmethod from functools import singledispatch, singledispatchmethod from functools import update_wrapper, w…

F12调试应用:强行查看洛谷个人主页

1.前言 众所周知,洛谷的个人主页常常有些不得了的东西,但是:(洛谷估值第二名%%%)这个系统维护每次都拦着我们。 有一个比较常用的方法就是删掉域名.cn,访问外国服务器(天天炸)。所以必须要有更可靠的方法。 2.F12大法妙 这时候,我们就可以按下F12打开检查。按下左上角…

【AI+安全】看不见的AI安全威胁,揭秘隐形提示注入风险

在人工智能蓬勃发展并融合到各行各业的当前,一种新型的威胁正悄然蔓延:隐形提示注入攻击。这种看不见的攻击手段,利用了用户肉眼无法识别的特殊字符,悄无声息地影响着大语言模型的行为。它就像一个隐藏在阴影中的刺客,偷偷操纵强大的 AI 系统做出意想不到的危险行为。 如果…

unity shader 消融效果

消融效果 基础消融效果原理多方向和可控消融

React中的数据流管理

我们是袋鼠云数栈 UED 团队,致力于打造优秀的一站式数据中台产品。我们始终保持工匠精神,探索前端道路,为社区积累并传播经验价值。本文作者:霜序前言💡 为什么数据流管理重要? React 的核心思想为:UI=render(data) ,data 就是所谓的数据,render 是 React 提供的纯函…

代码随想录算法训练营第9天 | 151.翻转字符串里的单词、右旋字符串、28. 实现 strStr()、重复的子字符串、字符串:总结篇、双指针回顾

一、刷题部分 1.1 151.翻转字符串里的单词原文链接:代码随想录 题目链接:151. 反转字符串中的单词 - 力扣(LeetCode)1.1.1 题目描述 给你一个字符串 s ,请你反转字符串中 单词 的顺序。 单词 是由非空格字符组成的字符串。s 中使用至少一个空格将字符串中的 单词 分隔开。…

《CPython Internals》阅读笔记:p360-p377

《CPython Internals》学习第 20 天,p360-p377 总结,总计 18 页。 一、技术总结 1.seaborn 可视化工具。 2.dtrace (1)安装 sudo apt-get install systemtap-sdt-dev(2)编译 ./configure --with-dtrace make clean make3.snakeviz 适用于 cProfile 的可视化工具。 二、英语总…