主备延迟故障分析方法

news/2024/11/16 3:33:32/文章来源:https://www.cnblogs.com/YashanDB/p/18397112

【标题】主备延迟故障分析方法

【问题分类】故障分析

【关键字】Yashandb、主备延迟

【问题描述】当数据库备机出现回放延迟时,需要通过一些手段分析延迟的原因。通过数据库的系统视图或操作系统监控数据可以辅助分析回放延迟的瓶颈。

【问题原因分析】

备延迟手段

当前备库的复制情况


Note:

{rst}{asn}{blockid}

rst:为reset id,每次failover后,数据库新产生的redo文件的reset id会加1。

asn: 归档序列号,archive sequence number,每产生一个redo,ASN会加1,每个redo的ASN不相同。

blockid:redo文件内页面所在ID,页面的偏移量为 block id*block size。

lfn:log flush number,日志序列号,每次redo刷盘,LFN加1。

备机回放进度视图



数据库从MOUNT到OPEN阶段,统计的是重启回放信息,视图中Redo Remain项随着回放会减小。主机OPEN后,视图项不再变化。但是备机OPEN后,可能会重置视图内容,并且Redo Remain项和Remain Time项表示当前剩余日志对应的大小和回放时间。
检查redo的落盘速度

其他辅助分析视图介绍

检查磁盘的IO性能

输出信息说明

Device :磁盘名

rrqm/s :每秒进行的 merge 读数目

wrqm/s :每秒进行的 merge 写数目

r/s :每秒读 I/O 次数

w/s :每秒写 I/O 次数

rkB/s :每秒读设备的字节数(单位:K字节)

wkB/s :每秒写设备的字节数(单位:K字节)

avgrq-sz:平均每次设备I/O操作的数据大小

avgqu-sz:平均I/O队列长度

r_await :每个读操作的平均所需时间(包含列队等待时间)

w_await :每个写操作的平均所需时间(包含列队等待时间)

await :平均每次设备 IO 操作的等待时间(平均响应时间不超过5ms,单位:ms)

svctm :平均每次设备 IO 操作的服务时间(单位:ms)

%util :磁盘繁忙程度(注意:每块磁盘后面都有表示是否繁忙)

如果 svctm 与 await 比较接近,说明 IO 几乎没有等待。

如果 await 远高于 svctm ,说明 IO 队列太长 响应太慢,需要优化,可以从 avgqu-sz 队列长度看出来。

YCM监控主备延迟情况

V23.2.1.100 的ycm可以监控主备延迟,如下图

使用gstack查看线程状态

gstack yasdb进程 > gstack.txt

典型案例

问题单:生产数据迁移完毕后数据库延迟比较大

二线分析文章:《主备日志回放延迟高问题》

IO性能测试工具

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.hqwc.cn/news/792216.html

如若内容造成侵权/违法违规/事实不符,请联系编程知识网进行投诉反馈email:809451989@qq.com,一经查实,立即删除!

相关文章

【稀疏矩阵】使用torch.sparse模块

@目录稀疏矩阵的格式coocsrcscConstruction of Sparse COO tensorsConstruction of CSR tensorsLinear Algebra operations(稀疏与稠密之间混合运算)Tensor methods and sparse(与稀疏有关的tensor成员函数)coo张量可用的tensor成员函数(经实测,csr也有一些可以用,比如d…

Serverless 应用引擎 SAE 助力袋拉拉研发提效 70%

“我们调研和准备了半年,一次性迁移到了新版 SAE 上,主要看中了 SAE 的弹性能力和运维简单的特点,而且现在新版的使用体验越来越好了,控制台界面的操作比原来都要流畅很多。但我们还在持续摸索中,看如何能更好地应用 SAE。”作者:百潼 医院环保 IOT 设备的引领者:机汽猫…

2面准备记录

1、自我介绍 2、设计测试用例 3、购物车测试 4、输入框测试 5、GIT 常用命令

Altium designer软件介绍

Altium Designer 是原Protel软件开发商Altium公司推出的一体化的电子产品开发系统,主要运行在Windows操作系统。这套软件通过把原理图设计、电路仿真、PCB绘制编辑、拓扑逻辑自动布线、信号完整性分析和设计输出等技术的完美融合,为设计者提供了全新的设计解决方案,使设计者…

2024.7.5-2024.7.20 HA省学会集训游记(焦作一中)

这是一篇长篇小说 DAY1 除了DAY4-DAY5个别内容以外,这些都是补的,但是全写完有太多了qwq,挑题写了 树状数组和线段树基础很多都是一些模板题,太模板的题不再做太多解释 题目:P4062 P6619 P3688 P3157 P10497 P3374 P3368 P4223 P10589 P10688 CF1667B P10463 SP1716 CF718…

win11+docker desktop导入镜像运行容器

一:配置环境 前置条件:Win11环境,docker注册账号 1.安装WSL (1)在windows store安装Ubuntu 20.04.6 (2)设置“控制面板”-“程序”-“程序和功能”-左侧“启用或关闭Windows功能”-打开“适用于Linux的Windows子系统”,“Windows虚拟机监控程序平台” (3)终端执行: …

该如何做参数校验

该如何做参数校验技术架构springboot首先每一个接口都要有controller service mapper这种参数校验也是有很多种做法的,分享我的做法。那么入参是必须要做校验的比如 实体类 用Optional.ofNullable Optional.ofNullable 是Java 8引入的一个用于处理空值的类 Optional 中的一个静…

升级程序后报错 :Parse error: syntax error, unexpected :, expecting

当您看到类似“Parse error: syntax error, unexpected :, expecting ...”这样的错误时,这通常是因为 PHP 代码中存在语法错误。具体来说,这通常是因为某个语法特性在当前 PHP 版本中不被支持。 常见原因PHP 版本不兼容:新代码可能使用了较新版本的 PHP 语法特性,而当前服…

网站上传图片被压缩怎么解决

当网站上传图片被压缩导致质量下降时,可以通过以下几种方式来解决这个问题: 1. 了解平台压缩机制 首先了解平台对图片压缩的具体机制,比如压缩算法、压缩比例等。这有助于针对性地采取措施。 2. 优化图片上传前的准备按照规定尺寸设计素材:确保上传的图片符合平台要求的尺寸…

网站打开提示:”未检测到您服务器环境的sqlite3数据库扩展...“

当网站打开时提示“未检测到您服务器环境的sqlite3数据库扩展”,这表明您的服务器上缺少 SQLite3 扩展,或者虽然安装了 SQLite3 扩展,但是 PHP 并未正确配置来使用它。以下是一些排查和解决这个问题的方法: 1. 检查 SQLite3 扩展是否安装 首先,您需要确认 SQLite3 扩展是否…

IIS相关错误报错汇总整理及解决方案

解决方案400 Bad Request:检查请求是否包含错误的信息或格式。 401 Unauthorized:确认是否已经进行了身份验证。 403 Forbidden:检查是否有足够的权限访问资源。 404 Not Found:确认请求的URL是否正确,资源是否存在。 500 Internal Server Error:检查服务器日志,寻找错误…

中华财险60%研发人员用通义灵码全面提效,“越用越上瘾”

保险业被看成是社会“稳定器”和经济“助推器”,近年来已驶入数字化发展快车道。在 AI、大模型当道的今天,保险行业的研发流程、产品设计、场景拓展等业务链条各环节,都值得用大模型进行重塑。点击查看中华财险视频采访! 保险业被看成是社会“稳定器”和经济“助推器”,近…