GaussDB技术解读——GaussDB架构介绍之集群管理层(CM)关键技术方案

news/2025/1/15 15:51:02/文章来源:https://www.cnblogs.com/xiaoxu0211/p/18673197

GaussDB Kernel V5 集群管理层关键模块如下。

在这里插入图片描述

图4 集群管理层组件设计图

CM 组件提供了四种服务 CM Agent, CM Server, OM Monitor, cm_ctl,与各类实例服务组件(CN, DN, GTM 等)一起构成了整个数据库集群系统。

cm_ctl

通过命令行执行集群的启动、停止、状态查询、主备倒换、备机重建等功能

除启动和停止外,主要通过与 CM Server 的消息传递执行命令

可在任意节点执行并获取到相同的结果

OM Monitor

由系统定时任务拉起

负责 CM Agent 的运行状态监控

CM Agent

由 OM Monitor 拉起

负责拉起和停止所在节点的 CN, DN, GTM, CM Server(如果存在);监控实例状态并上报至 CM Server;执行 CM Server 下发的命令等

对应 cm_agent 二进制文件,所有节点常驻服务

CM Server

由 CM Agent 拉起,是整个集群管理组件的大脑

负责接收 cm_ctl 发送的命令并下发至 CM Agent;接收并处理 CM Agent 上报的实例状态,下发仲裁指令保证各类故障和异常场景下集群的可用性

对应 cm_server 二进制文件,常驻服务

CM与各类组件的主备数据同步、倒换、重建等机制高度融合,提供告警、重启、倒换、隔离等手段,赋予数据库实例故障恢复及自愈的高可用(HA)能力,保证数据的可靠性和完整性,最终实现集群对外的业务连续性。

集群管理仲裁关键技术

单节点故障在生产过程中,不可避免。CM 组件可根据探测到的状态进行仲裁,从而尽可能恢复集群可用性的过程。

以某个主 DN 故障为例,一次典型的仲裁流程包括:

① CM Agent 1探测DN主实例并发现故障

② CM Agent 1持续上报实例故障信息至CM Server

③ CM Server执行仲裁流程,选择DN备机升主

④ CM Server下发升主命令至CM Agent 2

⑤ CM Agent 2对实例执行升主操作

在这里插入图片描述

图5 集群管理仲裁过程

常见的故障类型包含磁盘故障、网络故障、下电故障、操作系统故障、其它故障(CPU故障)等。CM在选举过程中,遵从DN多数派。即,对于某一个DN分片来说,故障后的选主,需要得到大多数DN的投票,候选DN副本才可以被选中升主。仲裁规则主要依据两个原则:1) 任期(Term)大,且日志长的DN副本优先被选主 2) 同等条件下,静态主优先。

CM辅助不同组件故障情况下恢复过程

  1. CN 故障 (集中式部署时,无CM节点)

DDL 语句无法执行,DML 语句不受影响

通过将故障 CN 剔除,可保障 DDL 语句不受影响

仅支持集群内 CN 个数大于 3,且 1 个 CN 发生故障时剔除

  1. DN 故障

单点故障可自动恢复

主 DN 故障时,仲裁备 DN 升主继续提供服务

备 DN 故障时,主 DN 将日志和数据同步至从备,业务不受影响

  1. 主 GTM 故障

备 GTM 升主后继续提供服务

  1. 主 CM Server 故障

备 CM Server 接受多数派 CM Agent链接,升主后继续提供服务

异常检测

从业界经验来看,数据库实例可能处于故障、僵死、亚健康等状态。这些状态的出现概率逐级降低,但检测难度逐级增高。尤其是如何区分亚健康状态和系统繁忙状态,具有较大的挑战性。

CM 组件包含异常检测流程,可用于识别和处理网络不稳定、磁盘 IO 挂死、进程/线程僵死、进程频繁退出、实例状态时好时坏等场景,提高集群的稳定性和可用性。

以 DN 短链接检测为例,CM Agent 按照固定时间间隔与 DN 实例新建链接。如果与某个主 DN 链接失败或通过新链接无法执行 SQL 语句,则认为该 DN 发生 1 次 Hang 异常。如果多次出现异常,则会触发 Hang 检测机制,将该 DN 实例杀死并执行主备切换。目前常见的异常检测项有:

短链接建立

通过短链接执行 SQL 语句

IO 挂死

内存占用异常

基于Paxos协议复制实现DN副本自仲裁

GaussDB Kernel V5 采用基于Paxos协议主备副本复制协议,实现DN副本的自仲裁功能。关键技术方案如下图所示,其中DCF为GaussDB Kernel V5 基于Paxos协议的一致性复制组件。需包含日志复制、自仲裁选主等功能。
在这里插入图片描述

图6 DN自仲裁设计

关键技术方案要点:1)DN 副本自仲裁,缩短仲裁链路,减小RTO 2)采用Paxos一致性协议,保证DN副本间的一致性,避免备机由于日志分叉产生增量重建。

未来技术方案演进:1) DCF组件日志与数据库内核日志合一,减少对IO的占用。2) 采用Parallel Paxos协议或者多主的Paxos协议提升日志复制的吞吐量 3)通过RDMA/UB 网络优化主、备节点日志传输,提升日志复制性能。

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.hqwc.cn/news/869656.html

如若内容造成侵权/违法违规/事实不符,请联系编程知识网进行投诉反馈email:809451989@qq.com,一经查实,立即删除!

相关文章

GaussDB技术解读——GaussDB架构介绍之OM运维管理关键技术方案

​ GaussDB Kernel V5 OM运维管理关键模块如下。OM 运维主要功能有: 安装 升级 节点替换 扩容、缩容 自动告警 巡检 备份恢复、容灾 日志分析系统 在华为云的部署模式下,OM相关组件部署示意图如下: 图7 华为云OM运维管理 用户登录华为云Console,访问GaussDB Kernel V5的管控…

通义发布语音模型 MinMo:全双工、多口音;MiniCPM-o :端侧 GPT-4o 级视觉、语音、多模态实时流式大模型

开发者朋友们大家好:这里是 「RTE 开发者日报」 ,每天和大家一起看新闻、聊八卦。我们的社区编辑团队会整理分享 RTE(Real-Time Engagement) 领域内「有话题的 新闻 」、「有态度的 观点 」、「有意思的 数据 」、「有思考的 文章 」、「有看点的 会议 」,但内容仅代表编辑…

部署 Browser-Use WebUI + DeepSeek 实现浏览器AI自动化

一、安装部署 1.安装 python3.11 或以上版本2.安装browser-use pip install browser-use3.安装 Playwright playwright install4.安装项目依赖 pip install langchain-google-genai==2.0.8 pip install pyperclip==1.9.0 pip install gradio==5.9.1 pip install langchain-olla…

Day_01

学习MarkDownMarkDown学习 标题: 二级标题 三级标题 字体 hello world hello world hello world hello world hello world 引用选择狂神说Java,走向人生巅峰分割线图片超链接 点击跳转到B站 列表A B CA B C表格名字 性别 生日张三 男 2000.1.4代码 public static

高效团队如何选择问题管理工具?六款推荐与理由

1. 板栗看板(Banli Kanban) 推荐理由: 板栗看板是由重庆赛迪信息公司研发的在线协同文档编辑与项目管理工具,专为中国企业的团队协作需求量身打造。核心功能:板栗看板集任务管理、实时协作编辑、进度追踪于一体,通过简洁直观的界面帮助团队掌握开发节奏。适用场景:适合中…

任务分配与信息共享:跨职能团队协作的利器

一、跨职能团队协作的挑战 沟通障碍与信息不对称 跨职能团队通常由来自不同部门的成员组成,各个部门之间存在语言、目标和工作方式上的差异。例如,研发团队更加注重技术细节和功能实现,而市场和销售团队则关注产品的市场定位、推广策略和客户需求。这种背景差异往往会导致沟…

告别付费拍证件照!NAS 基于Docker部署免费证件照生成工具

你在生活中有没有遇到过急需证件照的场景?在某些考试前发现证件照还没准备好;求职面试时,也需要附上职业证件照,生活中还有很多需要证件照的场景。 本文章利用NAS基于Docker部署一款证件照自动生成的工具—HivisionIDPhotos。 利用‌HivisionIDPhotos‌,通过一张生活照片,…

揭秘35岁技术人去向:是高薪管理,还是无奈转行?

1 35 岁危机 35 是虚指,不一定 35 岁,也可是一个区间。有人 33 岁,有人是 40 岁。对技术人,到年龄确实明显困境。甚至不到 35 岁,网上招聘焦虑到32岁。 头部大厂小伙伴说晋升就像“续命卡”。升上去不一定稳,但可“多活”一两年,升不上去,不但目前绩效难保,甚至可能进…

电商小年营销全攻略:从策略到执行的全方位指南

电商小年营销需要从了解消费者需求、营造节日氛围、创新营销活动、社交媒体营销、优化物流配送以及提供优质服务等方面入手,全面提升营销效果和消费者体验。电商小年营销是针对小年这一传统节日进行的电子商务推广活动。小年作为春节的前奏,具有浓厚的节日氛围和独特的消费习…

TangGo:国产化综合红队协同工具

免责声明 请勿利用文章内的相关技术从事非法测试,如因此产生的一切不良后果与本公众号无关。最近我们团队在进行hvv演练的时候,我真切体会到了在日常工作中对高效工具的需求,找到一款合适的测试平台简直是事半功倍。 后面用了TangGo测试平台。这款工具真是让我省心不少。之前…

电商新年采购管理:优化策略与工具应用

电商新年用品采购管理是一个复杂而细致的过程,需要公司多个部门的协同合作和共同努力。通过科学的管理方法和工具的应用,可以提高采购效率、降低采购成本、确保商品质量,从而提升公司的竞争力和市场地位。电商新年用品采购管理是一个涵盖多个环节和方面的综合性工作,以下是…

输出Hello word

输出Hello word打开Notepad++文档,方便书写代码新建一个java文件编写代码 public class hello{public static void main (String[] args){ //格式固定的标题头System.out.print("hello word"); //输出的内容} }在cmd中编译javac …