gh-ost详解

一、简介

gh-ost是MySQL的无触发器在线DDL。它是可测试的,并提供可暂停性、动态控制/重新配置、审计和许多操作特权。DDL时master会生成少量工作负载,与迁移表上的现有工作负载分离。详细内容请看github

二、工作原理

1.ghost 迁移:

  • 在服务器上创建ghost表,与要执行的DDL表结构一致
  • 在ghost表上进行DDL变更
  • 连接MySQL伪装为replica,流式传输binary log events
  • 可交互的操作
    • 在ghost表上应用events
    • 将原始表中的行复制到ghost table上
  • cut-over(切换表)

2.首选设置

  • 连接到从库
  • 检测副本上的表结构,表大小
  • 连接到从库伪装成从库的从库
  • 应用所有变更到主库上
  • 心跳检测事件写到主库上
    工作原理图

3.要求

  • gh-ost 当前需要 MySQL 版本 5.7 及更高版本。
  • row格式且为FULL row image的binlog
  • 表级别权限:ALTER, CREATE, DELETE, DROP, INDEX, INSERT, LOCK TABLES, SELECT, TRIGGER, UPDATE
  • 全局权限:SUPER, REPLICATION SLAVE,REPLICATION CLIENT

4.限制

  • 不支持外键约束。 他们将来可能会在某种程度上得到支持。
  • 不支持触发器。 他们将来可能会得到支持。
  • 支持 MySQL 5.7 JSON 列,但不作为 PRIMARY KEY 的一部分
  • 前后两个表必须共享主键或其他唯一键。 复制时 gh-ost 将使用此键来迭代表行
    • 迁移键不得包含具有 NULL 值的列,作为键的字段类型可以为null,但值不能为null
    • 默认情况下,如果唯一的 UNIQUE KEY 包含可为空的列,则 gh-ost 将不会运行。可以通过 --allow-nullable-unique-key 覆盖它,但请确保这些列中没有实际的 NULL 值。 现有的 NULL 值不能保证迁移表上的数据完整性。
  • 不允许迁移一个库中的同名表(大小写不同但名字相同,如abc,Abc)
  • Amazon RDS 可以工作,但有其自身的局限性。
  • Google Cloud SQL 可以工作,需要 --gcp 标志。
  • Aliyun RDS 可以工作,需要 --aliyun-rds 标志。
  • Azure Database for MySQL 可以工作,需要 --azure 标志,并且有关于它的详细文档。 (azure.md)
  • 通过副本迁移时不支持多源。 直接连接到 master 时它应该可以工作(但从未测试过)(–allow-on-master)
  • 双主架构仅支持单写模式
  • 如果您将枚举字段作为迁移键(通常是主键)的一部分,迁移性能将会降低并且可能会很糟糕。
  • 迁移 FEDERATED 表不受支持,并且与 gh-ost 解决的问题无关。
  • 不支持加密的二进制日志
  • 不支持 ALTER TABLE … RENAME TO some_other_name (并且您不应该使用 gh-ost 进行此类简单操作)。

5.cut-over

MySQL 对表交换的发生方式设置了一些限制。 虽然它支持原子交换,但它不允许连接到其锁定的交换表。

  • FB(facebook OSC) : 寻找“切换阶段”。 Facebook 解决方案使用非原子交换:首先重命名原始表并将其推到一边,然后重命名幽灵表以取代其位置。 在两次重命名之间,有一段短暂的时间,这个短暂的时间表不存在,所以会导致查询失败。
  • gh-ost 通过使用原子的两步阻塞交换来解决这个问题:当一个连接持有锁时,另一个连接尝试原子 RENAME。 通过放置一个哨兵表来保证 RENAME 不会过早执行,该哨兵表会阻止 RENAME 操作,直到 gh-ost 满足所有要求为止。
    • 成功执行,在这种情况下,表会自动交换,挂起的连接会被阻塞一段时间,继续对新迁移的表进行操作
    • 或者由于某些连接超时或死亡而失败,在这种情况下,我们自然会返回到预切换阶段,其中原始表仍然存在并且可以访问。 这会释放挂起的连接,这些连接能够再次写入表,然后 gh-ost 能够再次尝试切换。

如果指定 --cut-over,则默认为上述原子切换算法。 还支持 --cut-over=two-step,它使用 FB 非原子算法

三、多种变更模式

gh-ost 的运行方式是连接到可能的多个服务器,并将自身强加为副本,以便直接从其中一台服务器流式获取binary log events。 有多种操作模式,具体取决于您的设置、配置以及要运行迁移的位置。如下图所示
在这里插入图片描述

1.连接到replica,在master上迁移

这是 gh-ost 默认期望的模式。 gh-ost 将调查副本,找到拓扑的主节点,并且也会链接到master上。

1.1 变更流程

  • 在master上读取和写入行数据
  • 读取从库上的binary logs events ,将变更应用到master上
  • 记录从库上的表格式、字段和主键,索引,行数
  • 从副本读取内部变更日志事件(例如心跳)
  • 主站上的切换(切换表)

1.2 限制

从库必须开启row格式的binary log,必须开启log_slave_updates参数

1.3 示例

gh-ost \
--max-load=Threads_running=25 \
--critical-load=Threads_running=1000 \
--chunk-size=1000 \
--throttle-control-replicas="myreplica.1.com,myreplica.2.com" \
--max-lag-millis=1500 \
--user="gh-ost" \
--password="123456" \
--host=replica.with.rbr.com \
--database="my_schema" \
--table="my_table" \
--verbose \
--alter="engine=innodb" \
--switch-to-rbr \
--allow-master-master \
--cut-over=default \
--exact-rowcount \
--concurrent-rowcount \
--default-retries=120 \
--panic-flag-file=/tmp/ghost.panic.flag \
--postpone-cut-over-flag-file=/tmp/ghost.postpone.flag \
[--execute] # 指定了--execute才会实际运行复制数据和切换表的操作

2.连接到master

如果没有从库,或者不想使用它们,仍然可以直接在master上进行操作。 gh-ost 将直接在 master 上执行所有操作。 需要考虑复制延迟的情况

2.1 限制

  • master必须开启row格式的binlog
  • 必须指定–allow-on-master参数

2.2 示例

gh-ost \
--max-load=Threads_running=25 \
--critical-load=Threads_running=1000 \
--chunk-size=1000 \
--throttle-control-replicas="myreplica.1.com,myreplica.2.com" \
--max-lag-millis=1500 \
--user="gh-ost" \
--password="123456" \
--host=master.with.rbr.com \
--allow-on-master \
--database="my_schema" \
--table="my_table" \
--verbose \
--alter="engine=innodb" \
--switch-to-rbr \
--allow-master-master \
--cut-over=default \
--exact-rowcount \
--concurrent-rowcount \
--default-retries=120 \
--panic-flag-file=/tmp/ghost.panic.flag \
--postpone-cut-over-flag-file=/tmp/ghost.postpone.flag \
[--execute]

3.在从库上进行测试

这将在从库上执行迁移。 gh-ost 将短暂连接到master,但随后将在从库执行所有操作,而不修改master上的任何内容。 在整个操作过程中,gh-ost 将进行限制,以使从库保持最新。

3.1 参数指定

  • --migrate-on-replica 向 gh-ost 指示它必须直接在从库上迁移表。 即使复制正在运行,它也会执行切换阶段。
  • --test-on-replica 表示迁移仅用于测试目的。 在进行切换之前,复制会停止。 表被交换,然后又交换回来:原来的表返回到原来的位置。 两个表都停止复制。 您可以检查两者并比较数据。

3.2 示例

gh-ost \--user="gh-ost" \--password="123456" \--host=replica.with.rbr.com \--test-on-replica \--database="my_schema" \--table="my_table" \--verbose \--alter="engine=innodb" \--initially-drop-ghost-table \--initially-drop-old-table \--max-load=Threads_running=30 \--switch-to-rbr \--chunk-size=500 \--cut-over=default \--exact-rowcount \--concurrent-rowcount \--serve-socket-file=/tmp/gh-ost.test.sock \--panic-flag-file=/tmp/gh-ost.panic.flag \--execute

4.其他配置

4.1 配置文件

用--conf=/path/to/config/file.cnf替代用户名密码的配置

[client]
user=gh-ost
password=123456

4.2 特殊配置

4.2.1 双主复制

双主单写的架构,目前不支持双主双写架构

gh-ost --allow-master-master
# ghost会选择其中的一个master进行操作,当然你也可以指定master
gh-ost --allow-master-master --assume-master-host=a.specific.master.com
4.2.2 Tungsten复制

tungsten 复制是一种第三方复制,所以类似一个单独的程序,并不能通过常规查看主从拓扑的方式查到,这对这种可以选择在主库执行变更,如果连接到从库则需要开启tungsten的og-slave-updates。另外 --switch-to-rbr 不适用于 Tungsten 设置,因为复制过程是外部的,因此您需要确保在 Tungsten Replicator 连接到服务器并开始应用来自主服务器的事件之前将 binlog_format 设置为 ROW

gh-ost --tungsten --assume-master-host=the.topology.master.com

4.3 并发变更

  • 不要处理同一张表
  • 如果在不同的从库上运行(例如,replica1 上的 table1,replica2 上的 table2),则无需进一步配置。
  • 如果从同一服务器运行(二进制文件在同一服务器上运行,无论使用哪个副本)
    • 确保不要指定相同的 --serve-socket-file (或让 gh-ost 为您选择一个)
    • 您可以选择使用相同的 --throttle-flag-file (最好使用 --throttle-additional-flag-file,有两个的原因,后一个文件用于共享)。
    • 您可以选择使用相同的 --panic-flag-file。 这一切都取决于您的流程以及您希望如何控制迁移。
  • 如果使用相同的检查框(master或slave,–host=everyone.uses.this.host),那么对于每个 gh-ost 进程,您还必须提供不同的、唯一的 --replica-server-id。 可以选择使用进程 ID(shell 中的 $$); 但你需要选择一个不会与另一个 gh-ost 或另一个正在运行的副本发生冲突的数字。

四、交互式命令

gh-ost 被设计为易于操作。 为此,它允许用户即使在运行时也可以控制其行为。

  • Unix socket文件:通过 --serve-socket-file提供或由gh-ost确定,该接口始终处于运行状态。 当自行确定时,gh-ost 将在启动时和整个迁移过程中通告套接字文件的标识。
  • TCP:如果提供了 --serve-tcp-port
    两个接口可以同时服务。 两者都响应

1.命令详解

help:显示可用命令的简要列表
status:返回迁移进度和配置的详细状态摘要
sup:返回迁移进度的简要状态摘要
coordinates:返回被检查服务器的最新(尽管不完全是最新的)二进制日志坐标
applier:返回应用程序的主机名
inspector:返回检查器的主机名
chunk-size=<newsize>:修改chunk-size; 适用于下一次运行的复制迭代
dml-batch-size=<newsize>:修改dml-batch-size; 适用于下次应用二进制日志事件
max-lag-millis=<max-lag>:修改最大复制滞后阈值(毫秒,最小值为100,即0.1秒)
max-load=<max-load-thresholds>:修改最大负载配置; 适用于下一次运行的复制迭代格式必须为:some_status=<numeric-threshold>[,some_status=<numeric-threshold>...]例如:Threads_running=50,threads_connected=1000,然后您将写入/echo max-load=Threads_running=50,threads_connected=1000 到套接字。
critical-load=<critical-load-thresholds>: 修改关键负载配置(超过这些阈值将中止操作)格式必须为:some_status=<numeric-threshold>[,some_status=<numeric-threshold>...]例如:Threads_running=1000,threads_connected=5000,然后您将写入/echo critical-load=Threads_running=1000,threads_connected=5000 到套接字。
nice-ratio=<ratio>: 更改执行频率,范围为0到任何正整数,假如复制一行数据需要1ms,nice-ratio=0.5,那么久需要额外sleep 0.5*1ms
throttle-http:更改节流HTTP 端点
throttle-query:更改节流查询
throttle-control-replicas='replica1,replica2': 更改限制控制副本列表,这些是gh-ost将检查的副本。这需要一个逗号分隔的副本列表来检查并替换之前的列表。
throttle:强制暂停迁移
no-throttle:取消强制暂停(尽管其他限制原因可能仍然适用)
unpostpone:在gh-ost推迟切换阶段时,gh-ost指示停止推迟并立即进行切换。
panic:紧急中止操作

2.使用示例

$ echo status | nc -U /tmp/gh-ost.test.sample_data_0.sock
# Migrating `test`.`sample_data_0`; Ghost table is `test`.`_sample_data_0_gst`
# Migration started at Tue Jun 07 11:45:16 +0200 2016
# chunk-size: 200; max lag: 1500ms; dml-batch-size: 10; max-load: map[Threads_connected:20]
# Throttle additional flag file: /tmp/gh-ost.throttle
# Serving on unix socket: /tmp/gh-ost.test.sample_data_0.sock
# Serving on TCP port: 10001
Copy: 0/2915 0.0%; Applied: 0; Backlog: 0/100; Elapsed: 40s(copy), 41s(total); streamer: mysql-bin.000550:49942; ETA: throttled, flag-file$ echo status | nc -U /tmp/gh-ost.test.sample_data_0.sock
# Migrating `test`.`sample_data_0`; Ghost table is `test`.`_sample_data_0_gst`
# Migration started at Tue Jun 07 11:45:16 +0200 2016
# chunk-size: 200; max lag: 1500ms; dml-batch-size: 10; max-load: map[Threads_connected:20]
# Throttle additional flag file: /tmp/gh-ost.throttle
# Serving on unix socket: /tmp/gh-ost.test.sample_data_0.sock
# Serving on TCP port: 10001
Copy: 0/2915 0.0%; Applied: 0; Backlog: 0/100; Elapsed: 40s(copy), 41s(total); streamer: mysql-bin.000550:49942; ETA: throttled, flag-file# 对于接受参数作为值的命令,传递 ? (问号)获取当前值而不是设置新值
$ echo "chunk-size=?" | nc -U /tmp/gh-ost.test.sample_data_0.sock
250$ echo throttle | nc -U /tmp/gh-ost.test.sample_data_0.sock$ echo status | nc -U /tmp/gh-ost.test.sample_data_0.sock
# Migrating `test`.`sample_data_0`; Ghost table is `test`.`_sample_data_0_gst`
# Migration started at Tue Jun 07 11:56:03 +0200 2016
# chunk-size: 250; max lag: 1500ms; max-load: map[Threads_connected:20]
# Throttle additional flag file: /tmp/gh-ost.throttle
# Serving on unix socket: /tmp/gh-ost.test.sample_data_0.sock
# Serving on TCP port: 10001
Copy: 0/2915 0.0%; Applied: 0; Backlog: 0/100; Elapsed: 59s(copy), 59s(total); streamer: mysql-bin.000551:68067; ETA: throttled, commanded by user

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.hqwc.cn/news/265326.html

如若内容造成侵权/违法违规/事实不符,请联系编程知识网进行投诉反馈email:809451989@qq.com,一经查实,立即删除!

相关文章

VMware虚拟机cpu不支持avx指令集处理

原创作者&#xff1a;运维工程师 谢晋 VMware虚拟机cpu不支持avx指令集处理 客户虚拟化环境内有台虚拟机内应用程序需要使用到avx指令集&#xff0c;排查过物理主机CPU是支持avx指令集&#xff0c;但虚拟机内缺无法正常应用&#xff0c;需将虚拟机CPU修改为硬件模式。将虚拟…

R1530 双重作用抑制剂 882531-87-5科研试剂

R1530 双重作用抑制剂 882531-87-5&#xff08;源自星戈瑞&#xff09; EFdA-TP 核苷逆转录酶抑制剂 950913-56-1 (RT) 3-O-Methylviridicatin TNF-α的抑制剂 6152-57-4 Zidebactam sodium salt β-内酰胺酶抑制剂 1706777-46-9 Triacsin C 酰基辅酶A合成酶抑制剂 76896-80…

第三十二课 电商系统增删改查统一接口的编写

商品增删改查 统一接口 接口方法&#xff0c;只有五个 Add增 Delete 删 Update 更新 findAll查询所有 findOne查询某一个 add增加一个数据 不管增加哪一个表的数据 表名&#xff08;小写&#xff09;与类名一致表中的字段在类中私有化封装 采用&#xff1a;java技术…

K8S终于迎来交换内存Beta支持!那么什么是交换内存beta支持呢?

随着云计算和容器化技术的快速发展&#xff0c;Kubernetes&#xff08;K8S&#xff09;作为一个开源的容器编排引擎&#xff0c;一直在持续改进和完善自身的功能和性能。近期&#xff0c;K8S迎来了一个令人振奋的消息&#xff1a;交换内存&#xff08;Swap&#xff09;Beta支持…

统信UOS_麒麟KYLINOS上使用命令行配置NTP服务器

原文链接&#xff1a;统信UOS/麒麟KYLINOS上使用命令行配置NTP hello&#xff0c;大家好啊&#xff0c;今天我要给大家介绍的是在统信UOS/麒麟KYLINOS操作系统上使用命令行配置NTP&#xff08;Network Time Protocol&#xff09;服务器的方法。在内网环境下&#xff0c;许多企业…

实用篇 | 一文学会人工智能中API的Flask编写(内含模板)

----------------------- &#x1f388;API 相关直达 &#x1f388;-------------------------- &#x1f680;Gradio: 实用篇 | 关于Gradio快速构建人工智能模型实现界面&#xff0c;你想知道的都在这里-CSDN博客 &#x1f680;Streamlit :实用篇 | 一文快速构建人工智能前端展…

SQL手工注入漏洞测试(PostgreSQL数据库)-墨者

———靶场专栏——— 声明&#xff1a;文章由作者weoptions学习或练习过程中的步骤及思路&#xff0c;非正式答案&#xff0c;仅供学习和参考。 靶场背景&#xff1a; 来源&#xff1a; 墨者学院 简介&#xff1a; 安全工程师"墨者"最近在练习SQL手工注入漏洞&#…

小红书笔记投流全攻略,打造爆款内容

在小红书平台上&#xff0c;信息流投放和搜索广告是两种主要的广告形式。信息流投放主要通过用户刷作品时展示你的笔记&#xff0c;而搜索广告则是用户搜索相关关键词时展示出的内容。今天就和大家分享下小红书笔记投流全攻略&#xff0c;打造爆款内容&#xff01; 一、什么样你…

计算机毕业设计 基于SpringBoot的电动车租赁系统的设计与实现 Java实战项目 附源码+文档+视频讲解

博主介绍&#xff1a;✌从事软件开发10年之余&#xff0c;专注于Java技术领域、Python人工智能及数据挖掘、小程序项目开发和Android项目开发等。CSDN、掘金、华为云、InfoQ、阿里云等平台优质作者✌ &#x1f345;文末获取源码联系&#x1f345; &#x1f447;&#x1f3fb; 精…

【深度学习】注意力机制(三)

本文介绍一些注意力机制的实现&#xff0c;包括EMHSA/SA/SGE/AFT/Outlook Attention。 【深度学习】注意力机制&#xff08;一&#xff09; 【深度学习】注意力机制&#xff08;二&#xff09; 目录 一、EMHSA&#xff08;Efficient Multi-Head Self-Attention&#xff09;…

flstudio21.3.2304高级版水果编曲音乐软件

flstudio高级版是一款适用于广泛领域的音频编辑软件。它支持多通道混音器和VST插件&#xff0c;包括数百种乐器和效果插件。它还为您提供了一个乐谱编辑器&#xff0c;需要对不同乐器的节奏进行必要的编辑。Flstudio具有许多内置电子合成声音&#xff0c;可提供更广泛的电子声音…

从电商API接口谈电商ERP系统介绍

部分网友反馈小红书APP出现闪退问题。对此&#xff0c;小红书客服微博发文称&#xff0c;如遇到小红书APP无法启动的情况&#xff0c;用户可前往App Store下载最新版本&#xff08;详情可见&#xff1a; &#xff09;小红书闪退崩溃出bug&#xff0c;IT人员要背故障吗&#xff…