【MySQL工具】pt-online-schema-change源码分析

通过阅读源码 更加深入了解原理,以及如何进行全量数据同步,如何使用触发器来同步变更期间的原表的数据更改。(^-^)V

目录

源码分析 

Get configuration information.

Connect to MySQL.

Create --plugin.

Setup lag and load monitors.

Check for replication filters.

Print --tries.

Get child tables of the original table, if necessary.

Check the --alter statement.

check and create PID file if user specified --pid.

Init the --plugin.

Step 1: Create the new table.

Step 2: Alter the new, empty table. This should be very quick, or die if the user specified a bad alter statement.

Step 3: Create the triggers to capture changes on the original table and apply them to the new table.

详细解读一下这三个触发器 

DELETE TRIGGER 删除触发器

UPDATE TRIGGER 更新触发器

INSERT TRIGGER 插入触发器

Step 4: Copy rows.

对于空表 

对于大表的该阶段步骤 

Step 5: Update foreign key constraints if there are child tables.

Step 6: Swap tables

Step 7: Drop the old table.

测试步骤

开启全量日志

创建一张空表

进行变更

输出的日志 

输出日志分析 


源码分析 

这个文件非常“臃肿肥胖“,因为依赖的模块都在这一个文件中,这个文件有13000多行的代码。

找到函数的入口 main(),该脚本的主题流程如下 

Get configuration information.

获取并 检查设置的参数,感觉对外键的处理让工具变的复杂了很多。

主要是根据设置的命令行参数进行检查设置,我根据源码举几个例子

  • 如果设置了参数 null-to-not-null ,
  • 检查参数 如果设置了--alter-foreign-keys-method='drop_swap',则 --no-swap-tables 和 --no-drop-old-table 需要被设置,不能交互表名 和 删除原表 。
  • 如果显示设置了 chunk-size的 值,则将 chunk-time 设置为0 ,不会在动态调整每次数据拷贝的块大小
  • 如果--no-swap-tables 和 --no-drop-triggers 被设置,则--no-drop-new-table 也许被设置
  • 参数 --no-drop-triggers 和 --preserve-triggers 不能一起使用
  • 必须设置 数据库 和 表名

Connect to MySQL.

连接到MySQL

check-foreign-keys 如果没有设置 则 SET foreign_key_checks=0

检查MySQL版本 是否大于 5.0.10,虽然5.0.2 支持了触发器,但是到 5.0.10 之前,触发器不能包含按名称对表的直接引用

检查参数 analyze-before-swap 是否必要

Create --plugin.

Setup lag and load monitors.

设置检查的从库延迟 与负载监控

Check for replication filters.

检查复制的过滤规则

Print --tries.

一些操作的重试次数 和 间隔。

Operation, tries, wait:analyze_table, 10, 1copy_rows, 10, 0.25create_triggers, 10, 1drop_triggers, 10, 1swap_tables, 10, 1update_foreign_keys, 10, 1

Get child tables of the original table, if necessary.

Check the --alter statement.

检查变更语句

check and create PID file if user specified --pid.

Init the --plugin.

变更步骤 

Step 1: Create the new table.

创建中间表

中间表的表名 如果设置了参数 new-table-name,则新表名为 new-table-name。如果没有设置该参数,则为 _%T_new,%T为原表名。

如何创建中间表:

不能使用 CRATE TABLE LIKE ,因为他不会保留 外键约束。这里我们也需要重命名外键约束。这是因为外键约束内部存储的形式.,外键约束名字不能重复。如果不重命名外键约束,这个innodb 会抛出121错误,​

这段代码并不完美。 如果我们将约束重命名为 foo 到 _foo 并且 该表或另一个表中已经存在该名称的约束,我们仍然可能发生冲突。 但如果有该表上有多个 FK,很难知道是哪一个导致的错误。 我们应该生成随机/UUID FK 名称还是其他名称?

Creating new table...
CREATE TABLE `osc_test`.`_my_table_new` (`id` int(11) NOT NULL AUTO_INCREMENT,`first_name` varchar(50) DEFAULT NULL,`last_name` varchar(50) DEFAULT NULL,`job_title` varchar(100) DEFAULT NULL,`hire_date` date DEFAULT NULL,PRIMARY KEY (`id`)
) ENGINE=InnoDB DEFAULT CHARSET=utf8mb4
Created new table osc_test._my_table_new OK.

Step 2: Alter the new, empty table. This should be very quick, or die if the user specified a bad alter statement.

对中间表进行变更

Altering new table...
ALTER TABLE `osc_test`.`_my_table_new` add index idx_first_name(first_name);
Altered `osc_test`.`_my_table_new` OK.

Step 3: Create the triggers to capture changes on the original table and apply them to the new table.

创建触发器 捕获变化 应用到中间表上

2023-12-22T15:33:19 Creating triggers...
2023-12-22T15:33:19 Created triggers OK.
-- DELETE TRIGGER
CREATE TRIGGER `pt_osc_osc_test_my_table_del` AFTER DELETE ON `osc_test`.`my_table` FOR EACH ROW DELETE IGNORE FROM `osc_test`.`_my_table_new` WHERE `osc_test`.`_my_table_new`.`id` <=> OLD.`id`--UPDATE TRIGGER
CREATE TRIGGER `pt_osc_osc_test_my_table_upd` AFTER UPDATE ON `osc_test`.`my_table` FOR EACH ROW BEGIN DELETE IGNORE FROM `osc_test`.`_my_table_new` WHERE !(OLD.`id` <=> NEW.`id`) AND `osc_test`.`_my_table_new`.`id` <=> OLD.`id`;REPLACE INTO `osc_test`.`_my_table_new` (`id`, `first_name`, `last_name`, `job_title`, `hire_date`) VALUES (NEW.`id`, NEW.`first_name`, NEW.`last_name`, NEW.`job_title`, NEW.`hire_date`);END--INSERT TRIGGER
CREATE TRIGGER `pt_osc_osc_test_my_table_ins` AFTER INSERT ON `osc_test`.`my_table` FOR EACH ROW REPLACE INTO `osc_test`.`_my_table_new` (`id`, `first_name`, `last_name`, `job_title`, `hire_date`) VALUES (NEW.`id`, NEW.`first_name`, NEW.`last_name`, NEW.`job_title`, NEW.`hire_date`)

详细解读一下这三个触发器 

id是主键,每个id 唯一

DELETE TRIGGER 删除触发器

在原表 `osc_test`.`my_table` 某个id的数据被删除后, 会删除中间表`osc_test`.`_my_table_new`  中上id 与原表表相匹配的数据,因为使用DELETE IGNORE的语法,如果此时copy-data(全量数据拷贝)阶段还没有把该id的数据从原表拷贝到中间表,在中间表上执行DELETE IGNORE也不会报错。

中间表已经有该数据,即全量数据拷贝阶段已经把该数据拷贝到中间表,在原表删除后中间表的数据也会被删除。

中间表还没有该数据 ,也不用担心全量数据阶段会再把该数据拷贝到中间表,因为原表上已经被删除了呀。

UPDATE TRIGGER 更新触发器

当在osc_test.my_table表上执行UPDATE操作时,触发器会在每一行被更新之后执行。

如果原表上更新导致 主键ID发生了变化,则中间表上 先删除该ID的数据,然后在插入REPLACE INTO 

如果原表上更新导致 主键ID没有发生了变化,则在中间表直接 REPLACE INTO (忽略唯一性约束错误,会覆盖该ID的数据)

数据还没有同步到中间表,则会在中间表插入,等到全量数据同步的时候覆盖一次。

数据已经同步到中间表,则走上面的逻辑。

INSERT TRIGGER 插入触发器

当在osc_test.my_table表上执行INSERT操作时,触发器会在每一行被插入之后执行。

触发器的作用是将新插入的数据REPLACE INTO (插入或替换)osc_test._my_table_new表中,确保id唯一。

中间表已经有该数据,即全量数据拷贝阶段已经把该数据拷贝到中间表,在原表插入新数据后替换中间表的数据。

中间表还没有该数据 ,即全量数据拷贝阶段还没有把该数据拷贝到中间表,但是由于触发器存在,该中间表中已经存在该ID的数据,在全量复制数据期间会再次覆盖插入一次(INSERT LOW_PRIORITY IGNORE INTO ) 。

Step 4: Copy rows.

拷贝全表数据

分为两种情况 ,第一中情况为 ,一个chunk_size大于该表的行数,就不用对表进行分块;第二种,需要进行分块(chunking the table)。

如果表的数据量只有一个chunk,需要确保从库的数据量也只有个chunk。

对于空表 

INSERT LOW_PRIORITY IGNORE INTO  ,

LOCK IN SHARE MODE,加共享锁 , 查询一个chunk数据的时候不允许写,允许读,所以需要保证这个查询数据很短。

插入操作是对中间表进行,所以不会触发老表上的触发器,不用担心。

2023-12-22T15:33:19 Copying approximately 1 rows...
INSERT LOW_PRIORITY IGNORE INTO `osc_test`.`_my_table_new` (`id`, `first_name`, `last_name`, `job_title`, `hire_date`) SELECT `id`, `first_name`, `last_name`, `job_title`, `hire_date` FROM `osc_test`.`my_table` LOCK IN SHARE MODE /*pt-online-schema-change 140230 copy table*/
2023-12-22T15:33:19 Copied rows OK.

对于大表的该阶段步骤 

原文的注释和代码中用了 nibble , 原意是蚕食,感觉对大表来说比较形象,将大表分成小块同步到中间表 (“蚕食”)。

需要确保使用的是同一个分块索引。

获取每个chunk 的起始边界ID , 

 SELECT /*!40001 SQL_NO_CACHE */ `id` FROM `osc_test`.`mytable2` FORCE INDEX(`PRIMARY`) ORDER BY `id` LIMIT 1 /*first lower boundary*/

获取第一次chunk 的截止边界 ,第一次chunk 的大小和 chunk-size的值相同。因为chunk-size的默认值是1000,所以WHERE ((`id` >= '1')) ORDER BY `id`   LIMIT 999, 2; 获取到的ID是 1000

SELECT /*!40001 SQL_NO_CACHE */ `id` FROM `osc_test`.`mytable2` FORCE INDEX(`PRIMARY`) WHERE ((`id` >= '1')) ORDER BY `id` LIMIT 999, 2 /*next chunk boundary*/

查看 查询原表数据SQL的 执行计划 

EXPLAIN SELECT `id`,  `emp_id`, `ldap`, `name`  FROM `osc_test`.`mytable2` FORCE INDEX(`PRIMARY`) WHERE ((`id` >= '1')) AND ((`id` <= '1000')) LOCK IN SHARE MODE /*explain pt-online-schema-change 127495 copy nibble*/

然后进行实际的插入

INSERT LOW_PRIORITY IGNORE INTO `osc_test`.`_mytable2_new` (`id`,  `emp_id`, `ldap`, `name`) SELECT `id`,  `emp_id`, `ldap`, `name`  FROM `osc_test`.`mytable2` FORCE INDEX(`PRIMARY`) WHERE ((`id` >= '1')) AND ((`id` <= '1000')) LOCK IN SHARE MODE /*pt-online-schema-change 127495 copy nibble*/

查看SQL执行的警告 ,结束的时候可以作为参数--statistics  统计信息输出 

SHOW WARNINGS

查看活跃会话数,这个注释是 作为 --max_load 和  --load的默认参数,如果服务器超过

SHOW GLOBAL STATUS LIKE 'Threads_running'

继续取下一个chunk的边界 ,chunk-size的值是根据 rows/s (每秒处理的行数)自动调节的,这次就变成了每个chunk  7442。

 SELECT /*!40001 SQL_NO_CACHE */ `id` FROM `osc_test`.`mytable2` FORCE INDEX(`PRIMARY`) WHERE ((`id` >= '1001')) ORDER BY `id` LIMIT 7442, 2 /*next chunk boundary*/

一直循环该步骤 知道全表数据拷贝完成。

Step 5: Update foreign key constraints if there are child tables.

Step 6: Swap tables

该交换是原子性的 ,即两张表的rename语句是在同一个语句中,该语句执行很快,所以元数据锁的时间也会很短

2023-12-22T15:33:19 Analyzing new table...
2023-12-22T15:33:19 Swapping tables...
RENAME TABLE `osc_test`.`my_table` TO `osc_test`.`_my_table_old`, `osc_test`.`_my_table_new` TO `osc_test`.`my_table`
2023-12-22T15:33:19 Swapped original and new tables OK.

Step 7: Drop the old table.

删除原表

删除触发器

2023-12-22T15:33:19 Dropping old table...
DROP TABLE IF EXISTS `osc_test`.`_my_table_old`
2023-12-22T15:33:19 Dropped old table `osc_test`.`_my_table_old` OK.
2023-12-22T15:33:19 Dropping triggers...
DROP TRIGGER IF EXISTS `osc_test`.`pt_osc_osc_test_my_table_del`
DROP TRIGGER IF EXISTS `osc_test`.`pt_osc_osc_test_my_table_upd`
DROP TRIGGER IF EXISTS `osc_test`.`pt_osc_osc_test_my_table_ins`
2023-12-22T15:33:19 Dropped triggers OK.

变更完成

测试步骤

开启全量日志

开启日志后,所有SQL都会被记录到 ,便于我们结合源码理解原理。

set global general_log=on;

创建一张空表

这样变更过程中全量日志输出的内容会很少。

CREATE TABLE my_table (id INT AUTO_INCREMENT PRIMARY KEY,first_name VARCHAR(50),last_name VARCHAR(50),job_title VARCHAR(100),hire_date DATE
) ENGINE=InnoDB;

进行变更

pt-online-schema-change --user=root \
--socket='/home/storage/mysql/mysql_5306/run/mysql.sock' \
--port=5306  \D=osc_test,t=my_table \
--alter="add index idx_first_name(first_name);" \
--execute \
--charset=utf8 \
--statistics --print --progress=time,10 

输出的日志 

No slaves found.  See --recursion-method if host ehr-db-stage02.ys has slaves.
Not checking slave lag because no slaves were found and --check-slave-lag was not specified.
Operation, tries, wait:analyze_table, 10, 1copy_rows, 10, 0.25create_triggers, 10, 1drop_triggers, 10, 1swap_tables, 10, 1update_foreign_keys, 10, 1
Altering `osc_test`.`my_table`...
Creating new table...
CREATE TABLE `osc_test`.`_my_table_new` (`id` int(11) NOT NULL AUTO_INCREMENT,`first_name` varchar(50) DEFAULT NULL,`last_name` varchar(50) DEFAULT NULL,`job_title` varchar(100) DEFAULT NULL,`hire_date` date DEFAULT NULL,PRIMARY KEY (`id`)
) ENGINE=InnoDB DEFAULT CHARSET=utf8mb4
Created new table osc_test._my_table_new OK.
Altering new table...
ALTER TABLE `osc_test`.`_my_table_new` add index idx_first_name(first_name);
Altered `osc_test`.`_my_table_new` OK.
2023-12-22T15:33:19 Creating triggers...
2023-12-22T15:33:19 Created triggers OK.
2023-12-22T15:33:19 Copying approximately 1 rows...
INSERT LOW_PRIORITY IGNORE INTO `osc_test`.`_my_table_new` (`id`, `first_name`, `last_name`, `job_title`, `hire_date`) SELECT `id`, `first_name`, `last_name`, `job_title`, `hire_date` FROM `osc_test`.`my_table` LOCK IN SHARE MODE /*pt-online-schema-change 140230 copy table*/
2023-12-22T15:33:19 Copied rows OK.
2023-12-22T15:33:19 Analyzing new table...
2023-12-22T15:33:19 Swapping tables...
RENAME TABLE `osc_test`.`my_table` TO `osc_test`.`_my_table_old`, `osc_test`.`_my_table_new` TO `osc_test`.`my_table`
2023-12-22T15:33:19 Swapped original and new tables OK.
2023-12-22T15:33:19 Dropping old table...
DROP TABLE IF EXISTS `osc_test`.`_my_table_old`
2023-12-22T15:33:19 Dropped old table `osc_test`.`_my_table_old` OK.
2023-12-22T15:33:19 Dropping triggers...
DROP TRIGGER IF EXISTS `osc_test`.`pt_osc_osc_test_my_table_del`
DROP TRIGGER IF EXISTS `osc_test`.`pt_osc_osc_test_my_table_upd`
DROP TRIGGER IF EXISTS `osc_test`.`pt_osc_osc_test_my_table_ins`
2023-12-22T15:33:19 Dropped triggers OK.
# Event  Count
# ====== =====
# INSERT     1
Successfully altered `osc_test`.`my_table`.

输出日志分析 

官方文档:

pt-online-schema-change — Percona Toolkit Documentation

源码分析   重庆八怪

https://www.jianshu.com/p/ecec3d307ec0/

 

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.hqwc.cn/news/294548.html

如若内容造成侵权/违法违规/事实不符,请联系编程知识网进行投诉反馈email:809451989@qq.com,一经查实,立即删除!

相关文章

lv12 linux设备树、网卡驱动移植

目录 1 设备树 1.1概念 1.2 设备树文件 1.3 设备树语法 2 Linux内核驱动移植 2.1 步骤 3 实验八网卡驱动移植 3.1 在内核源码的顶层目录下执行如下命令&#xff0c;修改内核配置 3.2 在设备树中添加网卡的硬件信息 3.3 修改时钟相关配置&#xff08;忽略无用的时钟&…

ES-mapping

类似数据库中的表结构定义&#xff0c;主要作用如下 定义Index下的字段名( Field Name) 定义字段的类型&#xff0c;比如数值型、字符串型、布尔型等定义倒排索引相关的配置&#xff0c;比如是否索引、记录 position 等 index_options 用于控制倒排索记录的内容&#xff0c;有如…

新型智慧城市解决方案:PPT全文56页,附下载

关键词&#xff1a;智慧城市解决方案&#xff0c;智慧城市管理技术&#xff0c;智慧城市建设&#xff0c;数字城市建设 一、智慧城市宏观形势 1、政策支持&#xff1a;出台了一系列政策&#xff0c;鼓励和支持智慧城市的发展。这些政策为智慧城市的建设提供了政策保障和资金支…

Java LocalDateTime转Json报错处理

在项目中LocalDateTime 进行json转换时&#xff0c;抛出序列化异常&#xff0c;查找解决方案&#xff0c;记录下来&#xff0c;方便备查。 报错信息 Caused by: com.fasterxml.jackson.databind.exc.InvalidDefinitionException: Java 8 date/time type java.time.LocalDateT…

【Linux】权限篇(二)

权限目录 1. 前言2. 权限2.1 修改权限2.2 有无权限的对比2.3 另外一个修改权限的方法2.3.1 更改用户角色2.3.2 修改文件权限属性 3. 第一个属性列4. 目录权限5. 默认权限 1. 前言 在之前的一篇博客中分享了关于权限的一些知识&#xff0c;这次紧接上次的进行&#xff0c;有需要…

Javascript知识点锦集

【版权声明】未经博主同意&#xff0c;谢绝转载&#xff01;&#xff08;请尊重原创&#xff0c;博主保留追究权&#xff09; https://blog.csdn.net/m0_69908381/article/details/135165704 出自【进步*于辰的博客】 文章目录 1、其他知识点链接7、关于 false8、关于 null 与 …

【智能家电】东胜物联离在线语音方案为厨电企业赋能,实现厨房智能化控制

近年来&#xff0c;我国厨电市场蓬勃发展。据行业统计数据显示&#xff0c;至今年6月&#xff0c;市场规模已达356亿元&#xff0c;同比增长8.8%。随着数字科技、物联网和人工智能的兴起&#xff0c;厨电产品正在朝着更智能、多功能化的方向迅速发展。 为此厨电厂商正在积极布…

【设计模式】命令模式

其他系列文章导航 Java基础合集数据结构与算法合集 设计模式合集 多线程合集 分布式合集 ES合集 文章目录 其他系列文章导航 文章目录 前言 一、什么是命令模式&#xff1f; 二、命令模式的优点和应用场景 三、命令模式的要素和实现 3.1 命令 3.2 具体命令 3.3 接受者 …

Unity中Shader旋转矩阵(四维旋转矩阵)

文章目录 前言一、围绕X轴旋转1、可以使用上篇文章中&#xff0c;同样的方法推导得出围绕X轴旋转的点阵。2、求M~rotate~ 二、围绕Y轴旋转1、可以使用上篇文章中&#xff0c;同样的方法推导得出围绕Y轴旋转的点阵。2、求M~rotate~ 三、围绕Z轴旋转1、可以使用上篇文章中&#x…

华为设备文件系统基础

华为网络设备的配置文件和VRP系统文件都保存在物理存储介质中&#xff0c;所以文件系统是VRP正常运行的基础。只有掌握了对文件系统的基本操作&#xff0c;网络工程师才能对设备的配置文件和VRP系统文件进行高效的管理。 基本查询命令 VRP基于文件系统来管理设备上的文件和目录…

【模式识别】探秘判别奥秘:Fisher线性判别算法的解密与实战

​&#x1f308;个人主页&#xff1a;Sarapines Programmer&#x1f525; 系列专栏&#xff1a;《模式之谜 | 数据奇迹解码》⏰诗赋清音&#xff1a;云生高巅梦远游&#xff0c; 星光点缀碧海愁。 山川深邃情难晤&#xff0c; 剑气凌云志自修。 目录 &#x1f30c;1 初识模式识…

OpenCV-Python(19):Canny边缘检测

目录 学习目标 Canny 边缘检测原理 1.噪声抑制(噪声去除) 2.梯度计算 3.非极大值抑制 4.双阈值检测(滞后阈值) 5.边缘连接 Canny 边缘检测步骤 Canny 边缘检测的OpenCV实现 不同阈值的边缘检测效果 学习目标 了解Canny边缘检测的概念学习掌握函数cv2.Canny()的用法 …