分布式数据库TDSQL搭建

news/2025/3/17 5:56:06/文章来源:https://www.cnblogs.com/xiaobaijin/p/18503795

TDSQL介绍

TDSQL是腾讯基于MySQL/Mariadb社区版本打造的一款金融级分布式数据库集群方案，目前腾讯主推TDSQL MySQL版。

TDSQL MySQL版具备强一致高可用、全球部署架构、分布式水平扩展、高性能、企业级安全等特性，同时提供智能 DBA、自动化运营、监控告警等配套设施，为客户提供完整的分布式数据库解决方案。

TDSQL MySQL 版是一款兼容MySQL协议的国产分布式数据库，很好的满足了金融业务场景中对数据库的高可用、高可靠、可运维和信创的要求，同时基于MySQL和X86的软硬件平台，也能极大的降低数据库层面的IT成本，从而极大降低户均成本，非常适用互联网时代的新一代银行架构。

架构介绍

我们可以从请求处理和集群管理两个维度来理解TDSQL的架构。

请求处理

TDSQL请求通过应用层发出，经过负载均衡模块，转发到Proxy集群；Proxy收到请求后，进行请求解析，然后转发到set单元内的数据库实例节点上（写请求到master，读请求可以到master或slave）；数据库实例处理好请求后，回包给Proxy集群，Proxy再通过负载均衡模块回包给应用层。

如下图1所示：

1704866992317

图1 TDSQL架构模型与SET模型

集群管理

TDSQL的一个管理单元称为一个set，每个set单元的每个数据库实例上，都会部署一个TDSQL Agent模块。Agent模块会收集所在数据库实例的所有监控信息（包括节点主备角色信息/节点存活状态/请求量/TPS/CPU负载/IO负载/慢查询/连接数/容量使用率等等），上报到ZooKeeper集群；ZooKeeper相当于整个TDSQL集群元数据存储管理中心，保存了集群所有元数据信息；TDSQL Scheduler模块会监控ZooKeeper的所存储的上报信息，并根据集群状态启动不同的调度任务，相当于TDSQL集群的大脑，负责整个集群的管理和调度。

DBA管理人员可通过赤兔管理平台实现数据库的管理工作，功能如下图2所示：

1668412223074

图2 赤兔管理平台

主备同步与主备切换

主备同步

1）同步原理

主备同步需要依赖GTID（Global transaction identifiers，事物ID），同步的过程

备机和主机建立同步时，备机将自己的gtidlist发送给主机，主机根据gtidlist扫描自己的Binlog文件，发现备机需要同步的位置；如果找不到同步的位置点，会通知拉取镜像，拉取加载完成后，再根据binlog同步点和主机建立同步连接。

2）强同步机制

TDSQL基于MySql的binlog的半同步复制机制，进行了优化，增加了强同步复制机制。

对于进入集群的每笔更新操作，都将发到对应Set的主机上，主机会将Binlog发往备机，且收到其中任意一个备机ACK后，然后才本地提交，并返回给客户端应答，这就能确保数据令丢失。

主备切换

基于TDSQL Agent和Scheduler等模块，实现了自动化的主备强一致切换，在30秒内可以完成整个主备切换流程，实现故障的秒级恢复。

在TDSQL数据库中，强一致性是必须保证的，意思就是节点可以拒绝提供服务，但不能提供错误的服务，主备切换的前提是需要保证数据的一致性。

自动扩容机制

TDSQL引入集群机制，实现了自动的容量伸缩，确保在业务访问量飙升的时候，整个集群可以自动扩容提供对外访问，这种扩容应该是动摇的，对业务应该完全透明，无需业务停机。

TDSQL有两个分支版本，一个是NO-Sharding(非分布式)版本，一个是Group-Sharding(分布式）版本，NS版本不支持自动扩容(一个Set)，GS版本支持自动扩容(多个Set)，但是该版本不支持跨节点事物和join。目前开源化部署仅支持非分布式部署。

分布式事务本质上还是为了解决在分布式系统中数据一致性的问题。对于分布式数据库，存在存储副本以及数据库本身的分库分表等问题使得一个事物中存在着对不同节点的操作，这就是典型的分布式事务。TDSQL基于MySQL的XA实现了分布式事务机制，在性能损失较低的情况下保证了系统中数据的一致性。

常见的部署方案

同城单中心架构

这种架构一般用作测试、异地灾备的机房或者业务不能容忍跨数据中心访问带来的网络延迟。每个数据库示例采用三个节点的模式，主备机需要垮不同的机架，主机宕机后，TDSQL会在30S内完成自动的切换，业务基本无感知。

同城三中心架构

每个数据库实例采用三个节点的模式部署，分布在3个IDC。业务系统支持多活模式部署，每个IDC内的业务系统访问本IDC内LVS/TGW对应的虚拟IP，由其后端的Proxy模块将请求路由到正确的主备数据库节点。对于读写分离的请求优先访问本IDC的备机，任何一个数据库节点宕机时，TDSQL会在30S内完成自动切换，业务基本无感知。

两地三中心架构

这种架构是同城两个中心+异地中心，可以提供非常好的可用性和一致性，是TDSQL主要推荐的部署模式。每个数据库实例采用4-6个节点的模式，分布在3个IDC，业务系统支持多活模式的部署。

价格介绍

腾讯云价格：

够买时长	模式	数据库	配置	价格
1月	一主一备	Mysql 8.0	4 核 8GB 内存/500G	1176/元
1年	一主一备	Mysql 8.0	4 核 8GB 内存/500G	11712/元
1月	一主一备	TDSQL Mysql 8.0	高 IO 版 - 4 核 8GB 内存/500GB/2分片	2116/元
1年	一主一备	TDSQL Mysql 8.0	高 IO 版 - 4 核 8GB 内存/500GB/2分片	21083/元

部署过程

TDSQL 集群架构设计

组件	10.10.77.50	10.10.77.56	10.10.77.57	10.10.77.59	10.10.77.60	10.10.77.67
ZK		zk1	zk2	zk3
kafka		kafka1	kafka2	kafka3
scheduler		scheduler1	scheduler2
oss		oss1	oss2
chitu		chitu1	chitu2
monitor		monitor1	monitor2
db	db2			db1	db1	db2
proxy		proxy1	proxy2	proxy3
lvs	lvs2			lvs1	lvs1	lvs2
hdfs	hdfs				hdfs
ansible	ansible
es	es
consumer	consumer