分库分表带来的这7大问题，一定要小心！-编程知识

分库分表带来的这7大问题，一定要小心！

news/2025/1/8 14:33:06/文章来源:https://www.cnblogs.com/12lisu/p/18657017

前言

分库分表是解决单库单表性能瓶颈的有效手段，但也会引入新的复杂性和技术挑战。

这篇文章跟大家一起聊聊，分库分表后带来的7个问题，以及相关的解决方案，希望对你会有所帮助。

(我最近开源了一个基于 SpringBoot+Vue+uniapp 的商城项目，欢迎访问和star。)[https://gitee.com/dvsusan/susan_mall]

1. 全局唯一 ID 问题

问题描述

在分库分表后，每张表的自增 ID 只在本表范围内唯一，但无法保证全局唯一。

例如：

订单表_1 的主键从 1 开始，订单表_2 的主键也从 1 开始。
在需要全局唯一 ID 的场景（如订单号、用户 ID）中会发生冲突。

解决方案

1.1 使用分布式 ID 生成器

代码示例：Snowflake 算法

public class SnowflakeIdGenerator {private final long epoch = 1622476800000L; // 自定义时间戳private final long workerIdBits = 5L; // 机器IDprivate final long datacenterIdBits = 5L; // 数据中心IDprivate final long sequenceBits = 12L; // 序列号private final long maxWorkerId = ~(-1L << workerIdBits);private final long maxDatacenterId = ~(-1L << datacenterIdBits);private final long sequenceMask = ~(-1L << sequenceBits);private long workerId;private long datacenterId;private long sequence = 0L;private long lastTimestamp = -1L;public SnowflakeIdGenerator(long workerId, long datacenterId) {if (workerId > maxWorkerId || workerId < 0) throw new IllegalArgumentException("Worker ID out of range");if (datacenterId > maxDatacenterId || datacenterId < 0) throw new IllegalArgumentException("Datacenter ID out of range");this.workerId = workerId;this.datacenterId = datacenterId;}public synchronized long nextId() {long timestamp = System.currentTimeMillis();if (timestamp < lastTimestamp) throw new RuntimeException("Clock moved backwards");if (timestamp == lastTimestamp) {sequence = (sequence + 1) & sequenceMask;if (sequence == 0) timestamp = waitNextMillis(lastTimestamp);} else sequence = 0L;lastTimestamp = timestamp;return ((timestamp - epoch) << (workerIdBits + datacenterIdBits + sequenceBits))| (datacenterId << (workerIdBits + sequenceBits))| (workerId << sequenceBits)| sequence;}private long waitNextMillis(long lastTimestamp) {long timestamp = System.currentTimeMillis();while (timestamp <= lastTimestamp) timestamp = System.currentTimeMillis();return timestamp;}
}

1.2 数据库号段分配

原理：维护一个独立的 global_id 表，分库按步长分配 ID：
- 库 1：ID 步长为 2，从 1 开始（1, 3, 5...）。
- 库 2：ID 步长为 2，从 2 开始（2, 4, 6...）。

示例

CREATE TABLE global_id (id INT PRIMARY KEY AUTO_INCREMENT,stub CHAR(1) NOT NULL UNIQUE
);
-- 步长设置：
SET @@auto_increment_increment = 2;
SET @@auto_increment_offset = 1;

2. 跨库跨表查询复杂性

问题描述

分库分表后，聚合查询（如总数统计、分页查询）需要跨多个分片表执行，增加了查询复杂度。

例如：

查询所有订单总数，需要跨 10 个订单表聚合。
按创建时间分页查询所有订单。

解决方案

2.1 使用中间件（推荐）

ShardingSphere 或 MyCAT：支持 SQL 分片执行和结果合并。
优点：业务代码无需修改，中间件完成分库分表逻辑。

2.2 手动分片查询

按分片逐一查询数据，在业务层合并结果。

示例代码：聚合查询

public int countAllOrders() {int total = 0;for (String db : List.of("db1", "db2", "db3")) {String sql = "SELECT COUNT(*) FROM " + db + ".orders";total += jdbcTemplate.queryForObject(sql, Integer.class);}return total;
}

示例代码：跨分片分页查询

public List<Order> paginateOrders(int page, int size) {List<Order> allOrders = new ArrayList<>();for (String table : List.of("orders_1", "orders_2")) {String sql = "SELECT * FROM " + table + " LIMIT 100";allOrders.addAll(jdbcTemplate.query(sql, new OrderRowMapper()));}allOrders.sort(Comparator.comparing(Order::getCreatedAt));return allOrders.stream().skip((page - 1) * size).limit(size).collect(Collectors.toList());
}

手动分片查询的方案，如果数据比较多，性能会比较差。

3. 分布式事务问题

问题描述

分布式事务（如订单表在库 A，库存表在库 B）无法使用单库事务，导致可能会出现数据的一致性问题。

解决方案

3.1 分布式事务框架

Seata：支持跨库的分布式事务。
示例代码：

@GlobalTransactional
public void createOrder(Order order) {orderService.saveOrder(order); // 写入库AstockService.reduceStock(order.getProductId()); // 更新库B
}

3.2 柔性事务

使用消息中间件实现最终一致性。
典型实现：RocketMQ 消息事务。

4. 分片键设计问题

问题描述

分片键选择不当可能导致数据倾斜（热点问题）或查询路由效率低。

解决方案

4.1 分片键设计原则

数据分布均匀：避免热点问题。
常用查询字段：尽量选高频查询字段。

4.2 路由表

维护全局路由表，映射分片键到分表。

示例代码：路由表查询

public String getTargetTable(int userId) {String sql = "SELECT table_name FROM routing_table WHERE user_id = ?";return jdbcTemplate.queryForObject(sql, new Object[]{userId}, String.class);
}

5. 数据迁移问题

问题描述

扩容（如从 4 个分片扩展到 8 个分片）时，旧数据需要迁移到新分片，迁移复杂且可能影响线上服务。

解决方案

5.1 双写策略

数据迁移期间，旧表和新表同时写入。
待迁移完成后，切换到新表。

5.2 增量同步

使用 Canal 监听 MySQL Binlog，将数据迁移到新分片。

示例：Canal 配置

canal.destinations:example:mysql:hostname: localhostport: 3306username: rootpassword: passwordkafka:servers: localhost:9092topic: example_topic

6. 分页查询问题

问题描述

分页查询需要从多个分片表合并数据，再统一分页，逻辑复杂度增加。

解决方案

各分片分页后合并：先按分片分页查询，业务层合并排序后分页。
中间件支持分页：如 ShardingSphere。

示例代码：跨分片分页

public List<Order> queryPagedOrders(int page, int size) {List<Order> results = new ArrayList<>();for (String table : List.of("orders_1", "orders_2")) {results.addAll(jdbcTemplate.query("SELECT * FROM " + table + " LIMIT 100", new OrderRowMapper()));}results.sort(Comparator.comparing(Order::getCreatedAt));return results.stream().skip((page - 1) * size).limit(size).collect(Collectors.toList());
}

但如果分的表太多，可能会有内存占用过多的问题，需要做好控制。

7. 运维复杂性

问题描述

分库分表后，运维难度增加：

数据库实例多，监控和备份复杂。
故障排查需要跨多个库。

解决方案

自动化运维平台：如阿里云 DMS。
监控工具：使用 Prometheus + Grafana 实现分片监控。

总结

分库分表本质上是“性能换复杂度”，它虽然能有效提升系统的性能和扩展性，但问题也随之而来。

分库分表后带来的问题总结如下：

问题	解决方案
全局唯一 ID	雪花算法、号段分配、Leaf
跨库跨表查询	中间件支持（如 ShardingSphere）或手动合并
分布式事务	分布式事务框架（Seata）、消息最终一致性
分片键设计问题	路由表或高效分片键
数据迁移问题	双写策略或增量同步（如 Canal）
分页查询问题	分片查询后合并排序
运维复杂性	自动化工具（DMS）、监控工具（Prometheus + Grafana）

应根据业务场景选择适合的分库分表策略，并通过工具和技术方案，解决由此带来的一些问题，最终实现系统的高性能与高可靠性。

最后说一句(求关注，别白嫖我)
如果这篇文章对您有所帮助，或者有所启发的话，帮忙关注一下我的同名公众号：苏三说技术，您的支持是我坚持写作最大的动力。

求一键三连：点赞、转发、在看。

关注公众号：【苏三说技术】，在公众号中回复：进大厂，可以免费获取我最近整理的10万字的面试宝典，好多小伙伴靠这个宝典拿到了多家大厂的offer。

本文来自互联网用户投稿，该文观点仅代表作者本人，不代表本站立场。本站仅提供信息存储空间服务，不拥有所有权，不承担相关法律责任。如若转载，请注明出处：http://www.hqwc.cn/news/865221.html

如若内容造成侵权/违法违规/事实不符，请联系编程知识网进行投诉反馈email:809451989@qq.com，一经查实，立即删除！

短剧拍摄中的高效协作：如何通过软件优化演员档期

一、短剧演员档期管理的挑战短剧演员的档期管理比起传统电视剧演员更加紧张和复杂。短剧的拍摄周期较短，通常要求在较短的时间内完成多个剧本的拍摄。而演员往往同时参与多个项目的拍摄，这使得他们的工作时间安排变得异常繁琐。除了剧组安排的拍摄时间，演员还需安排彩排、试…

DC-4 靶场通关小记

暴力破解、反弹shell、nc传输文件、hydra爆破账号、邮件信息收集、权限水平提升、teehee追加写/etc/passwd提权地址 https://www.vulnhub.com/entry/dc-4,313/1. 环境配置有其他兼容性问题参考 https://www.cnblogs.com/lrui1/p/18655388 2. 信息收集 fscan.exe -h 192.168.74…

如何解决超过1GB的文件压缩包上传失败的问题？

遇到超过1GB的文件压缩包上传失败的情况，通常可能是由于网络连接不稳定、FTP服务器配置限制或本地网络环境问题引起的。为了帮助您顺利解决问题，您可以按照以下步骤进行排查和处理：检查网络稳定性：首先，请确认您的网络连接是否稳定。由于上传大文件需要长时间保持稳定的网…

如何处理云服务器远程桌面访问问题

问题描述：用户报告无法通过Web界面访问云服务器的远程桌面，怀疑可能是VNC固定端口受到攻击或端口未开放导致的问题。用户希望了解如何解决远程桌面访问失败的问题。解决方案：确认远程桌面连接方式：确保您使用的远程桌面连接工具和协议正确无误。常见的远程桌面工具包括：…

SSL证书部署后仍无法正常访问网站怎么办？

问题描述：已经购买并上传了SSL证书到虚拟主机，但网站仍然无法通过HTTPS协议正常访问。如何排查和解决这一问题？解决方案：当您已经购买并上传了SSL证书到虚拟主机，但网站仍然无法通过HTTPS协议正常访问时，这可能是由于多个环节的问题所引起的。以下是详细的排查步骤和解…

如何解决远程登录问题

如果您遇到远程登录问题，可以按照以下步骤进行排查：检查SSH端口号：默认情况下，SSH端口号为22。如果您的服务器配置了非默认端口号（如22000），请确保使用正确的端口号进行连接。您可以通过命令行工具（如 ssh）指定端口号进行连接，例如：ssh user@server_ip -p 22000。防…

如何实现网站代码自动恢复修改

在网站开发和维护过程中，有时会不小心修改了重要的代码文件，导致网站出现问题。如何实现网站代码的自动恢复，以避免数据丢失？解决方案：使用版本控制系统：使用Git等版本控制系统来管理网站代码。版本控制系统可以帮助你跟踪每次修改的历史记录，方便回滚到之前的稳定版本…

如何高效地修改网站上的公司信息？

要高效地修改网站上的公司信息，请按照以下步骤操作：确定需要更新的内容：列出所有需要更新的公司信息项，如公司名称、地址、电话号码、邮箱地址等。查找相关文件：定位到包含这些信息的文件或数据库表。通常情况下，这类信息会出现在首页、关于我们页面、联系我们页面等位置…

灵活定制，掌握网站模板全面修改的方法

网站模板的全面修改可以帮助您打造独特的品牌形象和用户体验。以下是具体操作指南：修改内容方法页面布局在后台的“模板”或“外观”选项中，选择要修改的模板文件（如index.htm），直接编辑HTML结构。也可以使用可视化编辑器调整布局。内容模块进入“内容管理”模块，找到…

网站后台是否支持代码修改？

许多内容管理系统（CMS）提供了后台管理界面，用户可以通过这些界面进行内容更新和配置调整。但有时需要直接修改代码来实现特定功能或修复问题。解决方案：了解权限：首先确认您是否有足够的权限访问和修改代码。某些CMS可能限制了普通用户的代码编辑权限。使用开发者模式：…

问题1：MobaxTerm不能用ssh命令 1.1 症状 MobaxTerm版本：21.5用MobaXterm新建session去ssh正常。用MobaXterm手动ssh失败，提示➤ ssh root@172.1.1.5 /etc/ssh_config line 8: Bad SSH2 cipher spec aes128-ctr,aes192-ctr,aes256-ctr,arcfour256,arcfour128,aes256-gcm@ope…

如何安全有效地修改网站首页图片以提升视觉效果

问题描述如何在网站首页安全有效地修改图片，确保最终效果既美观又实用？回答内容修改网站首页图片是提升视觉效果和用户体验的重要步骤。以下是详细的指南，帮助您顺利完成这一任务：准备新的图片：确保新图片为常见的图像格式（如PNG、JPEG），并且尺寸适中，通常宽度为19…