打造专业开发者指南:针对ShardingProxy分库分表解决策略的深度剖析 – 详解部署、使用、服务治理与优化技巧

一、 ShardingProxy快速使用

        ShardingProxy的功能同样是分库分表,但是他是一个独立部署的服务端,提供 统一的数据库代理服务。注意,ShardingProxy目前只支持MySQL和PostgreSQL。并且,客户端连接ShardingProxy时,最好使用MySQL的JDBC客户 端。下面我们来部署一个ShardingProxy服务。

1、 ShardingProxy部署

        ShardingProxy在windows和Linux上提供了一套统一的部署发布包。我们可以 从ShardingSphere官网下载4.1.1版本的ShardingProxy发布包apache-shardingsphere-4.1.1-sharding-proxy-bin.tar.gz,解压到本地目录。配套资料中已经提供

  注意不要有中文路径

        首先,我们需要把MySQL的JDBC驱动包mysql-connector-java-8.0.20.jar手动 复制到ShardingProxy的lib目录下。ShardingProxy默认只附带了PostgreSQL的   JDBC驱动包,而不包含MySQL的JDBC驱动包。

        然后,我们需要到conf目录下,修改server.yaml,将配置文件中的 authentication和props两段配置的注释打开。

authentication:users:root:password: rootsharding:password: shardingauthorizedSchemas: sharding_dbprops:max.connections.size.per.query: 1acceptor.size: 16  # The default value is available processors count * 2.executor.size: 16  # Infinite by default.proxy.frontend.flush.threshold: 128  # The default value is 128. # LOCAL: Proxy will run with LOCAL transaction.# XA: Proxy will run with XA transaction.# BASE: Proxy will run with B.A.S.E transaction.proxy.transaction.type: LOCALproxy.opentracing.enabled: falseproxy.hint.enabled: falsequery.with.cipher.column: truesql.show: falseallow.range.query.with.inline.sharding: false

然后,我们修改conf目录下的config-sharding.yaml,这个配置文件就是shardingProxy关于分库分表部分的配置。整个配置和之前我们使用ShardingJDBC 时的配置大致相同,我们在最下面按照自己的数据库环境增加以下配置:

schemaName: sharding_db
dataSources:m1:url: jdbc:mysql://localhost:3306/userdb?serverTimezone=GMT%2B8&useSSL=falseusername: rootpassword: rootconnectionTimeoutMilliseconds: 30000idleTimeoutMilliseconds: 60000maxLifetimeMilliseconds: 1800000maxPoolSize: 50
shardingRule:tables:course:actualDataNodes: m1.course_$->{1..2}tableStrategy:inline:shardingColumn: cidalgorithmExpression: course_$->{cid%2+1}keyGenerator:type: SNOWFLAKEcolumn: cid

然后,还一个小问题要注意,我们进入ShardingProxyLib目录,里面会有些jar 包因为名字太长了,导致有些文件的后缀被截断了,我们要手动把他们的文件后缀给修改过来。

        然后,我们就可以启动ShardingProxy的服务了。启动脚本在bin目录下。其中, windows 平台对应的脚本是start.bat,Linux平台对应的脚本是start.shstop.sh

        启动时,我们可以直接运行start.bat 脚本,这时候ShardingProxy 默认占用的  是3307端口。为了不跟我们之前搭建的多个MySQL 服务端口冲突,我们定制下启动 端口,改为3316端口。

  start.bat 3316

启动完成后,可以看到几行关键的日志标识服务启动成功了。

[INFO ] 10:46:53.930 [main] c.a.d.xa.XATransactionalResource - resource-1- m1: refreshed XAResource
[INFO ] 10:46:54.580 [main] ShardingSphere-metadata - Loading 1 logic tables ' meta data.
[INFO ] 10:46:54.717 [main] ShardingSphere-metadata - Loading 8 tables ' meta data.
[INFO ] 10:46:56.953 [nioEventLoopGroup-2-1]
i.n.handler.logging.LoggingHandler - [id: 0xc90e0eef] REGISTERED [INFO ] 10:46:56.958 [nioEventLoopGroup-2-1]
i.n.handler.logging.LoggingHandler - [id: 0xc90e0eef] BIND:
0.0.0.0/0.0.0.0:3316
[INFO ] 10:46:56.960 [nioEventLoopGroup-2-1]
i.n.handler.logging.LoggingHandler - [id: 0xc90e0eef,
L:/0:0:0:0:0:0:0:0:3316] ACTIVE

2、 ShardingProxy使用

这样,我们就可以像连接一个标准MySQL服务一样连接ShardingProxy了

D:\dev-hook\mysql-8.0.20-winx64\bin>mysql.exe -P3316 -uroot -p Enter password: ****
Welcome to the MySQL monitor.  Commands end with ; or \g.
Your MySQL connection id is 1
Server version: 8.0.20-Sharding-Proxy 4.1.0Copyright (c) 2000, 2020, Oracle and/or its affiliates. All rights reserved.Oracle is a registered trademark of Oracle Corporation and/or its affiliates. Other names may be trademarks of their respective
owners.Type 'help; ' or '\h ' for help. Type '\c ' to clear the current input statement.mysql> show databases;
+-------------+
| Database    |
+-------------+
| sharding_db |
+-------------+
1 row in set (0.03 sec)mysql> use sharding_db
Database changed
mysql> show tables;
+--------------------+
| Tables_in_coursedb |
+--------------------+
| course             |
| t_dict             |
+--------------------+
2 rows in set (0.16 sec)mysql> select * from course;
+--------------------+-------+---------+---------+
| cid                  | cname | user_id | cstatus |
+--------------------+-------+---------+---------+| 545730330389118976 | java | 545730330804355072 | java | 545730330842103808 | java | 545730330879852544 | java | 545730330917601280 | java	1001 | 1
1001 | 1
1001 | 1
1001 | 1
1001 | 1
+--------------------+-------+---------+---------+
5 rows in set (0.08 sec)

3、 ShardingProxy的服务治理

        从ShardingProxy的server.yaml中看到,ShardingProxy还支持非常多的服务治理功能。在server.yaml配置文件中的orchestration部分属性就演示了如何将 ShardingProxy注册到Zookeeper当中。

orchestration:orchestration_ds:orchestrationType: registry_center,config_center,distributed_lock_managerinstanceType: zookeeperserverLists: localhost:2181namespace: orchestrationprops:overwrite: falseretryIntervalMilliseconds: 500timeToLiveSeconds: 60maxRetries: 3operationTimeoutMilliseconds: 500

ShardingSphere在服务治理这一块主要有两个部分:

        一是数据接入以及弹性伸缩。简单理解就是把MySQL或者其他数据源的数据快速 迁移进ShardingSphere的分片库中。并且能够快速的对已有的ShardingShere分片 库进行扩容以及减配。这一块由ShardingSphere-scaling产品来提供支持。只是这  个功能在目前的4.1.1版本中,还处于Alpha测试阶段。

        另一方面,ShardingSphere支持将复杂的分库分表配置上传到统一的注册中心   中集中管理。目前支持的注册中心有Zookeeper和Etcd。而ShardingSphere也提   供了SPI扩展接口,可以快速接入Nacos、Apollo等注册中心。在ShardingProxy的 server.yaml中我们已经看到了这一部分的配置示例。

        另外,ShardingSphere针对他的这些生态功能,提供了一个ShardingSphere-    UI产品来提供页面支持。ShardingSphere-UI是针对整个ShardingSphere的一个简单有用的Web管理控制台。它用于帮助用户更简单的使用ShardingSphere的相关 功能。目前提供注册中心管理、动态配置管理、数据库编排管理等功能。

4、 Shardingproxy的其他功能

影子库

        这部分功能主要是用于进行压测的。通过给生产环境上的关键数据库表配置一个 影子库,就可以将写往生产环境的数据全部转为写入影子库中,而影子库通常会配 置成跟生产环境在同一个库,这样就可以在生产环境上直接进行压力测试,而不会影响生产环境的数据。

        在conf/config-shadow.yaml中有配置影子库的示例。其中最核心的就是下面的 shadowRule这一部分。

#shadowRule:
#  column: shadow
#  shadowMappings:
# 绑定shadow_ds为ds的影子库
#    ds: shadow_ds

数据加密

        在conf/config-encrypt.yaml中还演示了ShardingProxy的另一个功能,数据加  密。默认集成了AES对称加密和MD5加密。还可以通过SPI机制自行扩展更多的加密算法。

5、 ShardingProxy的SPI扩展

        上一部分提到了ShardingSphere保留了大量的SPI扩展接口,对主流程封闭、对 SPI开放。这在ShardingJDBC中还体现不出太大的作用,但是在ShardingProxy中 就能极大程度提高服务的灵活性了。

        在ShardingProxy中,只需要将自定义的扩展功能按照SPI机制的要求打成jar 包,就可以直接把jar包放入lib目录,然后就配置使用了。

        例如如果想要扩展一个新的主键生成策略,只需要自己开发一个主键生成类

package com.roy.shardingDemo.spiextention;import org.apache.shardingsphere.spi.keygen.ShardingKeyGenerator;import java.time.LocalDateTime;
import java.time.format.DateTimeFormatter;
import java.util.Properties;
import java.util.concurrent.atomic.AtomicLong;public final class MyKeyGenerator implements ShardingKeyGenerator {private AtomicLong atom = new AtomicLong(0);private Properties properties = new Properties();public synchronized Comparable<?> generateKey() {// 读取了一个自定义属性String prefix = properties.getProperty("mykey-offset", "100");LocalDateTime ldt = LocalDateTime.now();String timestampS = DateTimeFormatter.ofPattern("HHmmssSSS").format(ldt);return Long.parseLong("" + prefix + timestampS + atom.incrementAndGet());}// 扩展算法的类型public String getType() {return "MYKEY";}public Properties getProperties() {return this.properties;}public void setProperties(Properties properties) {this.properties = properties;}
}

        然后增加一个META-INF\ services\org.apache.shardingsphere.spi.keygen.ShardingKeyGenerator文 ,并在文件中写明自己的实现类。

        com.roy.shardingDemo.spiextention.MykeyGenerator将扩展类和这个SPI 服务文件一起打成jar包,就可以直接放到ShardingProxy lib 目录下。

mysql> select * from course;
+--------------------+-------+---------+---------+
| cid                  | cname | user_id | cstatus |
+--------------------+-------+---------+---------+|                222 | java2
| 545730330389118976 | java | 545730330804355072 | java | 545730330842103808 | java | 545730330879852544 | java | 545730330917601280 | java	1002 | 1
1001 | 1
1001 | 1
1001 | 1
1001 | 1
1001 | 1
+--------------------+-------+---------+---------+
6 rows in set (0.01 sec)mysql> insert into course(cname,user_id,cstatus) values ( 'java2 ',1002, '1 '); Query OK, 1 row affected (0.11 sec)mysql> insert into course(cname,user_id,cstatus) values ( 'java2 ',1003, '1 '); Query OK, 1 row affected (0.01 sec)mysql> select * from course;
+--------------------+-------+---------+---------+
| cid                  | cname | user_id | cstatus |
+--------------------+-------+---------+---------+|                222 | java2
|      1001509178012 | java2
| 545730330389118976 | java | 545730330804355072 | java | 545730330842103808 | java | 545730330879852544 | java | 545730330917601280 | java
|      1001509119631 | java2	1002 | 1
1003 | 1
1001 | 1
1001 | 1
1001 | 1
1001 | 1
1001 | 1
1002 | 1
+--------------------+-------+---------+---------+
8 rows in set (0.01 sec)

        从结果可以看到,插入的两条记录,自动生成的CID分别为1001509178012、1001509119631。这样我们就很快的完成了一个自定义的主键生成策略。

二、 ShardingSphere总结

        我们现在已经学完了ShardingSphere除了Sharding-SideCar以外的所有产品了,整个sharding + proxy的所有这些功能,本质上其实都只解决了一个问题,就 是单机数据库容量的问题。在软件层面对硬件资源进行管理,从而便于对数据库的横向扩展。

        但是,我们也要意识到他带来的很多问题。

        例如对业务的侵入大。业务系统写的SQL将不再是纯粹的能在服务器上运行的 SQL了,对大量跨维度的JOIN、聚合、子查询、排序等功能在业务上很难进行验证。这必然会弱化数据库的功能。

        并且,使用ShardingSphere管理后,数据库之间变成了结合非常紧密的依赖关 系,对整个集群的扩容也会带来相当大的难度。

        另外,ShardingSphere这种方式实际上将原本由业务管理SQL的工作方式,转化 成了由业务管理逻辑SQL,而运维管理实际SQL的混合工作模式,再加上一大堆服务的引入,整个服务运维的维护工作量以及工作难度也上升了非常多。

        当然,相信随着ShardingSphere后续版本的不断升级优化,这些问题都会得到 不同程度的改善。

三、 与其他相关产品的对比

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.hqwc.cn/news/317909.html

如若内容造成侵权/违法违规/事实不符,请联系编程知识网进行投诉反馈email:809451989@qq.com,一经查实,立即删除!

相关文章

Java反射机制和动态代理

反射和动态代理 反射前言获取class对象的方式反射获取构造方法反射获取成员变量反射获取成员方法实例 动态代理 反射 前言 什么是反射&#xff1f; 反射允许对成员变量&#xff0c;成员方法和构造方法的信息进行编程访问。 为什么用反射 / 反射的作用&#xff1f; 可以轻易地获…

图像分割-漫水填充法 floodFill (C#)

版权声明&#xff1a;本文为博主原创文章&#xff0c;转载请在显著位置标明本文出处以及作者网名&#xff0c;未经作者允许不得用于商业目的。 本文的VB版本请访问&#xff1a;图像分割-漫水填充法 floodFill-CSDN博客 FloodFill方法是一种图像处理算法&#xff0c;它的目的是…

【SpringBoot框架篇】34.使用Spring Retry完成任务的重试

文章目录 简要1.为什么需要重试&#xff1f;2.添加maven依赖3.使用Retryable注解实现重试4.基于RetryTemplate模板实现重试 简要 Spring实现了一套重试机制&#xff0c;功能简单实用。Spring Retry是从Spring Batch独立出来的一个功能&#xff0c;已经广泛应用于Spring Batch,…

哪些洗地机比较好?洗地机选购指南

随着社会生活水平的提高&#xff0c;人们对居家环境的卫生和清洁要求不断提升。家用洗地机作为一种先进的清洁工具&#xff0c;带来了许多便利和优势&#xff0c;特别是在解决一些特殊需求的家庭环境方面。 以下是一些家用洗地机的优势和适用场景&#xff1a; 1.高效清洁&…

Hive用户自定义函数之UDF开发

在进行大数据分析或者开发的时候&#xff0c;难免用到Hive进行数据查询分析&#xff0c;Hive内置很多函数&#xff0c;但是会有一部分需求需要自己开发&#xff0c;这个时候就需要自定义函数了&#xff0c;Hive的自定义函数开发非常方便&#xff0c;今天首先讲一下UDF的入门开发…

爬虫如何获取免费代理IP(二)

89ip代理爬取代码实现 一、代码实现 import requests import time import random from fake_useragent import UserAgent from lxml import etree import os import csv""" 89ip代理爬取 """class IPSipder(object):def __init__(self):self.u…

macbook电脑2024免费好用的系统清理优化软件CleanMyMac X4.14.7

CleanMyMac X2024来帮助你找到和删除不需要的文件。CleanMyMac X是一款专业的mac清理软件&#xff0c;它可以智能地扫描你的磁盘空间&#xff0c;找出并删除大型和旧文件&#xff0c;系统垃圾&#xff0c;iTunes垃圾&#xff0c;邮件附件&#xff0c;照片库垃圾等&#xff0c;让…

那些高级工程师才知道的只有几行代码却功能强大python自动化脚本,号称掌握这个python库让你工作效率变得比别人遥遥领先

那些高级工程师才知道的只有几行代码却功能强大python自动化脚本,号称掌握这个python库让你工作效率变得比别人遥遥领先。 如果你也厌倦了每天重复同样乏味的工作?Python,凭借它的简单和通用性,能够为你的问题提供最佳方案。 在本文中,我们将探索10个Python脚本,这些脚本…

数据结构学习 Jz48最长不含重复字符的子字符串

关键词&#xff1a;哈希表 动态规划 滑动窗口 用时&#xff1a;40min 哈希表 动态规划 题解&#xff1a;我觉得这个写的很好。 题目&#xff1a; 方法一&#xff1a; 哈希表 滑动窗口 思路&#xff1a; 我一开始没想到用一个左指针做滑动窗口。 哈希表&#xff1a;存之前…

七:Day06_redis高级01

第一章 Redis入门 1.1 节 什么是NoSql型数据库 NoSQL ,泛指非关系型的数据库, NoSQL Not Only SQL,它可以作为关系型数据库的良好补充。NoSQL 不依赖业务逻辑方式存储&#xff0c;而以简单的key-value模式存储。因此大大的增加了数据库的扩展能力。 SQLNoSQL数据结构结构化非…

P59 生成式对抗网络GAN-理论介绍 Theory behind GAN

Object Normal Distribution 的数据 经过 Generator 后生成分布更加复杂的PG. 真实数据的分布为 Pdata , 希望 PG和Pdata 越近越好 LOSS 是 两者之间的分布距离 问题: 如何计算 divergence? Sampling is goog enough Discriminator 希望V越大越好 y~Pdata 代表从 Pdata里…

zabbix离线安装 zabbix api批量添加主机

持续更新最新版本… 全自动安装方法 下载一键安装脚本 一键安装脚本执行命令全自动安装 tar -zxvf zabbix-rocky_8_zabbix_6.0.x_mysql.tar.gz cd zabbix-rocky_8_zabbix_6.0.x_mysql sh autosetup.sh installRocky8.9系统下载Rocky系统bug报告 手动安装方法 操作系统&…