基于seatunnel实现mysql同步clickhouse验证

场景:

需求想要实现mysql同步到clickhouse,seatunnel部署见前面文档linux环境seatunnel安装运行-CSDN博客。

官方说明文档

Clickhouse | Apache SeaTunnel

mysql同步配置

server-id=1
log_bin=/var/lib/mysql/bin.log
binlog_format=ROW
#binlog-do-db 具体要同步的数据库
binlog-do-db=gisqbpm
gtid-mode=on
enforce-gtid-consistency=on

验证MYSQL同步clckhouse

mysql数据库测试表

CREATE TABLE `test` (
  `id_` varchar(255) NOT NULL,
  `name` varchar(255) DEFAULT NULL,
  PRIMARY KEY (`id_`)
) ENGINE=InnoDB DEFAULT CHARSET=utf8mb4;

clikhouse库测试表

-- gisqbpm.test definition

CREATE TABLE gisqbpm.test
(

    `id_` String,

    `name` Nullable(String),

    `_sign` Int8 MATERIALIZED 1,

    `_version` UInt64 MATERIALIZED 1,

    INDEX _version _version TYPE minmax GRANULARITY 1
)
ENGINE = ReplacingMergeTree(_version)
ORDER BY tuple(id_)
SETTINGS index_granularity = 8192;

在config中创建mysqltoclickhouse.conf

touch  mysqltoclickhouse.conf配置如下

env {
        execution.parallelism = 1
        job.mode = "STREAMING"
        checkpoint.interval = 2000
}
source {
        MySQL-CDC {
                base-url = "jdbc:mysql://192.168.85.128:3307/gisqbpm"
                username = "root"
                password = "wxy123456"
                table-names = ["gisqbpm.test"]
   }
}

sink {
    Clickhouse {
                host = "192.168.85.128:8123"
                database = "gisqbpm"
                table = "test"
                username = "default"
                password = "wxy123456“
    }
}

验证一:INSERT

mysql添加一条数据

INSERT INTO `gisqbpm`.`test`(`id_`, `name`) VALUES ('1', '李淳风');

select * from gisqbpm.test;
 

在clickhouse中也同步添加一条数据

验证二:UPDATE

mysql修改一条数据

update  test set name='李淳风1' where id_='1';
select * from gisqbpm.test;

clickhouse显示如下,而是新增一个数据

验证三:DELETE

mysql删除一条数据

clickhouse发现是添加了一个数据

结论一:

这个是网上常见的案列,但都是往往写了一个添加操作就没了,奶奶个腿啊,这么多的坑竟然不说,妈的这放到生产环境不要气死人?同步时修改和删除变成添加和实际逻辑不一样。咨询了社区大佬,给我提供了一些意见,好吧那我就再验证一下

经过大佬点播,又看了一下官方文档确实有写,要通过主键去删除和更新!!!!

二:修改配置再次验证

env {
        execution.parallelism = 1
        job.mode = "STREAMING"
        checkpoint.interval = 2000
}
source {
        MySQL-CDC {
                base-url = "jdbc:mysql://192.168.85.128:3307/gisqbpm"
                username = "root"
                password = "wxy123456"
                table-names = ["gisqbpm.test"]
   }
}

sink {
    Clickhouse {
                host = "192.168.85.128:8123"
                database = "gisqbpm"
                table = "test"
                username = "default"
                password = "wxy123456"
                primary_key="id_"
                support_upsert=true
      }
}

验证一:INSERT

mysql插入一条数据

clickhouse也同步显示添加一条数据

验证二:DELETE

mysql删除一条数据

clickhouse也同步删除一条数据

验证三:UPDATE

mysql修改一条数据

clickhouse没有变化,服务此时也挂了

错误一:

错误如下 Caused by: org.apache.seatunnel.connectors.seatunnel.clickhouse.exception.ClickhouseConnectorException: ErrorCode:[COMMON-10], ErrorDescription:[Flush data operation that in sink connector failed] - Clickhouse execute batch statement error

重启后再次执行修改操作

mysql修改一条数据

clickhouse显示是新增一条数据

结论二:

这种方式同样也是不能完美解决同步问题,修改变成了添加,而且中途服务还挂了,稳定性也有风险。

三:修改配置再次验证

env {
        execution.parallelism = 1
        job.mode = "STREAMING"
        checkpoint.interval = 2000
}
source {
        MySQL-CDC {
                base-url = "jdbc:mysql://192.168.85.128:3307/gisqbpm"
                username = "root"
                password = "wxy123456"
                table-names = ["gisqbpm.test"]
   }
}

sink {
    Clickhouse {
                host = "192.168.85.128:8123"
                database = "gisqbpm"
                table = "test"
                username = "default"
                password = "wxy123456"
                primary_key="id_"
                support_upsert=true
                allow_experimental_lightweight_delete = true
    }
}
 

 这个是官方文档提供的配置测试一下

错误二:

Caused by: java.sql.BatchUpdateException: Code: 62. DB::Exception: Syntax error: failed at position 1 ('DELETE'): DELETE FROM "test" WHERE "id_" = '1' settings allow_experimental_lightweight_delete = true. Expected one of: Query, Query

结论三

经测试在mysql中添加一条数据,clickhouse也同步添加一条数据,但是mysql中通过主键修改一条数据,clickhouse变成添加一条数据,mysql删除一条数据,clickhosue直接报错且服务挂掉

总结: 

1.seatunel同步mysql到clickhouse中存在很大的问题,生产环境如果有修改和删除操作同步到clickhouse时趁早换方案!!!

2.从操作来看seatunel对全库同步的场景也不是很友好,我100张表那就要创建100个sink对应的表非常麻烦!!

3.MaterializeMySQL的方式都比这个靠谱,至少服务不会挂!!!

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.hqwc.cn/news/323615.html

如若内容造成侵权/违法违规/事实不符,请联系编程知识网进行投诉反馈email:809451989@qq.com,一经查实,立即删除!

相关文章

连接型CRM如何助力企业打造赋能型业务组织?

外部环境的不确定性,对日常的经营带来了更多的挑战。借用某为所说的,应对这种外部不确定性最好的办法就是加强组织能力的建设,其中,组织的赋能也再一次引起了关注。 尤其是传统的装备制造企业,重资产,多环…

GBASE南大通用数据库-GBase8a虚拟集群镜像技术

随着云计算和大数据技术的发展,虚拟集群环境下的数据同步和备份问题日益凸显。如何在保证数据一致性的同时,实现高效、可靠的数据管理?今天,我们为大家介绍一款强大且实用的技术——GBase8a虚拟集群镜像。 什么是虚拟集群镜像呢&a…

如何使用可视化管理工具DockerUI远程管理docker容器

文章目录 前言1. 安装部署DockerUI2. 安装cpolar内网穿透3. 配置DockerUI公网访问地址4. 公网远程访问DockerUI5. 固定DockerUI公网地址 前言 DockerUI是一个docker容器镜像的可视化图形化管理工具。DockerUI可以用来轻松构建、管理和维护docker环境。它是完全开源且免费的。基…

mariadb实现主从同步

准备两台服务器 Mariadb-Master:192.168.44.150 Mariadb-Backup:192.168.44.148 安装mariadb: https://blog.csdn.net/qq_50247813/article/details/135402502?spm1001.2014.3001.5502 组从复制原理如下 修改主数据库配置如下 vi /etc/my.…

铁塔基站数字化管理监测解决方案

截至2023年10月,我国5G基站总数达321.5万个,占全国通信基站总数的28.1%。然而,随着5G基站数量的快速增长,基站的能耗问题也逐渐日益凸显,基站的用电给运营商带来了巨大的电费开支压力,降低5G基站的能耗成为…

用好几年了!这个好用的伦敦金交易信号介绍给大家

本文将要介绍一个以K线形态为主的交易信号,它是一个做空的信号,名字叫做看跌吞没。当市场上涨的过程中碰到看跌吞没,后市很可能会下跌。如果结合具体的趋势和交易背景分析,可能还可以抓住市场的转折点,下面我们就来讨论…

Spring国际化的应用及原理详解

1. 简介 Spring国际化(Spring Internationalization,简称i18n)是Spring框架提供的一种机制,用于支持多语言的应用程序。它使得开发者能够轻松地在应用程序中实现不同语言的支持,从而满足全球化的需求。通过Spring国际…

开源可视化表单优点多,靠它进入流程化办公!

最近有很多粉丝在询问开源可视化表单。众所周知,现在流程化办公和数字化转型已经成为发展潮流了,如果还采用传统的表格制作,显然已经满足不了业务量越来越多的办公需求了。开源可视化表单优点多,进入高效优质的流程化办公&#xf…

【2023中国汽车年出口量赶超日本,让世界见证中国力量,LT9211-车载显示器专家】

据中国汽车工业协会(以下称“中汽协”)发布的数据显示,今年1-11月中国乘用车和商用车出口分别同比增长65.1%与29.8%,总体汽车出口量同比增长超过50%,达到441.2万辆。 日本媒体判断,中国汽车2023年出口量将超…

网络割接为什么经常是半夜进行?

你们好,我的网工朋友。 假设你最近遇到了一个客户,客户有个新的园区刚刚建成,园区内包括建筑物若干,地理覆盖面也较广,园区建成后,肯定是需要一个专用网络的,用于承载公司的业务流量。 这时候&…

图形阴影面积-第11届蓝桥杯省赛Python真题精选

[导读]:超平老师的Scratch蓝桥杯真题解读系列在推出之后,受到了广大老师和家长的好评,非常感谢各位的认可和厚爱。作为回馈,超平老师计划推出《Python蓝桥杯真题解析100讲》,这是解读系列的第28讲。 图形阴影面积&…

c# windows10大小端试

测试代码: unsafe public void ceshi() {byte[] by BitConverter.GetBytes(0x12345678);Debug.WriteLine(" byte[0] 0x" by[0].ToString("x2"));Debug.WriteLine(" byte[1] 0x" by[1].ToString("x2"));Debug.WriteLi…