RocketMQ在基金大厂的分布式事务实践

news/2024/11/16 9:00:53/文章来源:https://www.cnblogs.com/JavaEdge/p/18383621

1 行业背景

基金公司核心业务主要分为:

  • 投研线业务,即投资管理和行业研究业务,体现基金公司核心竞争力
  • 市场线业务,即基金公司利用自身渠道和市场能力完成基金销售并做好客户服务

随互联网技术发展,基金销售渠道更加多元化,线上成为基金销售重要渠道。相比传统基金客户,线上渠道具有客户基数大,水平参差不齐的特点。对于那些还不成熟的客户,我们需要做好陪伴,让他们理解风险,理解投资。

2 RocketMQ 在陪伴体系中的应用

2.1 陪伴场景概述

基金建立了一套全方位多层次陪伴体系,从用户层面、市场层面和产品层面为用户提供投前、投中、投后的有温度的投资陪伴体验。

每个陪伴场景的达成,需要公司多个部门不同团队协同配合来完成。依赖与投研、合规、运营、大数据等上下游多个系统。

但这些系统采用不同技术架构,实现方式各异,若采用同步调用实现协同,耦合太高,不利扩展。

2.2 RocketMQ 解耦异构系统

RocketMQ 提供高效可靠的消息传递特性和发布订阅机制,非常适合用于这种上下游异构系统间的解耦。把原来基于文件、邮件的协作方式全部线上化、流程化和机制化,大大提升了陪伴输出效率。

对于这种涉及多方系统的协作,需要对消息进行合理地归类,以便进行过滤和索引。RocketMQ 提供的 Topic 和 Tags 就是用来做这事。

2.3 Topic 和 Tags 最佳实践

Topic 与 Tag 作为业务上用来归类的标识,分属一级分类、二级分类。这种层次化的分类标识与企业组织架构类似,可结合起来实现消息过滤。

对于陪伴系统的 Topic:

  • 运营系统订阅运营类消息,这类消息打 TagA 标签
  • 客服系统订阅客服类消息 TagB
  • 陪伴编排系统订阅编排类消息 TagC

合规系统需要对运营和陪伴消息进行合规审查,因此它需要订阅 TagA 和 TagC,最后是数据中心,所有的消息都要处理,因此它需要监听所有 Tag。

3 RocketMQ 事务消息的金融应用场景

3.1 金融场景概述

典型的金融场景 -- 优惠购。基金 APP 上申购基金可享受低至 0 折费率优惠,两种实现方式:

  • 先充值基金 app 钱包,底层是替客户购买了一笔货币基金,然后再用基金钱包购买目标基金。这种方式需用户操作两次,较繁琐,易引起客单流失
  • 优惠购,把两步购买基金封装成一次事务操作。对于投资者,开启优惠购服务后,操作少一步,投资更简单!

3.2 领域事件理论模型

领域事件指业务流程的一个步骤将导致进一步的业务操作,比如登录事件、基金购买事件。

领域模型里,领域事件事务采用最终一致性,弱一致性的一种。在领域模型映射到微服务系统架构时,微服务之间数据不必强一致,因此领域事件可解耦微服务。

依据是否跨微服务,可分为两种场景:

  • 当领域事件发生在同一微服务。由于大部分事件发生在同一进程内,自身可很好控制事务。但若一个事件需要同时更新多个聚合,按DDD中一次事务只更新一个聚合的原则,就要引入事件总线,即eventbus模式
  • 跨微服务。领域事件发生在微服务之间的场景较多,事件处理机制也更复杂。跨微服务的事件可推动业务流程或数据在不同子域或微服务间直接流转,因此需要一个协调者推进全局事务。跨微服务的事件机制要总体考虑事件构建、发布和订阅、事件数据持久化、MQ、分布式事务等,其中具备事务消息功能的MQ是该解决方案的核心组件

2.3 分布式事务方案对比

基金业务场景,需解决的问题是事务一致性与服务解耦度之间的矛盾,因此目标是让主从事务解耦,保证核心逻辑稳定,同时不因解耦而牺牲最终一致性。可选解决方案:

  • 最常见普通消息 + 异步对账。无法保证主事务的执行和入队同时成功,需要时效性低的对账补偿解决,一致性只是较高

  • 本地消息表,对比上一种做法,它由业务将写入消息表放到主事务中,把主事务和入队变成一个原子操作,然后业务读取入队记录,自己投递给从事务。缺点是主事务和消息表在存储上是耦合的

  • 引入 XA 事务,两阶段提交协议,实现难度较大。且面临两个问题:

    • 这是一种同步阻塞协议,有锁占用导致并发不会太高
    • XA 事务过程中,在参与者投赞成票后,若协调者故障,节点不清楚应该提交还是中止,只能等待协调者恢复。这时可能出现业务中断
  • TCC,专门处理分布式事务,只侧重于一致性,无解耦度,也不可行

  • 事务消息,兼顾解耦度和一致性,最合适

最终选择 RocketMQ 事务消息作为分布式事务解决方案:

编号 方案 解耦度 一致性 特性
1 普通消息+异步对账 较高 无法保证主事务的执行和入队同时成功,需要时效性低的对账补偿解决
2 本地消息表 较高 主事务和消息表在存储上是耦合的
3 XA(2PC) 阻塞式协议,强一致
4 TCC 业务侵入大
5 事务消息 解构主从事务,达到最终一致

4 RocketMQ 事务消息核心流程

基于 RocketMQ 的事务消息搭建事务中心,协调分布式事务的推进和回滚。

以优惠购为例的核心流程:

  • 第一阶段:Prepare 阶段 ,业务系统将 RocketMQ 的半消息发到事务中心,事务中心不做发布,等二次确认。该阶段Con端感知不到半消息
  • 第二阶段:业务系统执行主事务,即购买货币基金
  • 第三阶段:主事务成功后 commit 到事务中心,由事务中心投递消息到从事务。如果主事务失败,就投递 rollback 给事务中心。这里需要两阶段提交的原因是:普通的入队操作无论放在主事务之前还是之后都无法保证最终一致。如果先执行主事务,再入队,那么可能在入队前,业务会宕机,就没有机会再入队了。如果先入队再执行主事务,那么可能主事务没有执行成功,但是从事务执行成功了,业务逻辑就会发生错乱。
@startuml
participant 业务系统
participant 事务中心
participant 主事务
participant 从事务业务系统 -> 事务中心: Prepare
事务中心 --> 业务系统: OK事务中心 -> 主事务: 执行(购买货币基金)
主事务 --> 事务中心: Returnalt 主事务执行成功业务系统 -> 事务中心: Commit事务中心 --> 业务系统: OKloop  直到从事务执行成功事务中心 -> 从事务: 执行(购买目标基金)从事务 --> 事务中心: Returnend    
else 主事务执行失败业务系统 -> 事务中心: Rollback事务中心 --> 业务系统: OK
end@enduml

由于网络抖动等原因,可能导致事务消息的二次确认丢失。此时需依赖某种机制,恢复整个分布式事务的上下文,RocketMQ提供反查机制正是为解决分布式事务中的超时问题。

事务中心的反查机制流程

先检查事务中心的内部状态,再通过反查接口检查本地事务执行结果,恢复事务上下文后,正常推进后续的流程:

@startuml
participant 业务系统
participant 事务中心
participant 主事务
participant 从事务业务系统 -> 事务中心++: Prepare
事务中心 --> 业务系统--: OK业务系统 -> 主事务++: 执行(购买货币基金)
主事务 --> 业务系统--: Return业务系统 -> 业务系统:网络抖动事务中心 --> 业务系统++: 反查接口业务系统 -> 主事务++: 查询/执行事务
主事务 --> 业务系统--: Returnalt 主事务执行成功
业务系统 --> 事务中心++: Commit
end@enduml

5 RocketMQ咋保证事务消息在消费端正常消费

Con消费失败后,broker需要进行一定次数重试,需制定合理重试策略。

因为消费重试,就要求Con接口实现幂等性;若重试多次后仍失败,把消息压入死信队列DLQ,RocketMQ内置死信队列功能,对进入死信队列的消息进行告警处理。

  • 重试策略
  • 幂等
  • 死信队列
  • 告警
  • 业务介入

6 事务消息的适用场景

6.1 需同步执行的领域事件

若领域事件逻辑失败概率大,业务要及时将返回码告知客户端,自然不能放在异步流程。

如支付系统,支付扣款前要检查余额是否足够,若余额不足,异步流程中重试多少次都是失败。

6.2 事务不可重入场景

如业务系统发送消息时没有确定一个唯一事务ID,那后续业务逻辑就无法保证幂等。

假设其中一个事务是创建订单,若不能保证幂等,重试多次就产生多个订单;所以这里需要用到事务消息,明确一个分布式事务的开始,生成一个唯一事务 ID,让后续流程能以该事务 ID 保证幂等。

7 规划

支持事务消息的分布式消息队列,必然是数字化转型过程中的技术支柱,值得信赖!

目前,我们基于 RocketMQ 在客户陪伴体系上解耦了上下游的服务,提升了运营和陪伴的效率。同时,我们在 RocketMQ 事务消息的基础上,搭建了这样一个支持分布式事务的服务协调平台,也就是我们的事务中心,大大提升了对金融场景化的产品包装能力。未来,我们将围绕着事务中心,拓宽更多的金融应用场景,创造更大业务价值。

关注我,紧跟本系列专栏文章,咱们下篇再续!

作者简介:魔都架构师,多家大厂后端一线研发经验,在分布式系统设计、数据平台架构和AI应用开发等领域都有丰富实践经验。

各大技术社区头部专家博主。具有丰富的引领团队经验,深厚业务架构和解决方案的积累。

负责:

  • 中央/分销预订系统性能优化
  • 活动&券等营销中台建设
  • 交易平台及数据中台等架构和开发设计
  • 车联网核心平台-物联网连接平台、大数据平台架构设计及优化
  • LLM Agent应用开发
  • 区块链应用开发
  • 大数据开发挖掘经验
  • 推荐系统项目

目前主攻市级软件项目设计、构建服务全社会的应用系统。

参考:

  • 编程严选网

本文由博客一文多发平台 OpenWrite 发布!

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.hqwc.cn/news/788233.html

如若内容造成侵权/违法违规/事实不符,请联系编程知识网进行投诉反馈email:809451989@qq.com,一经查实,立即删除!

相关文章

从混乱到有序:10款建筑项目管理软件推荐

国内外主流的 10 款建筑企业项目管理系统对比:PingCode、Worktile、广联达、泛普软件、建文软件、Asana、Trello、Basecamp、Jira、Monday.com。在建筑行业,找到一个能够高效管理时间、成本和资源的项目管理系统常常是一项挑战。这种系统的选择不仅影响项目的流程和效率,还直…

begin-预览,不行啊还是太弱了

方便管理,主要是想熟悉下git的操作 先创建并且切换到一个新的分支: git commit --allow-empty -am "before starting PA1" git checkout -b PA1其中--allow-empty表示允许提交一个空的提交,git默认是不能提交一个空的提交信息,如果当前的文档没有什么修改,那么就…

nginx部署出现 Welcome to nginx! If you see this page 该如何解决

当你部署nginx的时候出现,ping域名网站可以通,但是访问不了网站怎么办,不用急,往下看; 1.问题所在其实出现以上的问题就代表你已经成功搭建好了nginx,只是现在默认访问的时候跳转到了nginx的首页问题。 2.解决方案 默认情况下,Nginx 安装后会使用默认配置文件,这些文件…

GLM-4-Flash 大模型API免费了,手把手构建“儿童绘本”应用实战(附源码)

GLM-4-Flash 大模型API免费了,我们本文基于免费API构建一个“儿童绘本”应用,包括使用文生图产出绘本故事插图……老牛同学刚刷到了一条劲爆的消息,GLM-4-Flash大模型推理 API 免费了:https://bigmodel.cn/pricing老牛同学一直觉得上次阿里云百炼平台为期 1 个月免费额度的…

CoreShop---.NET、Uni-App开发支持多平台的小程序商城系统

前言 小程序商城系统是当前备受追捧的开发领域,它可以为用户提供一个更加便捷、流畅、直观的购物体验,无需下载和安装,随时随地轻松使用。今天给大家推荐一个基于.NET、Uni-App开发支持多平台的小程序商城系统(该商城系统完整开源、无封装无加密、商用免费、支持二次开发、…

SQL server 特殊字符\u0000处理

某天,接到用户反馈点击某个项目分组的时候页面报错,点击其他项目不报错。初步以为是下标数字特殊符号导致的。通过前台输出对应的数值后发现该字段末尾有个“\u0000”特殊字符(ASCII字符char(0))。通常是导入数据时的格式问题或是程序处理时将页面中的换行字符保存数据库导…

Kettle: pentaho-server-ce-9.4 连接失败:ConnectionServiceImpl.ERROR_0009

pentaho-server-ce-9.4 数据库连接MYSQL8.0.37 , 测试连接失败, 提示: ConnectionServiceImpl.ERROR_0009-Connection to database [MYSQL8] failed .pentaho-server-ce-9.4 数据库连接MYSQL8.0.37 , 测试连接失败, 提示: ConnectionServiceImpl.ERROR_0009-Connection…

蓝桥杯补档

2013 省B P8597 翻硬币 H 一排硬币给出初态和终态,每次只能翻转相邻的两枚,求最少多少次 用贪心,因为翻转两次相当于没翻,所以最优方案中同一组硬币肯定最多翻转一次,所以翻转顺序无后效性。从前往后翻,只要不一样就把它和它后面的硬币都翻转一次,计数器累加2023 省A P9…

.NET周刊【8月第4期 2024-08-25】

国内文章 从控制台开始 关联 Win2D 和 WinUI 3 应用 https://www.cnblogs.com/lindexi/p/18378612 本文将告诉大家如何从最简单的控制台开始搭建,让 Win2D 和 WinUI 3 关联起来,让 Win2D 可以将内容渲染到 WinUI 3 应用上。 为何 Thread.Sleep 半毫秒和一毫秒等待时间差距如此…

注解的优点?元注解?

介绍 注解是JDK1.5版本开始引入的一个特性,用于对代码进行说明,可以对包、类、接口、字段、方法参数、局部变量等进行注解。主要作用如下:编写文档——通过注解中标识的元数据可以生成doc文档,这是最常见的,也是java 最早提供的注解。常用的有@param @return 等代码分析—…

【Azure Developer】如何在Azure门户上把当前账号下的所有资源信息列举并导出呢?

问题描述 是否可以在Azure上,一次性把当前账号所有能查看的资源都导出来呢?包含资源名称,类型,定价层SKU信息呢?问题解答 是的,通过Azure Resource Graph Explorer服务可以实现。Azure Resource Graph Explorer 是一个强大的工具,旨在提供跨订阅的资源查询和治理。它允许…