【Kafka】Kafka生产者如何实现冥等的?

news/2025/3/29 16:33:57/文章来源:https://www.cnblogs.com/cmxb/p/18792650

Kafka的生产者在发送数据到broker,如果broker在收到消息后崩溃或者断开连接,导致生产者没有接收到成功响应,这时会触发重试机制,这种场景下回导致消息的重复。

冥等性

如果一个操作被执行多次,结果与执行一次相同,那么这个操作就是冥等的。

冥等生产者

冥等生产者的工作原理

  • 启用了冥等生产者,那么每条消息都将包含生产者的ID(PID)和序列号。信息将与目标的topic和分区组合在一起,用于唯一表示一条消息。
  • broker收到了之前已经收到的消息,那么将拒绝接收该消息,并且返回错误信息。生产者记录该错误,反应在指标中,但是不抛出异常,也不触发告警。

生产者故障时冥等是怎样的?

  • 生产者重启:当一个生产者发生故障时,我们通常会创建新的生产者来代替他——手动重启或者自动拉起等,这是生产者在连接borker时会生成生产者ID,每次初始化时,都会产生一个新的id,这意味着如果一个生产者发生故障后,重启后的生产者发送了一条旧生产者已经发送过的数据,那么broker无法检测到重复。

  • broker发生故障:当一个broker发生故障,控制器将会为首领副本在该broker上的分区重新选举首领。

    • 每次生成新消息时,首领副本会用最后5个序列号更新内存中生产者状态,跟随者副本在复制消息时,会将该信息更新到自己的内存,所以当跟随者成为新首领时,已经有了最新的序列号来验证新消息的生成。
    • broker发生崩溃,但是没有更新最后一个快照时,由于生产者ID和序列号也是Kafak消息格式的一部分,在进行故障恢复时,通过旧快照+分区最新日志,可以恢复生产者的状态,等故障恢复完成之后,一个新的快照就保存好了。
    • 不彻底的首领选举broker期望接收消息2后面就跟随的消息3,但是接收到了消息27,这时broker会抛出“乱序”的错误,如果使用了不带事务的冥等生产者,这个错误可能会被忽略。该场景下 有可能消息3-消息26发生了丢失,需要检查是否发生了不彻底的首领选举

冥等生产者的局限性

  • 仅能防止由生产者内部重试逻辑引起的消息重复。
  • 不能防止代码中重复发送逻辑,因为这种对于kafka来说是两个消息
  • 使用过程中建议使用生产者内置的重试机制,而不是在应用程序中自行进行重试。

使用冥等生产者

  • enable.idempotence:生产者配置设置该值为true,在acks=all的配置下,性能基本不会有差异
  • transactional.id:可选参数,主要用于事务

启用冥等性后生产者的变化

  • 生产者启动时会额外调用一个API来获取生产者ID
  • 每个消息批次中第一条消息包含生产者ID和序列号(批次中其他消息基于第一条消息递增)
  • broker会验证每一个生产者实例的序列号,保证没有重复消息
  • 每个分区的消息顺序都将得到保证。

总结

通过启用Kafka的冥等生产者,可以保证每条消息在分区中仅被写入一次,即使触发了生产者重试机制也不会导致消息重复。

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.hqwc.cn/news/906154.html

如若内容造成侵权/违法违规/事实不符,请联系编程知识网进行投诉反馈email:809451989@qq.com,一经查实,立即删除!

相关文章

ThreeJs-16智慧城市项目(重磅以及未来发展ai)

![GIF](https://img2023.cnblogs.com/blog/2680817/202503/2680817-20250303164902745-1619665311.gif)项目源码:https://gitee.com/hq8466/threecity-com 写在前面:很早就弄完了的,只是一直说挑个黄道吉日发上来,托了这么久也没选到什么节日,今天天气不错就发了吧,然后后…

什么是最小权限原则?

一、最小权限原则是什么? 随着网络威胁变得越来越复杂,对强大安全实践的需求在现代企业运营中已根深蒂固。组织致力于保护他们的数据,无论是添加额外的验证层、加密信息还是控制网络流量。最小权限原则 (PoLP) 就是这样一种安全实践,它已成为整个组织的基本实践,无论其性…

易基因:m5C RNA甲基化测序(m5C MeRIP-seq)

大家好,这里是专注表观组学十余年,领跑多组学科研服务的易基因。 m5C是RNA百余种修饰中研究较多的一种。m5C存在于tRNA上时,可以对翻译进行调节;存在于rRNA上时,可以对核糖体的生物合成进行质控;存在于mRNA上时,则可以影响mRNA的结构、稳定性及翻译过程。 m5C RNA修饰的…

压测实践案例

压测如何判断是依赖服务瓶颈 背景:优化网关代码,通过压测针对异常指标判断瓶颈 1.当发现响应曲线上升。2.简单方式使用另外一个接口轮询服务在冒尖的时候判断是否是服务异常 第一组 第二组第三组第四组

基于Python程序访问本地部署的DeepSeek和硅基流动DeepSeek API

基于Python程序访问本地部署的DeepSeek和硅基流动DeepSeek API前排提醒: 1. 本地通过Ollama部署DeepSeek,部署版本为 deepseek-r1:1.5b,若还未进行本地部署,可以参考博客Windows系统上使用Ollama本地部署DeepSeek 2. 线上API使用的是硅基流动(siliconflow)的DeepSeek API…

supOS蓝卓工业互联网与iNeuOS工业互联网操作系统对比

最近有一个企业正在调研工业互联网平台,其中调研的是supOS蓝卓工业互联网和iNeuOS工业互联网操作系统。让我们给出一个对比情况表,我们自己总结了一份,由于不太了解supOS,于是也问了deepseek。 最近有一个企业正在调研工业互联网平台,其中调研的是supOS蓝卓工业互联网和…

ASE2N50-ASEMI工业电源专用ASE2N50

ASE2N50-ASEMI工业电源专用ASE2N50编辑:ll ASE2N50-ASEMI工业电源专用ASE2N50 型号:ASE2N50 品牌:ASEMI 封装:TO-220F 批号:最新 最大漏源电流:2A 漏源击穿电压:500V RDS(ON)Max:5.0Ω 引脚数量:3 沟道类型:N沟道MOS管、中低压MOS管 漏电流:ua 特性:N沟道MOS管、…

Hack The Box-Cap靶机

该靶机通过信息收集拿到大致信息,利用IDOR访问控制缺陷漏洞获得目标流量包,通过流量分析获取到ftp流量包存在用户名密码,可以ftp登录/ssh登录拿到第一个flag,利用linpeas.sh内网收集工具得到python存在UID提权漏洞,查看ctfobins提权,在/root下发现第二个flag靶机信息一、…

安装使用抓包神器:Whistle

来到查看抓包请求的页面,可见显示十分的全面还能显示树状图,根据域名进行区分,功能十分强大!安装步骤1.安装Node 因为Whistle是基于Node实现的跨平台web调试代理工具,所以我们需要先去安装Node环境 Node.js (nodejs.org) 直接下载即可2.安装Whistle Node安装成功后,执行如…

PCIe 四种地址空间介绍

PCIe架构定义了4种地址空间:配置空间、Memory空间、IO空间和message空间。1. 配置空间 每个PCIe Function都有4KB的配置空间(Configuration Space)。前256 Bytes是和PCI兼容的配置空间,剩余的是PCIe扩展配置空间(Extended Configuration Space)。 PCIe配置空间如下图所示,地…

DeepSeek 0324版本 前端代码编写能力实测

deepseek发布了一个小版本的更新。这次web端的代码编写能力增强了。来看下我用最新的deepseekv3-0324版本生成的两个前端html程序。 第一个是公司年会自动抽奖程序。 第二个是7天 天气预报的卡片。 先看第一个程序的提示词: “帮我生成一个自动抽奖的html程序,输入人员名单后…