KAFKA监控一条龙:史上最强Kafka看板+监控配置与告警规则

news/2025/1/8 19:37:17/文章来源:https://www.cnblogs.com/starsliao/p/18522791

使用kafka_exporter监控多kafka

kafka_exporter项目地址:https://github.com/danielqsj/kafka_exporter

  • 使用docker-compose部署多个kafka_exporter,每个exporter对接一个kafka。
  • 注意:配置上每个kafka broker的地址,kafka3需要指定版本。
version: '3.1'
services:kafka-exporter-opslogs:image: bitnami/kafka-exporter:latestcommand:- '--kafka.server=10.2.19.43:9092'- '--kafka.server=10.2.24.62:9092'- '--kafka.server=10.5.98.190:9092'- '--kafka.version=3.2.1'restart: alwaysports:- 9310:9308kafka-exporter-prod:image: bitnami/kafka-exporter:latestcommand:- '--kafka.server=192.168.53.99:9092'- '--kafka.server=192.168.53.53:9092'- '--kafka.server=192.168.53.96:9092'restart: alwaysports:- 9311:9308

Promethus配置job接入kafka-exporter

  • 注意:每个kafka-exporter必须增加name标签,看板需要使用这个标签。
  - job_name: 'kafka-exporter'metrics_path: /metricsscrape_interval: 15sscrape_timeout: 10sstatic_configs:- targets:- 10.0.0.26:9310labels:name: kafka-opslogs- targets:- 10.0.0.26:9311labels:name: kafka-prod

KAFKA Grafana Dashboard

【中文版本】2024.05.16更新,基于Prometheus的kafka_exporter,KAFKA资源展示、问题排查、快速积压分析!
  • 看板的所有Panel支持最新样式,优化展示性能,已兼容Grafana10.X版本.
  • 包括KAFKA整体的资源状态,
  • 生产者与消费者关系
  • 消息积压的明细信息
  • 生产与消费的速率
  • 异常的消费与Topic展示
  • 分区级别的积压与消费明细

截图

  • 全局信息、消费者与Topic、异常与积压分析
  • 分区维度明细

看板下载

  • Grafana看板ID:21078
  • Grafana看板地址:https://grafana.com/grafana/dashboards/21078
  • 项目仓库:https://github.com/starsliao/Prometheus/kafka

Prometheus告警规则

- name: kafkarules:- alert: KAFKA_brokers异常expr: kafka_broker_info != 1for: 2mlabels:severity: criticalannotations:description: "{{ $labels.name }}当前brokers异常:{{ $labels.address }}"- alert: 电商生产KAFKA消息整体积压expr: sum(kafka_consumergroup_lag_sum{job="kafka-exporter"}) by (name,consumergroup, topic)>5000for: 2mlabels:severity: criticalannotations:description: "【环境】{{ $labels.name }}\n【消费组】{{ $labels.consumergroup }}\n【topic】{{ $labels.topic }}【积压】:{{ $value | printf \"%.2f\" }}"- alert: 电商生产KAFKA消息分区积压expr: (sum(kafka_consumergroup_lag{job="kafka-exporter"}) by (name,consumergroup, topic, partition)>1500) AND ON() (hour()+8)%24 >= 7 <= 21for: 3mlabels:severity: criticalannotations:description: "【环境】{{ $labels.name }}\n【消费组】{{ $labels.consumergroup }}\n【topic】{{$labels.topic}}【分区】{{ $labels.partition }}【积压】:{{ $value | printf \"%.2f\" }}"- alert: 电商生产KAFKA分区数过多expr: sum by(name)(kafka_topic_partitions{job="kafka-exporter",topic !~"__.*"})>1500for: 2mlabels:severity: criticalannotations:description: "{{ $labels.name }}当前分区数:{{ $value | printf \"%.2f\" }}"- alert: 电商生产KAFKA_brokers丢失expr: kafka_brokers{job="kafka-exporter"} < 3for: 2mlabels:severity: criticalannotations:description: "{{ $labels.name }}当前brokers数:{{ $value | printf \"%.2f\" }}"- alert: 电商生产KAFKA_TopicsReplicasexpr: sum(kafka_topic_partition_in_sync_replica{job="kafka-exporter"}) by (name,topic) <1for: 2mlabels:severity: criticalannotations:description: "{{ $labels.name }} Kafka topic in-sync partition:{{ $value | printf \"%.2f\" }}"

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.hqwc.cn/news/825996.html

如若内容造成侵权/违法违规/事实不符,请联系编程知识网进行投诉反馈email:809451989@qq.com,一经查实,立即删除!

相关文章

Kubernetes Grafana看板更新啦!

K8S Dashboard CN 20240513 StarsL.cn Grafana官方地址: https://grafana.com/grafana/dashboards/13105 Grafana看板ID: 13105 kubernetes资源全面展示!包含K8S整体资源总览、微服务资源明细、Pod资源明细及K8S网络带宽,优化重要指标展示。 更新说明 v20240513更新了看板的所…

是时候扔掉Prometheus了,VictoriaMetrics全家桶入门与K8S部署

架构部署文件 项目仓库:https://github.com/starsliao/VictoriaMetrics本次将会部署以下组件: cd monit/master && kubectl apply -f .master├── 0.vm-single.yaml├── 1.kube-state-metrics_v2.12.0.yaml├── 1.node-exporter.yaml├── 1.vmagent.yaml├──…

基于 Astro 与 Directus 的新时代 JAMStack 博客实践

最近投入了大量摸鱼时间重构博客。现在大概告一段落了,向大家介绍一下整体的技术选型和具体实现的简要思路。 TLDR:JAMStack 实践,使用最新最潮的前端元框架 Astro,魔改 Astro Paper 主题,搭配 Headless CMS Directus,直通对接思源笔记内容同步,自建 SeaweedFS 分布式文…

【CodeForces训练记录】Codeforces Round 984 (Div. 3)

训练情况赛后反思 A题最简单的题愣神了,浪费了几分钟,其他方面正常表现 A题 相邻的两个差绝对值不能出现除了 \(5\) 和 \(7\) 以外的,直接模拟即可。 #include <bits/stdc++.h> #define int long longusing namespace std;void solve(){int n; cin>>n;vector<…

高级语言程序设计第五次作业

没清楚题目的要求改了好几次只是单纯的把原来的程序改了一下,应该是没错,毕竟输出好几个都是对的用了条件选择才写出来,不知道有没有其他的办法打了好久的代码,感觉有点繁琐这题没啥太大问题这题也没啥问题 ![](https://img2024.cnblogs.com/blog/3525374/202411/3525374-2…

Ubuntu插入移动硬盘后提示Wrong fs type,bad option,bad superblock on /dev

没有被成功挂载导致的,打开 工具——磁盘500G是我的移动硬盘,点击设置——编辑挂载选项,关闭[用户会话默认值]后,确定即可。重新拔插移动硬盘即可。

解决zabbix图形化中文乱码问题

1. windows控制中心选择要替换的ttf的字体复制到单独目录。2. dnf install lrzsz #安装rz命令,方便快速上传字体文件 3. cd /usr/share/fonts/dejavu-sans-fonts/ #进入字体文件所在目录 4. rz -E #上传Windows上找到的ttf字体文件5. cp DejaVuSans.ttf DejaVuSans.ttf.back …

原教旨冯诺依曼到存算的距离

冯诺伊曼架构和存算不是对立的概念 从智能角度证明存算架构力度远远不够存算针对的是存储和计算关系,冯诺依曼架构针对的是程序和数据都要存储,二者重心不一样因此不是对立的概念。 如果按原教旨主义理解冯诺依曼架构,就要追溯到 《First Draft of a Report on the EDVAC[1]…

[MRCTF2020]你传你呢

题目链接:https://buuoj.cn/challenges#[MRCTF2020]你传你🐎呢 打开环境后如下所示。可以看到,这是一道文件上传题,直接对可上传的文件类型进行 fuzzing。通过 fuzzing 发现,可以上传 .jpg、.html、.htaccess 文件,PHP 相关的文件均无法上传。 因此,可以选择上传 .htac…

Deswing :图形化Java反序列化利用工具

原创 GSDK安全团队免责声明 工具仅供安全研究与学习之用,若将工具做其他用途,由使用者承担全部法律及连带责任,作者及发布者不承担任何法律及连带责任。信息及工具收集于互联网,真实性及安全性自测!!!项目地址 https://github.com/0ofo/Deswing项目介绍 这是一个Java反序…

【Linux安全】Shellcoding

原创 haidragon 安全狗的自我修养“面向安全专业人员的 Linux Shellcoding” 今天我们将学习 Linux Shellcoding 并学习实践知识。 shell代码 编写 shellcode 是了解有关汇编语言以及程序如何与操作系统交互的更多信息的好方法。 为什么红队成员和渗透测试人员编写 shellcode?…