线上应用cpu飙高排查记录

news/2024/12/4 22:56:28/文章来源:https://www.cnblogs.com/kobe-lin/p/18587442
  1. 背景:昨天下午4点多上线一个需求之后,发现服务整体rt由之前的1.x ms上涨到6~8ms,刚开始以为是增加了某些逻辑导致rt上涨,没放心上。结果晚上8点多下班路上,该服务就有2个pod开始告警,cpu使用率>=90%,慌得一匹,赶紧下了地铁就近打开热点吧问题pod删除了,同时扩容了一下机器。
  2. 到家后,发现整体pod的rt比下午上完线之后高了不少,而且每个pod的cpu都很高,一个批量接口上游调用方也在告警。

排查路径:

  • 挑一个rt最高的pod,登陆终端,使用top看看CPU 使用情况,了解哪些 Java 进程消耗了大量的CPU资源
  • 通过使用 jstack <pid> > thread_dump.txt 命令可以获取 Java 进程的线程 dump,并将其输出到文件中。在这个过程中,获取线程 dump 的确会对 CPU 产生一定的影响,但通常是暂时的和相对较小的(这里的<pid>替换为上一步top时看到的应用进程号);这样生成的thread_dump.txt是存放在当前路径下,可以通过curl -T thread_dump.txt https://dl.xxxx/xx/thread_dump.txt上传到相关文件服务器,方便下载下来分析
  • 分析thread_dump.txt文件时,着重关注runnable状态的线程都在处理什么业务,可以搜索com.xxx.user(自己公司项目包路径),这样可以快速定位哪里的代码在消化cpu,着重看重复出现的包路径下的那个方法,然后去看这个方法改动的代码逻辑,是不是有隐藏bug
  • 我是通过搜索com.xxx.user找到一个方法出现的频次很高,一看就是下午自己上线改动过的方法,对比之前逻辑,发现自己在该批量接口里面for循环每次都会去查询2个java本地缓存,主要是这里本地缓存是很大很大的对象,问题就出在这里,批量查询接口,疯狂查询大对象的本地缓存(这里的本地缓存除了对象大,还有序列化&反序列化),所以导致jvm内存、GC都大大增加,cpu开销也变大,慢慢拖垮服务,rt越来越高,直到报警
  • 上一步,是大概猜想,然后我对for循环逻辑进行改动,把本地缓存读取外移出去了,只调用1次,发布上线之后,发现cpu开销rt什么的都恢复到下午4点多之前的水平

总结:大对象&序列号、反序列化,在读取使用的时候,如果是批量场景,一定要注意!!!

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.hqwc.cn/news/846901.html

如若内容造成侵权/违法违规/事实不符,请联系编程知识网进行投诉反馈email:809451989@qq.com,一经查实,立即删除!

相关文章

研途无忧-beta冲刺

研途无忧-beta冲刺 一: alpha冲刺后项目还存在的问题及其探索思路和解决过程问题一:页面详情和加油站的数据同步问题 详细描述: 当前页面详情和加油站的数据同步功能尚未实现,包括点赞、收藏、评论和关注等功能。此外,发布帖子页面也尚未完善,需要进一步开发和优化。 探索…

75种K线基本形态

通过上一期的内容,我们已经了解了K线的绘制方法和关键因素,K线所包含的信息是极为丰富的,就以单根K线而言,一般上影线和阴线的实体表示股价的下压力量,下影线和阳线的实体则表示股价的上升力量。上影线和阴线实体比较长就说明股价下跌动量比较大,下影线和阳线实体较长则说…

我用了这款插件,工作效率大大提高啦~

备忘快贴 uTools 是一款呼之即来,即用即走的工具集软件。 备忘快贴是一款全新设计的备忘录 utools 插件,区别于手机自带的备忘录功能。传统的备忘录只是在需要时记录信息,而备忘快贴则不仅可以记录内容,还能轻松复制和粘贴,便于在多个场合使用。这款软件特别适合需要频繁编…

CDCL算法

1. CDCL伪代码 CDCL(CNF):副本 = CNF // 创建CNF的副本,不更改原CNFwhile true:while 副本含有单位子句:对副本使用单位传播;if 副本中含有取值为假的子句: // 发现冲突if 现在的决策层是0:return false; // 不能满足C = 子句学习(CNF, 副本) // 吸取教训根据C回到一个更早的决…

零基础快速入门软件测试

一、项目 1. 项目成员先简要了解一下软件项目组中所涉及的一些重要角色及关键词项目:软件研发项目,包括从前期项目预研、立项、组建项目团队、设计开发软件、测试调试、交付验收,以及软件运营等各项具体的工作 项目经理:软件项目的总负责人,既需要有广泛的计算机专业知识,…

全球气象数据ERA5的下载方法

本文介绍在ERA5气象数据的官方网站中,手动下载、Python代码自动批量下载逐小时、逐日与逐月的ERA5气象数据各类产品的快捷方法~本文介绍在ERA5气象数据的官方网站中,手动下载、Python代码自动批量下载逐小时、逐日与逐月的ERA5气象数据各类产品的快捷方法。ERA5(fifth gener…

高性能计算-NEON-图像旋转

1. 对512*512 png 四通道图像顺时针旋转90度 思路: 像素分块,对块内转置;再水平镜像。图像库使用 stb img 2. 代码 #include <stdio.h> #include <arm_neon.h>#include <stdlib.h> #define STB_IMAGE_IMPLEMENTATION #include "./stb/stb_image.h&quo…

使用自定义 MSBuild Task 阻止 git 的大文件提交

一个自定义 MSBuild Task 的实际案例NuGet Gallery | Jgrass.MSBuild.GitTask 前言 在 .NET 项目自定义 MSBuild Task 中提到,可以使用自定义 MSBuild Task 来实现自定义功能。 这里介绍实现的 git 提交大文件提交拦截功能。 引入 nuget 包之后,设置好要拦截的大小,内置的 L…

ElasticSearch学习笔记

ES7.x和ES8.x的学习笔记1.ElasticSearch概述 1.1 ElasticSearch是什么 Elaticsearch,简称为 ES,ES 是一个开源的高扩展的分布式全文搜索引擎,是整个Elastic Stack 技术栈的核心。它可以近乎实时的存储、检索数据;本身扩展性很好,可以扩展到上 百台服务器,处理PB级别的数…

不死的魔女与灾厄的少年

传闻......森林的深处里住着一位不死的魔女森林的深处,住着一位魔女。 她已经活了几十个世纪,每代王国的历史书籍中都有她的出现。 人们称她为: “不死的魔女” 寂静了百年的森林,在某一天,闯入了一个不速之客,他倒在了魔女的屋子前。 那是一个浑身染血的少年,不着片缕,…

地址冲突检测(DAD)

地址冲突检测(DAD) 目录地址冲突检测(DAD)一、前言二、免费ARP报文实验拓扑报文分析 一、前言 公网: public,互联网可以访问 ,地址必须唯一 私网:RFC1918隔离公网,安全复用 优点:地址段重叠使用 缺点:地址冲突 IPV6唯一本地地址 = IPV6私网地址,提供global id二、免…

2025年昆明理工大学MBA研究生招生人数

--昆工MBA考研、管理与经济学院、125100工商管理、125602项目管理、199管理类综合能力、F009 政治、F008政治+项目管理概论