关于没有熔断降级导致服务重启问题

news/2025/2/11 15:47:07/文章来源:https://www.cnblogs.com/LQBlog/p/18200577

场景

1.k8s微服务触发重启

容器配置的健康检查采用actuator

curl 127.0.0.1:8080/actuator/health

2.容器重启钩子回调

curl -X POST http://127.0.0.1:8080/actuator/shutdown

最终原因是因为调用第三方服务，超时设置3秒，重试3次，三方服务挂起导致tomcat连接池占满,健康检查请求进不来

总结

反思当时

当时是用户反馈才发现

1.首先触发重启需要进行告警

2.关于监测还需要通过error日志激增来进行告警，其实日志也有感知

3.调用其他服务还是需要熔断降级，增对高并发场景，我们设置超时时间就算设置1秒，也会导致请求挂起一秒，

上熔断降级，短期内大量异常，直接熔断,过时间再少量尝试，正常了再放开

经验总结

当出现大面积超时排查步骤

1.结合jvm的线程来看当前活跃线程数量,主要看几种线程状态的数量比如runable。

2.通过日志量看error是否激增，差异是啥

3.有链路追踪，可以结合链路追踪查看是否有大量耗时接口，和平均响应时间拉长,以及快速定位接口

4.结合数据库挂起的慢查询

线程状态误区

1.本质问题是线程占满了导致,后续服务恢复看线程数量饱和度还是较高如下图

2.原因是这个服务是个并发较高的接口线程池有几个核心参数核心线程数量最大线程数量线程队列回收时间

3.其实这里面大量的线程是TIme_Waiting的线程,如果是paring的非runable过程中等待的是正常的

还需要结合队列中的任务数量

1.正常的

这种表示非核心线程在poll的时候尝试拿任务,指定时间内拿不到就表示空闲，触发回收(可以研究一下这里源码)

2.挂起的

业务挂起的都能看出来run挂起的

本文来自互联网用户投稿，该文观点仅代表作者本人，不代表本站立场。本站仅提供信息存储空间服务，不拥有所有权，不承担相关法律责任。如若转载，请注明出处：http://www.hqwc.cn/news/708865.html

如若内容造成侵权/违法违规/事实不符，请联系编程知识网进行投诉反馈email:809451989@qq.com，一经查实，立即删除！

stm32 bootloader的app中断向量偏移设置，HAL库

如何设置Hal库的中断向量偏移看前几篇的 stm32f103c8t6 HAL库更改中断向量表（app部分） - 这一切足够了 - 博客园 (cnblogs.com)我这里bootloader的APP开始地址就是0x08006000，中断向量偏移0x00006000 设置完成之后编译mdk，将生成的bin文件使用ymodem写入0x08006000中这里设…

c语言程序实验————实验报告九

c语言程序实验————实验报告九实验项目名称：实验报告8 字符串处理函数实验项目类型：验证性实验日期：2024 年 5 月 16 日一、实验目的 1.掌握定义函数的方法 2.掌握函数调用、实参与形参的对应关系、参数的传递方式 3.掌握函数的嵌套调用和递归调用的方法 4.掌握全局变…

Flink精确消费一次

在大数据计算里面，计算引擎是处于承上启下的作用，对上承接数据源，对下承接各种各种数据库，比如mysql、oracle。对于任何数据计算来说要想精确消费一次，就需要支持事务或者幂等，我们最常见的支持事务的就是单点的oracle、mysql数据库，那么Flink作为分布式计算引擎，是如何…

电子传输系统安全-进展1

实验二电子传输系统安全-进展1 上周任务完成情况完成了上学期电子公文传输系统的重新调试通过部署了bouncycastle 学习了bouncycastle 将jar包添加到依赖项本周计划将上学期电子公文传输系统重新调试通过部署bouncycastle 学习bouncycastle 将jar包添加到依赖项参考链接Boun…

【日记】被零食有鸣的工作人员轰出来了……（544 字）

正文今天全在睡觉。早上睡到十点起床，下午又从三点睡到五点，我愿称之为睡觉仙人…… 这就是上班的副作用吗……下午同事一个电话打过来，决定不接。周末同事来电话，准没好事。结果她微信发消息问，要不要出去走走，一个人有点闷。我都惊了，头一回。我还以为又要我做啥事儿呢…

d3d12龙书阅读----绘制几何体（上）课后习题

d3d12龙书阅读----绘制几何体（上）课后习题练习1 完成相应的顶点结构体的输入-布局对象typedef struct D3D12_INPUT_ELEMENT_DESC{一个特定字符串将顶点结构体数组里面的顶点映射到顶点着色器的输入签名LPCSTR SemanticName;语义索引如果语义名相同的话使用索引进行区分UI…

SAP PS 打开关闭的项目

1 ）编辑-状态-关闭-撤销 2） TECO 撤销：）编辑-状态-技术完成-撤销

stm32f103c8t6使用bootloader进行ymodem下载和app程序测试，部分总结（暂未测试中断向量偏移问题）

bootloader程序部分（功能测试）print_boot_message();/* USER CODE END 2 *//* Infinite loop *//* USER CODE BEGIN WHILE */uint8_t key_get_state;while (1){/* USER CODE END WHILE *//* USER CODE BEGIN 3 */key_get_state = get_key();switch(key_get_state){case 1: //…

夸克自动签到转存到emby

夸克自动签到不同于之前的阿里盘内夸克签到脚本，这里可以自动转存管理文件，添加到emby中 b站视频地址：https://www.bilibili.com/video/BV1ry411a7Lt 一、准备你有服务器或者nas等等，有docker或者青龙都行。由于nas在家关机了，我在外地。就不演示推到emby了。来自于Cp0…

AI绘画拉取模型失败，DOS开启代理

我用了这么久的代理第一次知道DOS里面要开代理，惭愧惭愧。在我远程拉取模型的时候，挂科学也一直失败。在网上找报错找了很长时间没找到，最后经过一位群友的提示下，才知道问题出在DOS代理上面。直接看文章第一部分就行，要是直接tun不行，再看下面的直接开启tun这个是V2的开…

e语言文本换行问题

我帮这人重写了下本文来自博客园，作者：__username，转载请注明原文链接：https://www.cnblogs.com/code3/p/18200506

【Quant102】如何计算 N 日斜率

一元线性回归的斜率公式是： \[k = \frac{(x - \bar{x})^T (y - \bar{y})}{\|x - \bar{x}\|^2} \]由于斜率具有平移不变性，x通常取 0 到窗口大小减一。 def slope(df, close_col=close, slope_col=slope, window=5, inplace=True):if not inplace: df = df.copy()x = np.arang…

关于没有熔断降级导致服务重启问题

场景

总结

反思当时

经验总结

当出现大面积超时排查步骤

线程状态误区

相关文章