7DGroup性能实施项目日记9

好多天没写实施日记了,这段时间,我也有些其他事情要做,因为前阵子答应了写些东西,所以这几天晚上弄到两三点,终于写完了五万字的东西交了差。

这一段时间是培训的课程关键内容,基本都是分析的关键环节。主要的分析思路仍然是RESAR性能分析七步法。
在这里插入图片描述

跟着这个思路把所有的接口都用基准场景分析一遍。
为了让环境中出现更多的可分析的问题。我们的学员们搭建了一套最原始的应用代码。在这套代码中,几乎每个接口都有性能问题。所以是一个练手的好项目。

像这样的情况:
在这里插入图片描述

比比皆是。当我们看到这样的情况时,需要的是一步步地判断出问题在哪里。

通常监控工具给出这样的红色警告时,也只能是知道大体哪个服务器出现了问题,但是这不足以让我们判断问题是什么。这是全局监控可以告诉我们的,而定向监控是让我们找到根本原因的,所以要进入这个机器去查看更细的数据。

top - 08:25:49 up 19 days, 23:37,  1 user,  load average: 6.93, 4.62, 2.51
Tasks: 242 total,   1 running, 241 sleeping,   0 stopped,   0 zombie
%Cpu0  : 41.2 us, 20.1 sy,  0.0 ni, 37.4 id,  0.0 wa,  0.0 hi,  1.4 si,  0.0 st
%Cpu1  : 31.5 us, 20.9 sy,  0.0 ni, 47.3 id,  0.0 wa,  0.0 hi,  0.3 si,  0.0 st
%Cpu2  : 39.7 us, 21.0 sy,  0.0 ni, 38.3 id,  0.0 wa,  0.0 hi,  1.0 si,  0.0 st
%Cpu3  : 30.4 us, 19.8 sy,  0.0 ni, 49.1 id,  0.0 wa,  0.0 hi,  0.7 si,  0.0 st
%Cpu4  : 39.7 us, 19.9 sy,  0.0 ni, 39.7 id,  0.0 wa,  0.0 hi,  0.7 si,  0.0 st
%Cpu5  : 30.0 us, 21.5 sy,  0.0 ni, 47.8 id,  0.0 wa,  0.0 hi,  0.7 si,  0.0 st
%Cpu6  : 41.0 us, 20.3 sy,  0.0 ni, 33.4 id,  0.0 wa,  0.0 hi,  5.2 si,  0.0 st
%Cpu7  : 34.6 us, 20.1 sy,  0.0 ni, 44.3 id,  0.3 wa,  0.0 hi,  0.7 si,  0.0 st
KiB Mem : 16265592 total,   309672 free, 12787200 used,  3168720 buff/cache
KiB Swap:        0 total,        0 free,        0 used.  2284988 avail MemPID USER      PR  NI    VIRT    RES    SHR S  %CPU %MEM     TIME+ COMMAND                                                                                                                                                                                                                                                   28352 root      20   0 9838.1m   1.9g   7640 S 219.6 12.3   1128:06 java4710 root      20   0 1874064  87764  10168 S 130.9  0.5 526:30.47 containerd                                                                                                                                                                                                                                                28060 root      20   0  712640   6992   3060 S  76.4  0.0  44:56.95 containerd-shim
13485 1001      20   0   17.4g 158408   4736 S  16.3  1.0 324:59.43 java                                                                                                                                                                                                                                                      10680 1001      20   0 6867304 984.6m   6852 S   7.3  6.2 170:32.20 java5909 root      20   0 2152364 109368  19292 S   7.0  0.7   1143:26 kubelet                                                                                                                                                                                                                                                   29009 root      20   0 8109832   1.1g  10068 S   5.3  7.3  89:34.59 java1450 root      10 -10  218072  33204   6148 S   4.0  0.2 690:11.54 AliYunDun                                                                                                                                                                                                                                                  6998 65534     20   0  719412  19852   4524 S   3.7  0.1 159:25.53 node_exporter7768 root      20   0 9850256 745992   4988 S   3.0  4.6 405:03.94 java
34870 root      20   0 1970232  31504  12380 S   3.0  0.2 170:16.71 calico-node
52779 root      20   0 9958104   1.0g   6092 S   3.0  6.5 428:17.16 java39 root      20   0       0      0      0 S   1.3  0.0   5:13.77 ksoftirqd/6
64520 root      20   0 9988776   1.4g   6056 S   1.0  9.1 105:13.75 java1 root      20   0   52812   3988   1528 S   0.7  0.0  43:10.60 systemd6739 1000      20   0 8258792 442808  10564 S   0.7  2.7  54:02.29 java
32870 1000      20   0 6536936   1.3g   9512 S   0.7  8.4 152:21.97 java
63323 root      20   0  162360   2536   1612 R   0.7  0.0   0:08.11 top
65164 1000      20   0 1503844 393800   6364 S   0.7  2.4  84:12.83 node```

看到这样的数据之后,还要进一步判断,如果sy cpu高,我通常是会去看cpu热点的。

Samples: 892K of event 'cpu-clock', 4000 Hz, Event count (approx.): 105440194773 lost: 0/0 drop: 19853/297525Children      Self  Shared Object                                                           Symbol
-   22.94%     1.93%  [kernel]                                                                [k] system_call                                                 ◆- 3.15% system_call                                                                                                                                        ▒- 2.20% sys_write                                                                                                                                       ▒- 2.08% vfs_write                                                                                                                                    ▒- 1.73% do_sync_write                                                                                                                             ▒- 1.54% pipe_write                                                                                                                             ▒
+   14.22%     0.00%  [kernel]                                                                [k] do_softirq                                                  ▒
+   14.13%     0.03%  perf                                                                    [.] ordered_events__flush                                       ▒
+   13.59%     0.02%  perf                                                                    [.] hist_entry_iter__add                                        ▒
+   13.51%     2.63%  [kernel]                                                                [k] __do_softirq                                                ▒
+   10.83%     0.23%  [kernel]                                                                [k] sys_write                                                   ▒
+   10.13%    10.13%  [kernel]                                                                [k] _raw_spin_unlock_irqrestore                                 ▒
+   10.00%     0.04%  containerd                                                              [.] github.com/containerd/containerd/pkg/cri/io.redirectLogs    ▒
+    9.90%     0.15%  [kernel]                                                                [k] vfs_write                                                   ▒
+    8.96%     0.26%  [kernel]                                                                [k] do_sync_write                                               ▒
+    8.29%     0.11%  containerd                                                              [.] github.com/containerd/containerd/pkg/cri/io.redirectLogs.fun▒
+    7.07%     0.87%  containerd                                                              [.] syscall.Syscall.abi0                                        ▒
+    6.67%     0.00%  perf-28352.map                                                          [.] 0x00007f0130289c06          

从热点上可以看出sy cpu消耗的原因。
当然也会看到这种情况。

top - 08:42:11 up 17:22,  1 user,  load average: 20.50, 7.99, 6.19
Tasks: 220 total,   2 running, 218 sleeping,   0 stopped,   0 zombie
%Cpu0  : 98.3 us,  0.3 sy,  0.0 ni,  1.3 id,  0.0 wa,  0.0 hi,  0.0 si,  0.0 st
%Cpu1  : 98.3 us,  0.7 sy,  0.0 ni,  0.7 id,  0.0 wa,  0.0 hi,  0.3 si,  0.0 st
%Cpu2  : 98.7 us,  0.7 sy,  0.0 ni,  0.7 id,  0.0 wa,  0.0 hi,  0.0 si,  0.0 st
%Cpu3  : 98.7 us,  0.7 sy,  0.0 ni,  0.7 id,  0.0 wa,  0.0 hi,  0.0 si,  0.0 st
%Cpu4  : 98.3 us,  0.7 sy,  0.0 ni,  0.7 id,  0.0 wa,  0.0 hi,  0.3 si,  0.0 st
%Cpu5  : 98.7 us,  0.7 sy,  0.0 ni,  0.7 id,  0.0 wa,  0.0 hi,  0.0 si,  0.0 st
%Cpu6  : 99.0 us,  0.3 sy,  0.0 ni,  0.0 id,  0.0 wa,  0.0 hi,  0.7 si,  0.0 st
%Cpu7  : 99.7 us,  0.3 sy,  0.0 ni,  0.0 id,  0.0 wa,  0.0 hi,  0.0 si,  0.0 st
KiB Mem : 16265592 total,   993540 free,  9788672 used,  5483380 buff/cache
KiB Swap:        0 total,        0 free,        0 used.  6088020 avail MemPID USER      PR  NI    VIRT    RES    SHR S  %CPU %MEM     TIME+ COMMAND6542 1001      20   0 5785516 630748  13244 S 758.9  3.9 360:15.02 mysqld
46631 1000      20   0 7060812   1.6g 213256 S  14.6 10.4 111:42.06 prometheus615 root      20   0 2785824 128860  37536 S   3.6  0.8  45:34.58 kubelet
37829 root      20   0 8075908   1.1g  22108 S   2.6  6.9  18:46.63 java
21909 1000      20   0 5398160   1.3g  23024 S   1.7  8.4   8:35.88 java969 root      20   0 2006656  98540  32740 S   1.3  0.6  17:11.97 containerd1216 root      10 -10  214852  40280  16460 S   1.3  0.2  29:20.38 AliYunDun
19233 1000      20   0 6206584   1.3g  23676 S   1.0  8.5   6:21.62 java
---ts=2022-11-08 00:36:02;thread_name=http-nio-8085-exec-25;id=117;is_daemon=true;priority=5;TCCL=org.springframework.boot.web.embedded.tomcat.TomcatEmbeddedWebappClassLoader@25567581`---[185.983454ms] com.dunshan.mall.portal.service.impl.OmsCartItemServiceImpl$$EnhancerBySpringCGLIB$$cd2e3e20:list()`---[99.99% 185.971347ms ] org.springframework.cglib.proxy.MethodInterceptor:intercept()`---[99.99% 185.952096ms ] com.dunshan.mall.portal.service.impl.OmsCartItemServiceImpl:list()+---[0.00% 0.003533ms ] com.dunshan.mall.model.OmsCartItemExample:<init>() #76+---[0.00% 0.003134ms ] com.dunshan.mall.model.OmsCartItemExample:createCriteria() #77+---[0.00% 0.004088ms ] com.dunshan.mall.model.OmsCartItemExample$Criteria:andDeleteStatusEqualTo() #77+---[0.00% 0.00294ms ] com.dunshan.mall.model.OmsCartItemExample$Criteria:andMemberIdEqualTo() #77`---[99.98% 185.905947ms ] com.dunshan.mall.mapper.OmsCartItemMapper:selectByExample() #78`---ts=2022-11-08 00:36:02;thread_name=http-nio-8085-exec-28;id=11a;is_daemon=true;priority=5;TCCL=org.springframework.boot.web.embedded.tomcat.TomcatEmbeddedWebappClassLoader@25567581`---[187.017573ms] com.dunshan.mall.portal.service.impl.OmsCartItemServiceImpl$$EnhancerBySpringCGLIB$$cd2e3e20:list()`---[99.99% 187.004684ms ] org.springframework.cglib.proxy.MethodInterceptor:intercept()`---[99.99% 186.988005ms ] com.dunshan.mall.portal.service.impl.OmsCartItemServiceImpl:list()+---[0.00% 0.004173ms ] com.dunshan.mall.model.OmsCartItemExample:<init>() #76+---[0.00% 0.00325ms ] com.dunshan.mall.model.OmsCartItemExample:createCriteria() #77+---[0.00% 0.003512ms ] com.dunshan.mall.model.OmsCartItemExample$Criteria:andDeleteStatusEqualTo() #77+---[0.00% 0.003019ms ] com.dunshan.mall.model.OmsCartItemExample$Criteria:andMemberIdEqualTo() #77`---[99.98% 186.945735ms ] com.dunshan.mall.mapper.OmsCartItemMapper:selectByExample() #78

在这样的分析过程中,可以看到io问题、sql问题、代码逻辑问题等等。例子太过,不一而足。

而我们的要做的就是一步步的找到这些问题,并给出优化方案,像上面的例子中,我们要把sql和io的问题解决,解决的方式要根据瓶颈的原因来提出解决方案。像记日志、加索引、平衡资源等手段也都是要上的。

最终我们希望看到的是这样的情况。
在这里插入图片描述

其实瓶颈的解决通常都是不难的,难的是怎么快速判断出瓶颈在哪里。
tps的提升是性能要解决的瓶颈类型中的一种,还有这种。
在这里插入图片描述

tps并不低,但是会掉下来。在这个例子中,因为缓存的节点的问题,导致缓存失效,当缓存节点在其他节点自动重建时,tps就恢复了。当解决了这样的失效问题之后,就会得到稳定的tps。
在这里插入图片描述

作为性能分析人员,你是无法预料会发生什么问题的,也无法判断还有哪些没有解决的问题。
所以容量场景要满足生产的业务模型是非常重要的场景设计前提。这一点在我们的培训过程中也是不停在强调的。包括:在线用户数、并发用户数、并发度、tps、压力线程之间的转换关系,也是要经过严格计算的。
在这些知识点的充分理解和执行之下,才有可能做出完美的性能项目。

在这段时间中,我们也有学员非常主动,自己也完全手工搭建庞大的测试环境,以便理解分析逻辑。

这是基本功。虽然不会搭建也是可以学习性能分析逻辑的,但是如果动手搭建的话,从理解上就会完全不一样了,会提升一个层级。

我希望学员可以理清思路,走上真正的性能分析道路,把优化效果的价值体现出来。
相关系列:

  • 7DGroup性能实施项目日记1
  • 7DGroup性能实施项目日记2
  • 7DGroup性能实施项目日记3
  • 7DGroup性能实施项目日记4
  • 7DGroup性能实施项目日记5
  • 7DGroup性能实施项目日记6
  • 7DGroup性能实施项目日记7
  • 7DGroup性能实施项目日记8
  • 7DGroup性能实施项目日记9

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.hqwc.cn/news/8652.html

如若内容造成侵权/违法违规/事实不符,请联系编程知识网进行投诉反馈email:809451989@qq.com,一经查实,立即删除!

相关文章

Intellij IDEA 插件开发 | 京东云技术团队

写在前面 很多idea插件文档更多的是介绍如何创建一个简单的idea插件&#xff0c;本篇文章从开发环境、demo、生态组件、添加依赖包、源码解读、网络请求、渲染数据、页面交互等方面介绍&#xff0c;是一篇能够满足基本的插件开发工程要求的文章。 如有疏漏欢迎指正&#xff0…

https技术鉴赏

视频网址&#xff1a;https://www.bilibili.com/video/BV1uY4y1D7Ng 总结起来&#xff1a;先使用非对称加密&#xff0c;再使用对称加密&#xff0c;这样就避免了明文传输。 非对称加密的作用是协商对称加密的公钥 SSL流程图大概如下: 这只是一个最简单的SSL版本&#xff0c;…

11 从0开始学PyTorch | PyTorch使用nn模块、手工实现神经网络

上一小节对神经网络有了基本的了解&#xff0c;这一小节就看一下如何用代码来实现一个神经网络。 我们所用的案例还是那个温度转换的案例&#xff0c;只不过需要我们把之前的线性模型替换成神经网络模型&#xff0c;并重新训练以找到适合神经网络的权重。 依照我们的经验&#…

JMeter 后置处理器之JSON提取器

目录 前言&#xff1a; 测试环境 插件介绍 插件参数 插件使用示例 JSON-PATH表达式介绍 操作符 函数 过滤器操作符 JSON PATH示例 前言&#xff1a; JMeter是一个功能强大的性能测试工具&#xff0c;它提供了许多后置处理器来处理和提取测试结果。其中一个常用的后…

六大设计模式原则

1 单一职责原则 &#xff08;Single Responsibility Principle, SRP&#xff09;&#xff0c;有且仅有一个原因引起类的变更 顾名思义&#xff1a;一个类只负责一项职责 基本介绍 即对类来说&#xff0c;一个类应该只负责一项职责。如类 A 负责两个不同职责&#xff1a;职责 …

SpringBoot 整合Redis 实战篇

一、解决数据乱码问题&#x1f349; 在上篇文章中我们整合了redis&#xff0c;当我们存入一个对象时会发现redis中的数据存在乱码问题&#xff0c;这是jdk编码的问题 springboot整合redis时提供了两个模板工具类&#xff0c;StringRedisTemplate和RedisTemplate. 1.使用Red…

动态规划—兑换零钱(一)解析+代码

兑换零钱&#xff08;一&#xff09; 题目链接&#xff1a;兑换零钱&#xff08;一&#xff09; 题目描述&#xff1a; 题目既要求要刚好组成该钱数&#xff0c;又要求是组成该钱数的最少货币数。 面对不同面额的零钱&#xff0c;我们无法直接确定其所需数量&#xff0c;也不…

白盒测试扫盲

目录 前言&#xff1a; 什么是白盒测试 白盒测试中验证什么 如何执行白盒测试 步骤1&#xff1a;理解源代码 步骤2&#xff1a;创建测试用例并执行 白盒测试示例 白盒测试技术 白盒测试的类型 单元测试 测试内存泄漏 其他 白盒测试的优势 白盒测试的缺点 结束语…

Matlab把两个不同的x轴和y轴画在同一个图里

我们知道画两个y轴可以用yyaxis. 那么画两个x轴呢? 这时候可以用神奇的tiledlayout. % 创建两组数据 x1 0:0.1:40; y1 4.*cos(x1)./(x12); x2 1:0.2:20; y2 x2.^2./x2.^3;t tiledlayout(1,1); % 创建一个tiledlayout % 第一个坐标系 ax1 axes(t); % 创建坐标系, 指定t为…

网络安全之反序列化漏洞分析

简介 FastJson 是 alibaba 的一款开源 JSON 解析库&#xff0c;可用于将 Java 对象转换为其 JSON 表示形式&#xff0c;也可以用于将 JSON 字符串转换为等效的 Java 对象分别通过toJSONString和parseObject/parse来实现序列化和反序列化。 使用 对于序列化的方法toJSONStrin…

Tomcat 部署优化

目录 一.Tomcat介绍 二.了解Tomcat里面里面是放什么的 三. Tomcat&#xff1a;是一个特殊的服务 有两个领域 四.tomcat概述 五.再加上那个扩展java虚拟机&#xff08;JVM&#xff09; 调优 tomcat 优化分两种 六.Tomcat核心组件 ​编辑 容器&#xff1a;什么是容器 …

C/C++内存管理详解

去年的今日&#xff0c;博主第一次发文&#xff0c;那时初出茅庐&#xff0c;没什么经验。时隔一年&#xff0c;更加优质的博文献上&#xff0c;希望可以帮助到更多的人❤️❤️❤️ 文章目录 &#x1f4ac; 前言一、C/C内存分布二、C语言中动态内存管理方式三、C内存管理方式1…