云原生团队如何实现加量不加价

随着云原生技术的快速发展,越来越多的业务实现了上云,云原生团队在工作量增大的同时也随之变成了所有问题对接的入口,如何承担这个保姆的角色成为了一道难题,故障的定界和问题证据的交接更是让人头疼的问题。在这种情况下需要有工具帮助云原生团队快速完成故障的定界与故障的根因分析,并进行相关数据证据整理收集,做好接棒和交棒工作,才能摆脱保姆角色,实现加量不加价。

面临的挑战 

一方面要支撑新业务的快速上线,另一方面又要保证稳定性。云原生团队也逐步成为底层基础设施的供给方,就变成了有了问题先找云原生团队看看再说,导致公司内云原生团队在同等团队资源情况下承担了越来越多的工作压力,而且常常忙于疲于应付来自各方的问题。

  • 故障的定界与根因定位困难: 随着业务规模的扩大,系统故障变得更加复杂,团队需要更快速、更准确地定位故障,并找到问题的根本原因,以便有效解决问题。

  • 问题证据的交接不清:多团队协作中,由于故障处理和交接不够清晰,导致问题的处理难以延续和交接,增加了团队间沟通和协作的难度。

  • 工作量剧增:团队需要处理更多的容器部署、监控、维护和故障排查工作,使得团队工作量急剧增加。

  • 资源限制: 虽然工作量增加,但团队的资源并没有得到相应的增加,这导致团队面临了资源不足的挑战,如人手不足、时间紧迫等。


    AiOps无法解决核心问题

    目前也有很多团队通过引入AIOps相关工具来试图解决眼下的问题,它的引入也确实帮很多团队解决了很多自动化、智能化运维的问题。但是由于当前AIOps的概念是过大的,导致没有清晰的产品边界和落地的核心能力项,另一方面现有很多产品并不能给出其推理根因的证据链数据,使得相关团队在实际处置中仍需要人工介入。

  • 结论的可解释性: AIOps给出概率性的故障定位和根因分析,但并不能给出可解释的结论,同时也不能根据结论立即采取行动,仍需要人工介入梳理。

  • 无法进行故障定界与流程闭环:多团队协同工作中,仍需要相关数据及进行佐证并进行工作的交接,才能形成排障流程的闭环。同时故障处置需要可行动的结论才能够展开,目前仍都需要人工参与。

  • 专家经验的重要性:在涉及到特定领域的复杂问题时,AIOps 的结论仍需要相关领域的专家进行分析和验证。

在引入了很多工具后往往没有从根本上帮助团队提高能效,反而增加了学习成本和新的维护项。


需要有工具能够指明方向

 

Kindling-OriginX 通过自动化分析每条 Trace,找出 Trace 中节点 Span 突变的根因,并自动关联各种数据生成可行动、可解释的故障根因报告。相关团队可以由此快速完成故障的定界与数据证据收集,即可迅速展开标准化排障处置与故障问题交接。将云原生团队从保姆的角色中解放出来,能够将更多精力放在基础设施能力建设,为业务方提供更高效稳定的云原生技术底座。


 结语

在云原生团队承担更多责任和职能的情况下,如何保证工作效率和质量是一个目前亟待解决的问题。Kindling-OriginX 的思路是通过自动化分析每条 Trace,找出 Trace 中节点 Span 突变的根因,关联各种数据证明推理的准确性,让团队能够更加清晰地完成故障定界与根因分析,为业务方提供强有力的支撑,帮助团队实现加量不加价。

相信随着技术的发展会有更多的工具和方法能够帮助到云原生团队来更好地应对各种挑战,也欢迎大家和我们一起讨论自己团队面临的挑战与解法。

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.hqwc.cn/news/502428.html

如若内容造成侵权/违法违规/事实不符,请联系编程知识网进行投诉反馈email:809451989@qq.com,一经查实,立即删除!

相关文章

【Python笔记-设计模式】迭代器模式

一、说明 迭代器模式是一种行为设计模式,让你能在不暴露集合底层表现形式(列表、栈和树等)的情况下遍历集合中所有的元素。 (一) 解决问题 遍历聚合对象中的元素,而不需要暴露该对象的内部表示 (二) 使用场景 需要对聚合对象…

网络攻防之CVE-2020-15778漏洞的复现及修复详细过程

目录 漏洞描述 实验环境 漏洞复现 漏洞修复 漏洞扩展 漏洞描述 (1)漏洞编号:CVE-2020-15778 (2)CVE官网对该漏洞的解释 (3)漏洞简介:2020年6月9日,研究人员Chinmay Pandya在Openssh中发现了一个漏洞,于7月18日公开。OpenSSH的8.3p1中的scp允许在scp.c远程功能中注入命…

软考-系统集成项目管理中级-信息系统建设与设计

本章重点考点 1.信息系统的生命周期 信息系统建设的内容主要包括设备采购、系统集成、软件开发和运维服务等。信息系统的生命周期可以分为四个阶段:立项、开发、运维和消亡。 2.信息系统开发方法 信息系统常用的开发方法有结构化方法、原型法、面向对象方法等 1)结构化方法 …

Amino PEG11 COOH,Amino-PEG11-acid,可在活化剂存在下与氨基反应

您好,欢迎来到新研之家 文章关键词:1616426-12-0,Amino-PEG11-acid,Amino PEG11 COOH,H2N-PEG11-CH2CH2COOH,氨基-PEG11-羧酸 一、基本信息 【产品简介】:Amino-PEG11 acid is a heterobifun…

拦截器Interceptor(黑马学习笔记)

学习完了过滤器Filter之后,接下来我们继续学习拦截器Interceptor。 拦截器我们主要分为三个方面进行讲解: 1.介绍下什么是拦截器,并通过快速入门程序上手拦截器 2.拦截器的使用细节 3.通过拦截器Interceptor完成登录校验功能 我们先学习第一…

【Flink入门修炼】2-1 Flink 四大基石

前一章我们对 Flink 进行了总体的介绍。对 Flink 是什么、能做什么、入门 demo、架构等进行了讲解。 本章我们将学习 Flink 重点概念、核心特性等。 本篇对 Flink 四大基石进行概括介绍,是 Flink 中非常关键的四个内容。 一、四大基石 Flink四大基石分别是&#x…

ShardingJdbc实战-分库分表

文章目录 基本配置分库分表的分片策略一、inline 行表达时分片策略algorithm-expression行表达式完整案例和配置如下 二、根据实时间日期 - 按照标准规则分库分表标准分片 - Standard完整案例和配置如下 基本配置 逻辑表 逻辑表是指:水平拆分的数据库或者数据表的相…

Windows11服务器远程连接错误:错误代码0x3,不重启服务器的解决方法

问题描述 在连接远程服务器时,发现如下错误: 您的远程桌面会话已结束,可能是下列原因之一: 管理员已结束了会话 在建立连接时发生错误。 发生网络问题 展开详细信息后发现错误代码0x3,如下图: 但之前都能…

安卓开发4-MQTT环境搭建

安卓开发4-MQTT环境搭建 1.搭建好安卓环境 略 2.打开一个已经创建好的工程&#xff0c;分别修改下面3个文件 2.1.AndroidManifest.xml 添加权限 <uses-permission android:name"android.permission.INTERNET" /><uses-permission android:name"and…

什么是VR虚拟社区|VR元宇宙平台|VR主题馆加盟

VR虚拟社区是指一种基于虚拟现实技术构建的在线社交平台或环境&#xff0c;用户可以在其中创建虚拟化的个人形象&#xff08;也称为avatars&#xff09;并与其他用户进行交流、互动和合作。在VR虚拟社区中&#xff0c;用户可以选择不同的虚拟场景和环境&#xff0c;如虚拟公园、…

MyBatis 学习(五)之 高级映射

目录 1 association 和 collection 介绍 2 案例分析 3 一对一关联和一对多关联 4 参考文档 1 association 和 collection 介绍 在之前的 SQL 映射文件中提及了 resultMap 元素的 association 和 collection 标签&#xff0c;这两个标签是用来关联查询的&#xff0c;它们的属…

视频在线压缩

video2edit 一款免费的在线视频编辑软件&#xff0c;可以进行视频合并、视频剪辑、视频压缩以及转换视频格式等。 链接地址&#xff1a;在线视频编辑器和转换器 - 编辑&#xff0c;转换和压缩视频文件 打开视频压缩页面&#xff0c;上传想要压缩视频&#xff0c;支持MP4&…