01
墨菲定律:
幽默又严肃的NASA军规
「墨菲定律」
(Murphy’s law)
任何可能出错的事情最终都会出错
墨菲定律强调了在复杂系统和人类活动中,事情往往会出现意想不到的差错。虽然这只是一种对人类经验和偶然性的幽默概括与启发性原则,并非科学原理,但它却成为人类巅峰科研的一项铁律——在美国宇航局的阿波罗计划控制室中,一块名为“墨菲定律”的牌子被高悬其上,用于提醒工程师们务必高度注意所有可能出错的细节。
02
运维:
墨菲定律的修罗场
“修罗场”是传说中帝释天与阿修罗争斗之地,意指“惨烈的战场”,在佛教中比喻充满斗争和冲突的地方。在优维看来,运维场恰如修罗场,运维就是与不确定性争斗!
如你所知,在IT领域,运维团队面临的“斗争”和“冲突”何其多艰——责任之重、压力之大、环境之复杂、变化之快速、故障之不可预测、资源之有限、知识之不断更新……运维人员往往在“困难与挑战共存、错误与风险同在”的常态中如履薄冰,这种可能性不仅仅是系统性的,还常常是动态性的。
正如墨菲定律所表达的那个经典的观点,即在一个复杂系统中,事情往往会出现意想不到的差错,所谓“运维差之毫厘,系统谬以千里”,运维这方修罗场可谓险象环生。
从字面上理解,墨菲定律似乎是不可战胜的,因为它假设了任何可能出错的都会出错。但在运维实战中,我们可以采取一系列措施来减少失败的可能性,从而“解决”墨菲定律昭示的问题。IT系统由众多相互依赖的组件构成,包括硬件、软件、网络和人员,每一个环节都会引入不确定性,挑战稳定性。
因此,运维团队必须7*24准备着,大模型+Multi Agent方案,可最大程度确保运维团队在墨菲定律的“修罗场”中维持系统的稳定运行。
03
大模型的领域化思考:
运维的人格化蝶变
2023年岁末,优维科技基于运维领域多年创业经验重新审视行业,并重新明确“新一代运维核心系统提供商”的企业定位,致力于解决千行百业面临的运维侧挑战。
随着大型模型概念的发展和应用的深化,我们也在深入思考和探索:大模型AI如何赋能运维行业?经过与业界的频繁交流,最终明确了大模型的技术应用对优维产品的重要性,并迅速成立攻坚团队启动专项开发工作。
2024年3月,优维科技发布《优维大模型解密:从提示词工程到场景应用,剑指AIOps的牛刀小试》,展示了优维科技在大模型应用领域的思考、布局与真实场景对接成果,我们曾在文章中预言:就运维而言,大模型是把“人与系统的交互”变成了“人机交互”,赋予大模型以人格化想象或许才是大模型在运维侧的形态。
04
Murphy:
优维科技自研首款运维AI数智人
此后,我们的产研团队为“大模型运维人格化”这条flag“死磕”多日,目前已取得初步成果:基于优维在大模型领域的经验积累,推出了运维赛道专用AI数智人——Murphy(也是【星际穿越】的女主名字),并围绕Murphy构建了一整套智能体生态系统。
Murphy之名取自墨菲定律,我们希望这位倾注了团队心血的运维数智人能帮助运维组织7*24应对不确定性,从而掌控稳定性。Murphy的出现,旨在利用大模型不断“涌现”的人格化能力,深入理解系统的运作原理,提前识别和预防潜在的故障和风险,从而将不确定性负面影响降到最低。
作为一个AI数智人,Murphy可以将优维平台中的数据、文档和API以及行业经验作为语料,通过“AGI+Agent”模式快速拥有智能化能力。Murphy的Multi Agent架构能够快速智能化进化,其效率与稳定性表现均有可观表现——它不仅能够事件处置及故障根因分析,还能够评估整个系统的健康状况。Murphy还能与运维人员进行实时互动,提供智能化的决策支持和建议,帮助运维团队应对各种挑战。
05
大模型+运维:
Murphy的能力“涌现”
现阶段Murphy在运维端的能力“涌现”主要体现在以下几个方面:
-
运维专家智能:通过深度学习和自然语言处理技术,能够理解和执行复杂的运维指令,分析系统的运行状态,诊断问题,预测潜在的风险并给出预防措施,提供专家级的运维建议和解决方案。
-
运维编程助手:协助运维工程师编写和优化脚本,自动化日常的运维任务,理解编程语言和相关的技术文档,提供实时的编码建议和错误修正,减轻运维人员的工作负担。
-
领域专家知识库:集成如最佳实践、故障案例、技术文档等海量运维知识,形成强大的知识库,并根据运维人员的查询需求提供相关的解决方案,帮助运维人员快速定位和解决问题。
-
人机协同copilot:通过NLP交互模式,大大简化人机交互模式,彻底改变传统UI模式,能够快速通过指令与原有EasyOps平台交互,甚至是其他外部平台,如“查询某某机器负责人是谁”。
-
深度场景智能:在事件归因和故障根因分析上,引入大模型能力,能够快速集成专家过往经验,做出应急响应和排障响应。
-
低代码智能编排:低代码引入大模型,大大提升低代码编排效率,研发助手。
在优维开发团队的视角下,Murphy的存在就像是一位永不疲倦的运维专家,如果说IT运维的智能化和自动化水平即将迎来断崖式“飞升”,那么我们有理由认为Murphy将会是一个关键跳板。
06
Murphy18般武艺:
全面打造新一代运维人机协同
Murphy整体体系之内,我们开发了多达数十个智能体,分别是通用智能体、平台智能体和场景智能体,并提供开放的能力让运维自己打造智能体,这一智能体协同和开放架构能大大确保和传统运维能力快速兼容,且可持续进化。
基于Agent的人机协同,就是把Agent当成一个平台能力,并将其作为基础设施建设进行平行延伸,再往后,AI完全可以深度接管平台能力,这几乎是我们团队在实践论证中一致达成的共识(当然,基础软件还是必要的,这个是雷打不动的前提条件)。
在开发Murphy的进程中,我们越是大胆尝试越是觉得不可思议,AI在运维领域展现出来的能力绝非线性,在不断深化认知的进程中,人机协同只是打开了运维“哆啦A梦的奇迹之门”,门后面的世界远远超乎我们的想象。
虽然Murphy只是AI接管平台能力的第一步,但我们的步子迈得也足够大,一出场就推出数十个智能化产品能力,大面积覆盖运维中常见的需求场景,力争为用户带来一步到位的畅快体验。
07
私定即「高定」:
支持本地私有部署,满足各行客户个性化要求
Murphy支持本地私有部署,面向不同的客户提供“私人订制”能力——允许客户在内部服务器部署Murphy,而无需依赖公共云服务。这种部署方式为各行业提供了更高水平的数据安全和隐私保护,因为所有数据和交互都保持在客户的内部控制之下,减少了外部威胁的风险。
例如,在金融领域,遵守如GDPR、PCI-DSS等严苛的法规和标准是行业基本准则。本地私有部署的Murphy可以帮助金融机构满足种种合规要求,允许客户完全控制数据的管理和存储方式,确保不会违反任何数据保护法规。
此外,Murphy的本地私有部署还提供了定制化的服务能力。客户可以根据自己的特定需求和业务流程,调整Murphy的功能和行为,使其更加贴合组织的运作方式。
在性能方面,本地部署的Murphy可以提供更快的响应时间和更高的系统稳定性,因为数据不需要在云端来回传输。在对实时性和准确性有着极高要求的领域,Murphy对于交易业务和客户服务的质量把控起到至关重要的作用。
08
标配即「高配」:
支持云端一体+页面+IM的集成式解决方案
与优维以往的产品特性不同,Murphy在设计和开发之初就考虑了云端一体的交互能力。这意味着Murphy不仅能够在本地私有部署中高效运行,还能够无缝地与云端服务进行集成,从而提供更加灵活和全面的解决方案。
基于云端一体化设计,Murphy可以充分利用云资源的弹性伸缩和计算能力,以应对高峰时段的用户需求。在需要时,Murphy可以快速扩展其处理能力,确保用户体验的流畅性和服务的连续性。实现跨平台的数据同步和共享的能力,对于金融行业中的多分支结构和分布式团队来说非常重要,无论是在移动设备还是PC端,用户都能够获得一致的服务体验,并且能够访问到最新的数据和信息。
在页面支持方面,Murphy智能体能够与各种Web页面进行交互,无论是金融机构的内部管理系统,还是面向客户的在线服务平台,Murphy都能直接在用户的浏览器中提供帮助,解答问题,或者引导用户完成特定的金融交易和服务流程。
同时,Murphy还支持即时通讯(IM)功能,确保它能在金融机构的IM平台上与用户进行实时交流,提供即时的咨询服务、处理交易请求,或者在紧急情况下提供解决问题的办法。
Murphy的云端一体化设计和页面及IM的交互支持,具备为金融等高敏感、高要求行业提供高度集成的AI服务解决方案的能力。
09
优维大模型数智人架构:
基于新一代运维核心系统的技术承载
10
Murphy产品灵感:
优维的大模型改进之旅
我们曾在3月的大模型文章探讨过,优维EasyOps平台矩阵里的几乎每一个应用场景都可以与大模型进行结合,接入大模型的产品有着非常巨大的想象空间。
从某种程度上说,Murphy的诞生是优维主导的一次大模型改进之旅——构建知识库、标注垂直能力、优化提示词工程,不断突破大模型的局限性,最终达成了今天的Murphy里程碑。
灵感分享之一:本地知识库探索
人工智能和人一样,其准确性的提升源自高频的使用反馈,知识越用越好用。
本地知识库检索是构成Murphy本地私有化部署的重要一环。除了支持语雀、Confluence、Jira、流程工单、IM会话等多种知识库的导入,还能无缝对接CMDB数据,支持单表和多表模式则可以让IT信息更好的检索。整合、集成、共享、学习……一气呵成,破除平台和工具的差异化壁垒,形成可无限迭代再生的知识闭环。
灵感分享之二:运维智能化场景探索
CMDB关系图谱建设:运维智能化场景的基石
CMDB关系图谱建设不仅能够提供全面的IT配置信息,还支持各种自动化运维功能的实现,并为更高级别的运维智能化提供了可能。因此,优维团队在规划Murphy的运维智能化场景的进程中,非常重视CMDB关系图谱的建设工作。
场景梳理
基于CMDB的AI全流程自动化故障处理闭环
变更影响分析
事前分析:是否可以发布
事后分析:影响了哪些系统
根因分析
告警影响分析
告警关联分析
日志分析
故障应急推荐
灵感分享之三:打通运维体系工具
从「人找工具」到「工具找人」的跃迁
随时提问,感知当前上下文,扭转运维模式,实现从“人找工具”到“工具找人”的转变。
平台能力AI化
任务分拆及调度
低代码AI助手
灵感分享之四:AI Center
智能体建设:AI的灵魂工程
AI Center对话场景
11
Murphy产品核心功能界面展示(局部):
Murphy能力场景局部之一:智能体建设
Murphy能力场景局部之二:运维编程助手
Murphy能力场景局部之三:基于NLP人机交互(如CMDB、监控)
12
优维Murphy:
惊艳现在,预设未来
Murphy的诞生,是优维团队借用AI赋能运维的一次成功落地,在小心求证的进程中,很多曾经的大胆假设得到了正确论证,同时也收获了很多意想不到的全新惊喜。
正如始终相信“美好的事情即将发生”,我们始终相信“AI的美好未来是大模型AGI”,大模型催化垂直行业的形态剧变只是时间问题。
Murphy终将成为你我身边的运维助手,作为运维行业的从业者,去拥抱和探索它是我们的浪漫宿命,因为它的智能进化前景不可估量。敬请广大客户和我们一起期待Murphy的无限可能。