从人工到自动化到AIOps再到ChatOps:大模型在运维领域的应用

news/2024/7/4 20:24:47/文章来源:https://www.cnblogs.com/Jcloud/p/18278525

一、引言

在信息技术飞速发展的今天,运维工作已经从最初的人工操作,逐步演变为自动化、AIOps(人工智能运维)和ChatOps(通过聊天的方式去运维)。这些变革不仅提升了运维效率,还显著保障了系统的稳定性。特别是借助大模型,运维同学能够更加高效地完成工作,并应对复杂的运维挑战。本文将依次介绍这些概念,并探讨大模型在运维领域的具体应用。

 

二、运维的演变历程

1. 人工运维

- 概念:人工运维是指通过人工手动执行各种运维任务,如服务器配置、日志分析、故障排除等。

- 挑战:人工操作容易出错,效率低下,且无法快速响应突发事件。

 


 

 

2. 自动化运维

- 概念:自动化运维通过编写脚本和使用工具来自动执行运维任务,减少人工干预。

- 优势:提高效率,减少人为错误,能够快速重复执行任务。

- 工具:Ansible、Puppet、Chef等。

 


 

3. AIOps(智能运维)

- 概念:AIOps利用机器学习和大数据分析技术,自动检测、分析和解决运维问题。

- 优势:能够处理海量数据,提前预测故障,自动化决策和响应。

- 应用:异常检测、根因分析、自动化修复等。

 


 

4. ChatOps(通过聊天的方式去运维)

- 概念:ChatOps通过将运维工具集成到聊天平台(如咚咚、微信)中,让运维同学通过聊天界面执行运维任务。

- 优势:将运维自动化的能力通过聊天的方式提供给运维、开发等人员使用,使运维同学具有可以随时随地使用手机远程运维的能力。

 


 

三、大模型在运维领域的应用

大模型在运维领域的应用,能够进一步提升运维工作的智能化和自动化水平。以往,受限于自然语言处理(NLP)模型的限制,现有的机器学习模型在理解人类的问题和上下文方面存在较大挑战。这导致了当前的ChatOps应用主要依赖于预置的指令,通过设计好的NLP任务来完成一些运维工作。

借助大模型的强大自然语言理解能力,目前可以较好和方便地构建智能的运维应用。以下是几个结合大模型的运维场景,这些场景展示了大模型在提升运维工作智能化和自动化水平方面的潜力。

 

1. 运维智能助手

- 问题:因为当前的机器人不够智能,运维同学需要24小时在线协助研发同学解决使用内部工具遇到的问题。

- 解决方案:可以基于大模型构建RAG应用,使用运维同学沉淀的运维知识库和热门问题,使研发同学能自助的、快速的解决大部分问题。

 


 

 

2. 自动化问题诊断与修复

- 问题:传统问题诊断需要人工介入,耗时且易出错。

- 解决方案:大模型能够自动诊断系统问题,并提供修复建议或自动执行修复操作。

 


 

 

3. 智能日志分析

- 问题:传统日志分析需要手动筛选和分析,效率低且容易遗漏关键信息。在AIOps产品中,我们已经构建了基于日志模版的智能日志分析,但在构建日志模版的过程中,还是依赖相关的运维专家经验去构建相关的运维模版。

- 解决方案:大模型本身是通用领域的专家,借助上面构建的RAG的私域运维知识和他的通用经验,基于大模型构建一个运维日志监控专家,24小时审查关键日志,通过他可以自动解析海量日志,识别异常模式,并生成易于理解的报告。

- 例子:在服务器日志中,大模型能够快速识别出潜在的安全威胁(如异常登录尝试),并提醒运维人员采取措施。

 

四、结论

稳定是运维部门的主要目标,但一台精密复杂的机器,难免在运行一段时间后出现故障,出现故障后,要求我们能依赖现有的监控、告警数据,通过AIOps平台或基于大模型的工具快速的,在这庞大复杂的系统中找到问题、定位问题并解决问题,这也是当前我们运维部门的目标1,5,15原则:1分钟发现故障,5分钟定位故障,15分钟解决故障。

从人工运维到自动化运维,再到AIOps和ChatOps,运维工作的智能化和自动化水平不断提升。借助大模型,运维同学能够更加高效地完成工作,保障系统的稳定性。通过智能日志分析、故障预测与预防、自动化问题诊断与修复,以及知识库与文档生成,大模型在运维领域展现出巨大的应用潜力。未来,随着大模型技术的不断发展,运维工作的智能化水平将进一步提升,为企业的信息系统保驾护航。

 

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.hqwc.cn/news/735885.html

如若内容造成侵权/违法违规/事实不符,请联系编程知识网进行投诉反馈email:809451989@qq.com,一经查实,立即删除!

相关文章

ros microros 使用超声波雷达测量距离

我们使用的超声波模块一共有四个引脚,分别是TRIG 即发送引脚,用于发送超声波ECHO 即接收引脚,用于接收反射回来的超声波VCC 电源接5VGND 电源地 一、新建工程新建example18_sr04二、编写代码带注释的代码如下#include <Arduino.h> #define Trig 27 // 设定SR04连接的A…

tensorflow-gpu配置

1.安装Anaconda 下载地址:Anaconda | The Operating System for AI 2.查询tensorflow-gpu不同版本所对应的python、cuDNN和CUDA的版本 官网:在 Windows 环境中从源代码构建 | TensorFlow (google.cn) 3.使用conda安装相应的库# tensorflow_gpu-2.3.0 conda init conda crea…

Charles 使用

一、下载安装官网:https://www.charlesproxy.com/二、移动端抓包 2.1、安装证书 设置代理弹出对应的 代理ip 和端口号,在移动端的wifi 配置对应的代理,然后返回对应的证书地址 下载证书 安装 即可

ubuntu与windows双系统时间不同步

两个系统时间不同步是因为对于硬件时间(BIOS里的时间)的时区认定不一致,windows认为BIOS的时间是当前系统时区(中国时区:UTC+08(CST-8)),ubuntu认为BISO时间是UTC时区时间.两个系统在启动是按照BISO时间设置系统时间导致了系统时间差异。 处理思路无非,修改windows或者ub…

图像采集卡是什么,有什么用处

机器视觉技术的发展源于光学、化学、物理、电子、电视、机械设计、数学、软件、人工智能、计算机和计算机视觉以及互联网等领域的发现。随着这些不同学科取得某些里程碑式的进展,它们为开发用于自动检查、测量、过程控制和机器人引导应用的成像系统铺平了道路。 图像采集卡是许…

如何把电子书转成EPUB?

大家知道EPUB是什么格式吗?其实EPUB是一种电子图书标准,由国际数字出版论坛提出。它是一个自由的开放标准,属于一种可以“自动重新排版”的内容;也就是文字内容可以根据阅读设备的特性,以较适于阅读的方式显示。有很多时候,不同的阅读器所支持的电子格式是不一样的,所以…

一文读懂“负载均衡”

原文链接:https://blog.csdn.net/cyl101816/article/details/135195729 负载均衡无处不在,无论是分布式,还是中间件,还是微服务,都需要涉及到负载均衡。 一、什么是负载均衡负载均衡是一种在计算机网络和系统架构中使用的技术,用于均衡分发工作负载到多个资源,比如:服务…

ros mocroros 使用双核运行microros

在硬件篇开始的第一节时,曾提到,我们所使用的开发板单片机是双核240M主频的,但是在后面的开发中我们并没有真正的使用了双核,主频也是使用的默认160MHZ。所以本节带你一起带你一起提升主频并启动双核进行MicoROS的双核。 一、双核与RTOS介绍 所谓双核指的是ESP32单片机有两…

SpringMVC的数据获取问题

在传统的javaweb中我们获取数据是通过HttpServletRequest中的getParameter或者getHeader等方法来获取相关的信息。由此我们引出了以下问题:在SpringMVC中应该如何获取请求提交的数据呢? 在SpringMVC中又应该如何获取请求头信息呢? 在SpringMVC中又应该如何获取客户端提交的C…

mysql用户

一、数据库用户管理 DCL:数据控制语言,用于设置或者更改数据库用户或角色权限 1.新建用户create user 用户名@源地址 identified by 密码;用户名 指定将创建的用户名来源地址 指定新创建的用户可在哪些主机上登录 可使用IP地址、网段、主机名的形式 本地用户可用localhost …

可视化

D3.js绘制柱形图 <!DOCTYPE html><html lang="en"><head><title>bar example</title><script src="d3.min.js"></script></head><body><div id="barchart"></div><script…

【0基础学爬虫】爬虫基础之scrapy的使用

【0基础学爬虫】爬虫基础之scrapy的使用大数据时代,各行各业对数据采集的需求日益增多,网络爬虫的运用也更为广泛,越来越多的人开始学习网络爬虫这项技术,K哥爬虫此前已经推出不少爬虫进阶、逆向相关文章,为实现从易到难全方位覆盖,特设【0基础学爬虫】专栏,帮助小白快速…

springboot使用itextpdf+jfreechart制作PDF文档

1. springboot引入的依赖组件 项目中需要引入itextpdf和jfreechart两个组件,版本根据项目所需进行引入,maven组件版本查询可根据如下地址进行查询:maven组件查询<dependency><groupId>com.itextpdf</groupId><artifactId>itextpdf</artifactId&g…

spring趣玩

自定义banner 先上图片,替换spring启动标志;或者也可以在启动类代码设置Banner也可以通过设置springApplication.setBannerMode(Banner.Mode.OFF);关闭打印横幅ApplicationRunner和@PostConstruct ApplicationRunner 是一种灵活的机制,可以用来执行数据库迁移、预加载数据、…

图论初步与可视化

本讲将简要介绍图论中的基本概念,并主要讲解图论中的最短路径问题。以及如何将图论可视化 目录一、图论的概念二、在线作图网站1.index介绍2.Node Count介绍3.Graph data三、Matlab作无向图1.无权图(每条边的权重默认为1)2.利用字符串做无权图3.有权图四、Matlab作有向图 一…

使用不同函数打印torch.nn模型——print(model),named_children(),named_modules():

创建一个具有三级嵌套的模型,结构如图:import torch import torch.nn as nn# 定义子子模块 class SubSubModule(nn.Module):def __init__(self):super(SubSubModule, self).__init__()self.conv = nn.Conv2d(3, 3, kernel_size=3, padding=1)def forward(self, x):return sel…

[LeetCode] 189. Rotate Array

无敌的切片他又来了。 class Solution:def rotate(self, nums: List[int], k: int) -> None:"""Do not return anything, modify nums in-place instead."""#0if k ==0:pass#elselenn = len(nums)k = k % lennnums[:] =nums[lenn -k:] + nums…

Centos双网卡冗余绑定

1. 前言 关于双网卡绑定,前前后后踩过不少的坑,虽然这是 RHCE 中的一道题,但是在实践中碰到问题也够喝一壶的。 在实践中,虚拟机、物理机都做过,但是不尽相同,大部分的坑也集中在这里,本文长期更新关于网卡绑定中遇到的问题及处理方法。 现在的服务器默认都配备 4 张 千…

Java 将Markdown文件转换为Word和PDF文档

Markdown 凭借其简洁易用的特性,成为创建和编辑纯文本文档的常用选择。但某些时候我们需要更加精致的展示效果,例如在专业分享文档或打印成离线使用的纸质版时,就需要将Markdown文件以其他固定的文档格式呈现。通过将 Markdown 转换为 Word 和 PDF 格式,可以得到更多的格式…