入门指南:使用Prometheus监控Linux服务器

Prometheus介绍

image-20230331095757061

Prometheus是一款开源的监控系统,主要用于收集、存储和查询时间序列数据,以便于对系统进行监控和分析。以下是Prometheus的架构图介绍:

Prometheus的架构由四个主要组件组成:

  1. Prometheus Server(Prometheus服务器) :Prometheus Server是Prometheus的核心组件,主要负责从各个目标(target)中收集指标(metrics)数据,并对这些数据进行存储、聚合和查询。Prometheus Server还提供了一个Web界面,用于展示和查询监控数据。
  2. Client Libraries(客户端库) :Prometheus提供了多种客户端库,用于在应用程序中嵌入Prometheus的指标收集功能。客户端库支持多种编程语言,包括Go、Java、Python等,用户可以根据自己的需求选择合适的客户端库。
  3. Exporters(导出器) :Exporters是用于将第三方系统的监控数据导出为Prometheus格式的组件。Prometheus支持多种Exporters,例如Node Exporter、MySQL Exporter、HAProxy Exporter等,用户可以根据自己的需求选择适合的Exporter。
  4. Alertmanager:Alertmanager是Prometheus的告警组件,用于根据用户定义的规则对监控数据进行告警。Alertmanager支持多种告警方式,例如邮件、Slack、PagerDuty等。用户可以根据自己的需求选择适合的告警方式。

同时Prometheus有以下优点

  1. 灵活的数据模型:Prometheus采用的是key-value对的形式存储指标数据,每个指标都可以包含多个标签(labels),这样可以更加灵活地描述指标数据。例如,可以使用标签来描述不同的机器、不同的应用程序、不同的数据中心等,从而更加细粒度地监控系统。

  2. 高效的存储和查询:Prometheus使用自己的时间序列数据库,可以高效地存储和查询大量的指标数据。同时,Prometheus提供了灵活的查询语言(PromQL),可以对指标数据进行复杂的查询和聚合操作。

  3. 强大的可视化和告警功能:Prometheus提供了Web界面和API,可以方便地展示和查询监控数据。同时,Prometheus还提供了灵活的告警功能,可以根据用户定义的规则对监控数据进行告警,并支持多种告警方式。

  4. 可扩展性强:Prometheus的架构非常灵活,可以根据需要选择合适的组件进行配置。同时,Prometheus还支持多种扩展方式,例如使用Pushgateway将非常规的指标数据推送到Prometheus,使用Federation将多个Prometheus Server进行联合查询等。

  5. CNCF的成员项目:CNCF是一个非营利组织,致力于推广云原生技术,包括容器、服务网格、微服务、不可变基础设施等。Prometheus作为CNCF的项目之一,得到了广泛的关注和支持,并且得到了来自全球各地的贡献者的积极参与和开发。作为一个CNCF的项目,Prometheus不仅具有开源、社区化的特点,而且还受到了CNCF的支持和认可,可以更好地满足云原生环境下的监控需求。

下面就Prometheus基于本地环境进行监控报警进行讲解

下载

docker pull prom/prometheus:v2.43.0

image-20230329170341774

配置

创建文件夹data

image-20230329170516593

创建配置文件prometheus.yml,可以根据需要进行配置

global:scrape_interval:     15s # By default, scrape targets every 15 seconds.# Attach these labels to any time series or alerts when communicating with# external systems (federation, remote storage, Alertmanager).external_labels:monitor: 'codelab-monitor'# A scrape configuration containing exactly one endpoint to scrape:
# Here it's Prometheus itself.
scrape_configs:# The job name is added as a label `job=<job_name>` to any timeseries scraped from this config.- job_name: 'prometheus'# Override the global default and scrape targets from this job every 5 seconds.scrape_interval: 5sstatic_configs:- targets: ['localhost:9090']

因为路径过长,创建一个软链

 ln -s /Users/weizhao.dong/Documents/soft/prometheus /data/prometheus

启动

docker run --name prometheus -d -p 9090:9090 -v /data/prometheus/prometheus.yml:/etc/prometheus/prometheus.yml   -v /data/prometheus:/prometheus prom/prometheus:v2.43.0

image-20230330141947743

image-20230330233346072

Grafana安装

下载

docker pull grafana/grafana-enterprise:8.5.22

image-20230330143946592

启动

docker run -d --name=grafana -p 3000:3000 grafana/grafana-enterprise:8.5.22

image-20230330233325310

配置数据源

添加prometheus数据源

image-20230330233452500

image-20230515232307244

Linux服务器资源监控

下载node-exporter

由于我的电脑是arm架构所以使用了arm64的包,如果是其他架构请访问此链接进行下载https://github.com/prometheus/node_exporter/releases

wget https://github.com/prometheus/node_exporter/releases/download/v1.5.0/node_exporter-1.5.0.linux-arm64.tar.gz

下载解压执行node_exporter文件暴漏9100端口,即可采集到监控信息

image-20230330233733640

image-20230330233840865

安装node-exporter

由于直接启动node-exporter关闭窗口此进程就会挂掉,所以不是我们想要的,因此可以采用systemctl方式进行配置

  1. /usr/lib/systemd/system/目录,创建node_exporter.service文件,内容如下,ExecStart指向的就是node_exporter执行文件

    [Unit]
    Description=Node Exporter[Service]
    ExecStart=/usr/local/node_exporter
    Restart=on-failure
    [Install]
    WantedBy=multi-user.target
    
  2. 执行systemctl daemon-reload

  3. 执行 systemctl start node_exporter启动node_exporter

  4. 执行netstat -aon|grep 9100查看9100是否启动成功

    image-20230330234533527

修改prometheus配置文件

增加以下任务,5s采集一次

  - job_name: 'linux'# Override the global default and scrape targets from this job every 5 seconds.scrape_interval: 5sstatic_configs:- targets: ['10.211.55.4:9100']

image-20230330234805218

重启prometheus

docker restart prometheus

image-20230330234904188

image-20230330234938650

Grafana文件配置

访问官网https://grafana.com/grafana/dashboards/下载node_export配置文件

image-20230330235849765

点击进去,点击右边的DownloadJson文件进行下载

image-20230330235927788

文件下载以后导入到Grafana

image-20230331000109536

导入完成以后,查看可以看到对应的数据采集到

image-20230331000226890

到这Linux监控就告一段落。

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.hqwc.cn/news/257228.html

如若内容造成侵权/违法违规/事实不符,请联系编程知识网进行投诉反馈email:809451989@qq.com,一经查实,立即删除!

相关文章

Javascript 函数介绍

Javascript 函数介绍 很多教程书一上来就讲解一堆语法&#xff0c;例如函数定义、函数调用什么。等读者看完了函数这一章都没搞懂什么是函数。 在讲解什么叫函数之前&#xff0c;我们先看下面一段代码&#xff1a; <!DOCTYPE html> <html xmlns"http://www.w3.…

Spring(Spring/Springboot 的创建) 基础

一. Spring 1.1 Spring是什么&#xff1f; Spring 指的是 Spring Frameword(Spring 框架),它是一个开源框架。 Spring 是包含了众多工具方法的IoC容器。 1.2 什么是容器&#xff1f; 容器时用来容纳某种物品的装置。 我们之前接触到的容器&#xff1a; • List/Map ->…

【深度学习】强化学习(一)强化学习定义

文章目录 一、强化学习问题1、交互的对象1. 智能体&#xff08;Agent&#xff09;2. 环境&#xff08;Environment&#xff09; 2、强化学习的基本要素1. 状态 &#x1d460;2. 动作 &#x1d44e;3. 策略 &#x1d70b;(&#x1d44e;|&#x1d460;)4. 状态转移概率 &#x1…

[HITCON 2017]SSRFme perl语言的 GET open file 造成rce

这里记录学习一下 perl的open缺陷 这里首先本地测试一下 发现这里使用open打开 的时候 如果通过管道符 就会实现命令执行 然后这里注意的是 perl 中的get 调用了 open的参数 所以其实我们可以通过管道符实现命令执行 然后这里如果file可控那么就继续可以实现命令执行 这里就…

用23种设计模式打造一个cocos creator的游戏框架----(一)生成器模式

1、模式标准 模式名称&#xff1a;生成器模式 模式分类&#xff1a;创建型 模式意图&#xff1a;将一个复杂对象的构建与它的表示分离&#xff0c;使得同样的构建过程可以创建不同的表示。 结构图&#xff1a; 适用于&#xff1a; 当创建复杂对象的算法应该独立于该对象的…

⭐Unity 搭建UDP客户端(01) 配合网络调试助手测试

1.接收来自服务器的消息 using System.Net; using System.Net.Sockets; using System.Text; using System.Threading; using UnityEngine;public class UDPManager:MonoBehaviour {public string recvStr; //服务器返回值public string UDPClientAddRess "192.168.2.39&q…

儿童护栏围栏CE认证EN1930检测标准

儿童门护栏也叫儿童游戏围栏&#xff0c;游戏围栏和儿童护栏&#xff0c;安全护栏等。市面上的儿童围栏以塑料&#xff0c;木质材料结构为主。主要作用是为了解放妈妈的双手&#xff0c;提供一个安全舒适的环境给6个月-3岁的宝宝。使用儿童围栏有利于培养宝宝的独立意识&#x…

深入探索C语言中的二叉树:数据结构之旅

引言 在计算机科学领域&#xff0c;数据结构是基础中的基础。在众多数据结构中&#xff0c;二叉树因其在各种操作中的高效性而脱颖而出。二叉树是一种特殊的树形结构&#xff0c;每个节点最多有两个子节点&#xff1a;左子节点和右子节点。这种结构使得搜索、插入、删除等操作…

C# 图解教程 第5版 —— 第17章 转换

文章目录 17.1 什么是转换17.2 隐式转换17.3 显示转换和强制转换17.4 转换的类型17.5 数字的转换17.5.1 隐式数字转换17.5.2 溢出检测上下文17.5.3 显示数字转换 17.6 引用转换17.6.1 隐式引用转换17.6.2 显式引用转换17.6.3 有效显式引用转换 17.7 装箱转换17.7.1 装箱是创建副…

概率测度理论方法(第 2 部分)

一、说明 欢迎回到这个三部曲的第二部分&#xff01;在第一部分中&#xff0c;我们为测度论概率奠定了基础。我们探索了测量和可测量空间的概念&#xff0c;并使用这些概念定义了概率空间。在本文中&#xff0c;我们使用测度论来理解随机变量。 作为一个小回顾&#xff0c;在第…

贪吃的猴子 - 华为OD统一考试(C卷)

OD统一考试&#xff08;C卷&#xff09; 分值&#xff1a; 200分 题解&#xff1a; Java / Python / C 题目描述 一只贪吃的猴子&#xff0c;来到一个果园&#xff0c;发现许多串香蕉排成一行&#xff0c;每串香蕉上有若干根香蕉。每串香蕉的根数由数组numbers给出。猴子获取香…

flask web开发学习之初识flask(三)

文章目录 一、flask扩展二、项目配置1. 直接配置2. 使用配置文件3. 使用环境变量4. 实例文件夹 三、flask命令四、模版和静态文件五、flask和mvc架构 一、flask扩展 flask扩展是指那些为Flask框架提供额外功能和特性的库。这些扩展通常遵循Flask的设计原则&#xff0c;易于集成…