Zabbix第二部分:基于Proxy分布式部署实现Web监控和Zabbix HA集群的搭建

代理和高可用

  • 一、基于zabbix-proxy的分布式监控
    • 1.1 分布式监控的作用
    • 1.2 数据流向
    • 1.3 构成组件
  • 二、部署zab·bix代理服务器
    • Step1 前置准备
    • Step2 设置 zabbix 的下载源,安装 zabbix-proxy
    • Step3 部署数据库并将zabbix相关文件导入
    • Step4 修改zabbix-proxy的配置文件,启动服务
    • Step5 在所有主机上配置 hosts 解析
    • Step6 在 Web 页面配置 agent 代理
    • Step7 在客户端修改 agent2 配置文件
    • Step8 在 Web 页面添加客户端主机
    • Step9 分别在客户端和代理服务器上重启服务
    • Step10 在代理服务器查看日志
  • 三、Zabbix 高可用集群(Zabbix HA)
  • 四、部署 Zabbix 高可用集群
    • 4.1 服务端配置
      • Step1 主节点 Zabbix Server 配置
      • Step2 备节点 Zabbix Server 配置
      • Step3 主备节点添加监控主机
      • Step4 查看高可用集群状态
    • 4.2 客户端配置
      • Step1 修改agent01和agent02的配置文件
      • Step2 查看Web页面
    • 4.3 故障模拟和效果测试
      • Step1 模拟server节点出现故障,观察Web前端页面
      • Step2 观察能否故障切换

一、基于zabbix-proxy的分布式监控

在这里插入图片描述

1.1 分布式监控的作用

1)分担 server 的集中式压力;

2)解决多机房之间的网络延时问题。

1.2 数据流向

agent --> proxy --> server

1.3 构成组件

**zabbix-server:**整个监控体系中最核心的组件,它负责接收客户端发送的报告信息,所有配置、 统计数据及操作数据都由它组织。

**Database:**所有配置信息和zabbix收集到的数据都存储在数据库中。

zabbix-proxy:**用于分布式系统中,可以代理zabbix-server的功能,减轻server的压力。

**zabbix-agent:**客户端软件,装在被监控主机上,用于采集监控数据,并把采集到的的数据发送给proxy或者server。

**web界面:**web界面可以让用户随时随地都能够轻松的访问到zabbix,是zabbix-server的一部分,通常跟server运行在同一台物理机上

二、部署zab·bix代理服务器

在这里插入图片描述

ServerIP Address
zabbix-server192.168.2.100
zabbix-agent01192.168.2.102
zabbix-agent02192.168.2.103
zabbix-proxy192.168.2.106

Step1 前置准备

#关闭防火墙和selinux
systemctl disable --now firewalld
setenforce 0

Step2 设置 zabbix 的下载源,安装 zabbix-proxy

rpm -ivh https://repo.zabbix.com/zabbix/6.0/rhel/7/x86_64/zabbix-release-6.0-4.el7.noarch.rpm
sed -i 's#https://repo.zabbix.com#https://mirrors.aliyun.com/zabbix#' /etc/yum.repos.d/zabbix.repoyum install -y zabbix-proxy-mysql zabbix-sql-scripts zabbix-selinux-policy

在这里插入图片描述

Step3 部署数据库并将zabbix相关文件导入

#配置 Mariadb yum源
cat > /etc/yum.repos.d/mariadb.repo << EOF
[mariadb]
name = MariaDB
baseurl = http://mirrors.aliyun.com/mariadb/yum/10.5/centos7-amd64/
gpgkey = http://mirrors.aliyun.com/mariadb/yum/RPM-GPG-KEY-MariaDB
gpgcheck = 1
enabled=1
EOF#安装mariaDB
yum install -y mariadb-server mariadb#启动
systemctl enable --now mariadb

在这里插入图片描述

#初始化数据库
mysql_secure_installation
分别输入 回车 -> n -> Y (设置root密码,如abc123) -> 后面一路 Ymysql -u root -pabc123

在这里插入图片描述

#创建数据库并指定字符集
create database zabbix_proxy character set utf8 collate utf8_bin;#创建 zabbix 数据库用户并授权
grant all on zabbix_proxy.* to 'zabbix'@'localhost' identified by 'zabbix';
grant all on zabbix_proxy.* to 'zabbix'@'%' identified by 'zabbix';
flush privileges;
#导入数据库信息
rpm -ql zabbix-sql-scripts 		#查询 sql 文件的位置cat /usr/share/zabbix-sql-scripts/mysql/proxy.sql | mysql -uroot -pabc123 zabbix_proxy

Step4 修改zabbix-proxy的配置文件,启动服务

#修改 zabbix-proxy 配置文件
vim /etc/zabbix/zabbix_proxy.conf
Server=192.168.2.100				#32行,指定 zabbix 服务端的 IP 地址
Hostname=zbx-proxy					#42行,指定当前 zabbix 代理服务器的主机名
DBPassword=zabbix					#194行,指定当前数据库 zabbix 用户的密码

在这里插入图片描述
在这里插入图片描述

#启动 zabbix-proxy
systemctl enable zabbix-proxy --now;systemctl status zabbix-proxy

在这里插入图片描述

Step5 在所有主机上配置 hosts 解析

vim /etc/hosts
192.168.2.100 zbx-server
192.168.2.102 zbx-agent01
192.168.2.103 zbx-agent02
192.168.2.106 zbx-proxy

在这里插入图片描述

Step6 在 Web 页面配置 agent 代理

点击左边菜单栏【配置】中的【动作】,勾选自动注册规则,点击 禁用
点击左边菜单栏【配置】中的【主机】,勾选原有的客户端主机,点击 删除

在这里插入图片描述
在这里插入图片描述

点击左边菜单栏【管理】中的【agent代理程序】,点击【创建代理】
【agent代理程序名称】输入 zbx-proxy
【系统代理程序模式】选择 主动式
【代理地址】输入 192.168.2.106
点击 【添加】

在这里插入图片描述

Step7 在客户端修改 agent2 配置文件

vim /etc/zabbix/zabbix_agent2.conf
......
Server=192.168.2.106		#80行,指定 zabbix 代理服务器的 IP 地址
ServerActive=192.168.2.106		#120行,指定 zabbix 代理服务器的 IP 地址

在这里插入图片描述
在这里插入图片描述

Step8 在 Web 页面添加客户端主机

#zbx-agent01
点击左边菜单栏【配置】中的【主机】,点击【创建主机】
【主机名称】输入 zbx-agent01
【可见的名称】输入 zbx-agent01
【模板】搜索 Linux ,选择 Linux by Zabbix agent
【群组】选择 Linux server
【Interfaces】选择 客户端,【IP地址】输入 192.168.2.102,【端口】输入 10050
【由agent代理程序监测】选择 zbx-proxy
点击 【添加】

在这里插入图片描述
在这里插入图片描述
在这里插入图片描述

Step9 分别在客户端和代理服务器上重启服务

systemctl restart zabbix-agent2systemctl restart zabbix-proxy
等待一段时间后,点击左边菜单栏【配置】中的【主机】刷新,查看客户端主机监控状态正常

在这里插入图片描述

Step10 在代理服务器查看日志

tail -f /var/log/zabbix/zabbix_proxy.log

在这里插入图片描述

三、Zabbix 高可用集群(Zabbix HA)

在这里插入图片描述
在这里插入图片描述

Zabbix提供了一个本地的高可用性解决方案,方便设置,不需要任何HA专业知识也可以完成,本地Zabbix HA对于防止Zabbix server的软件/硬件故障或减少维护停机时间是有用的。

官方的高可用仅仅针对 Zabbix Server 部分,数据库部分和前端部分需要自行采用各自领域的高可用解决方案。

Zabbix HA最少需要2个Zabbix Server节点即可实现HA集群高可用及故障转移。

在同一个Zabbix HA集群中,只有一个实例或节点处于active(活动)状态,standby(备用)节点不进行数据收集、处理或其他任务,并且不监听端口,并保持一个最少的数据库连接。

HA节点分为以下几种状态:

  • Active(活动)
  • Standby(备用)
  • Unavailable(不可用)
  • Stopped(停止)

四、部署 Zabbix 高可用集群

在这里插入图片描述

ServerIP Address
zabbix-server01192.168.2.100
zabbix-server02192.168.2.105
zabbix-agent01192.168.2.102
zabbix-agent02192.168.2.103

4.1 服务端配置

zabbix-server01zabbix-server02都要部署zabbix服务端,部署过程详见上一篇博客

默认情况下,HA 是关闭的。

HA 部分的配置在配置文件的最下面:High availability cluster parameters 部分。

Step1 主节点 Zabbix Server 配置

在这里插入图片描述

#主节点 Zabbix Server 配置
vim /etc/zabbix/zabbix_server.conf
......
DBHost=192.168.2.100
DBName=zabbix
DBUser=zabbix
DBPassword=zabbix
......
HANodeName=zbx-server01					#设置为当前节点主机名
NodeAddress=192.168.2.100:10051			#设置为节点IPsystemctl restart zabbix-server

在这里插入图片描述
在这里插入图片描述
在这里插入图片描述

#主节点给数据库授权远程登录权限
mysql -uroot -pabc123
GRANT all ON zabbix.* TO 'zabbix'@'%' IDENTIFIED BY 'zabbix';
FLUSH PRIVILEGES;

在这里插入图片描述

Step2 备节点 Zabbix Server 配置

在这里插入图片描述

#备节点 Zabbix Server 配置
vim /etc/zabbix/zabbix_server.conf
......
DBHost=192.168.2.105 #87 
DBName=zabbix #99
DBUser=zabbix #115
DBPassword=zabbix #123
......
HANodeName=zbx-server02
NodeAddress=192.168.2.105:10051systemctl restart zabbix-server

在这里插入图片描述
在这里插入图片描述

Step3 主备节点添加监控主机

以主节点添加zbx-agent01为例,其余添加过程相同。

点击左边菜单栏【配置】中的【主机】,点击【创建主机】

在这里插入图片描述

【主机名称】输入 zbx-agent01
【可见的名称】输入 zbx-agent01-192.168.2.102
【模板】搜索 Linux ,选择 Linux by Zabbix agent
【群组】选择 Linux servers
【Interfaces】点击添加 客户端
【IP地址】输入 192.168.2.102

在这里插入图片描述

效果图

在这里插入图片描述
在这里插入图片描述

Step4 查看高可用集群状态

打开Web页面
选择报表-->系统信息
查看高可用集群项是否已经启用

在这里插入图片描述
在这里插入图片描述

4.2 客户端配置

Step1 修改agent01和agent02的配置文件

需要在agent配置文件将所有的Server节点地址配置到ServerServerActive

vim /etc/zabbix/zabbix_agent2.conf 
......
Server=192.168.2.100,192.168.2.105,192.168.2.102,192.168.2.103
ServerActive=192.168.2.100;192.168.2.105;192.168.2.102;192.168.2.103
#注意,ServerActive 的连接符是‘;’ ,而不是‘,’

在这里插入图片描述
在这里插入图片描述
在这里插入图片描述

在这里插入图片描述

systemctl restart zabbix-agent2.service

Step2 查看Web页面

在这里插入图片描述

4.3 故障模拟和效果测试

模拟zabbix-server出现故障,观察能否自动故障切换

Step1 模拟server节点出现故障,观察Web前端页面

#切换到zabbix-server01
systemctl stop zabbix-server

在这里插入图片描述

Step2 观察能否故障切换

在这里插入图片描述

在这里插入图片描述

控数据是可以正常采集的,说明Zabbix HA集群已经自动完成了故障切换

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.hqwc.cn/news/130991.html

如若内容造成侵权/违法违规/事实不符,请联系编程知识网进行投诉反馈email:809451989@qq.com,一经查实,立即删除!

相关文章

修改ubuntu服务器fs文件最大打开数

起因 在对项目进行压测的时候&#xff0c;请求异常 java.net.SocketException: socket closed&#xff0c;查看nginx代理服务器的日志。tail -f -n500 /var/log/nginx/error.log 显示 文件打开数太多socket() failed (24: Too many open files) while connecting to upstream …

APK大小缩小65%,内存减少70%:如何优化Android App

APK大小缩小65&#xff05;&#xff0c;内存减少70&#xff05;&#xff1a;如何优化Android App 我们一直在努力为我们的Android应用程序构建MVP产品。在开发MVP产品后&#xff0c;我们发现需要进行应用程序优化以提高性能。经过分析&#xff0c;我们发现了以下可以改进的应用…

如何在 PyTorch 中冻结模型权重以进行迁移学习:分步教程

一、说明 迁移学习是一种机器学习技术&#xff0c;其中预先训练的模型适用于新的但类似的问题。迁移学习的关键步骤之一是能够冻结预训练模型的层&#xff0c;以便在训练期间仅更新网络的某些部分。当您想要保留预训练模型已经学习的特征时&#xff0c;冻结至关重要。在本教程中…

提取log文件中的数据,画图

要提取的log格式如下&#xff1a; 代码如下&#xff1a; import reimport matplotlib.pyplot as plt import numpy as npimport argparse from os import path from re import searchclass DataExtractor(object): DataExtrator class def __init__(self, infile, keyword, out…

2023年中国牙线市场规模、竞争现状及行业需求前景分析[图]

牙线是由合成纤维或其他材料制成&#xff0c;或添加香料、色素、活性成分等&#xff0c;用来清洁牙齿邻面附着物的线。能够有效包裹牙齿&#xff0c;对于清洁平面/凸起牙面和牙齿邻接面的牙菌斑效果很好&#xff0c;还可以实现对于牙缝间食物/异物的剔除&#xff0c;有效清洁口…

SRE实战:如何低成本推进风险治理?稳定性与架构优化的3个策略

一分钟精华速览 SRE 团队每天面临着不可控的各类风险和重复发生的琐事&#xff0c;故障时疲于奔命忙于救火。作为技术管理者&#xff0c;你一直担心这些琐事会像滚雪球一样&#xff0c;越来越多地、无止尽地消耗你的团队&#xff0c;进而思考如何系统性地枚举、掌控这些风险&a…

01 初识FPGA

01 初识FPGA 一.FPGA是什么 FPGA&#xff08;Filed Programmable Gate Array&#xff09;&#xff0c;现场可编程门阵列&#xff0c;一种以数字电路为主的集成芯片&#xff0c;属于可编程逻辑器件PLD的一种。 1.1 两大巨头 Xilinx(赛灵思)Altera&#xff08;阿尔特拉&#…

【Azure 架构师学习笔记】-Azure Data Factory (5) --Data Flow

本文属于【Azure 架构师学习笔记】系列。 本文属于【Azure Data Factory】系列。 接上文【Azure 架构师学习笔记】-Azure Data Factory (4)-触发器详解-事件触发器 前言 Azure Data Factory&#xff0c; ADF 是微软Azure 的ETL 首选服务之一&#xff0c; 是Azure data platfor…

MongoDB——centOS7环境Mongodb权限管理(图解版)

目录 一、MongDB权限概述1.1、MongDB权限概述1.2、MongDB权限列表 二、Mongodb权限管理示例2.1、创建账号2.1.1、创建管理员用户2.1.2、开启认证2.1.3、创建普通账号 一、MongDB权限概述 1.1、MongDB权限概述 mongodb是没有默认管理员账号&#xff0c;所以要先添加管理员账号…

2023版 STM32实战9 RTC实时时钟/闹钟

RTC简介 实时时钟是一个独立的定时器。RTC模块拥有一组连续计数的计数器&#xff0c;在相应软件配置下&#xff0c;可提供时钟日历的功能。修改计数器的值可以重新设置系统当前的时间和日期。 注意事项 -1- 要手动配置中断寄存器 -2- 需要等待写操作完成 -3- 时钟闹钟中段…

【Python 零基础入门】基础语法

【Python 零基础入门】第四课 基础语法 【Python 零基础入门】第四课 基础语法怎么写 Python 代码缩进注释Python 标识符规则Python关键字代码行和块导包 字符串操作字符串连接字符串的其他常用方法 循环for 循环while 循环 判断语句比较运算符逻辑运算符if 判断三元表达式brea…

机器学习(21)---召回率(recall)、精度(precision)和准确率(accuracy)

文章目录 1. 分布不平衡的数据集2. TP、TN 、FP 、FN3. 混淆矩阵4. 各自的计算公式5. 例题应用 1. 分布不平衡的数据集 1. 精度&#xff08;precision&#xff09;和召回率&#xff08;recall&#xff09;是衡量机器学习模型性能的重要指标&#xff0c;特别是数据集分布不平衡的…