实例管理
该功能用来查看和管理所有计算节点集群中存储节点所在实例的主从关系。实例信息可以通过主机名、端口号、和存储节点版本号进行筛选。
实例管理信息
功能入口: 登录管理用户界面->实例管理
实例管理信息以一个存储节点为单位显示一条记录,可对具体的存储节点进行“解除Master、添加Slave、配置高权限账号”等操作。
-
解除Master: 点击【解除Master】,程序将停止此实例的复制,并且执行清空复制信息操作(stop slave; reset slave all;)
-
添加Slave: 点击【添加Slave】可为此实例添加从机,在从机上执行“change master”操作时将此实例设置为主机。选择从机时只可以勾选没master的实例,已经配置了master的实例需要先解除master
- 配置高权限账号: 主要用于配置具备更改主从权限的账号用于解除master和添加slave操作。高权限账号需要拥有“super, replication slave, replication client, create user, reload”权限,如果存储节点没有具备这些权限的账户则需要去实例中添加
可点击【复制】按钮,复制添加高权限账户的SQL语句到实例中执行。
“主从复制用户名”、“主从复制密码”是高权限账户为实例搭建主从关系时自动创建的用户,默认创建复制账户“hotdb_repl”密码“hotdb_repl”且只具有“replication slave,replication client”权限。用户也可对创建的复制账户自定义用户名和密码。
事件
历史事件
历史事件是记录与展示管理平台平台级的历史信息的功能,包括:执行任务完成通知、定时检测异常通报、平台触发预警提示等。该界面同时支持历史事件数据的导出。
告警级别说明
告警级别分为“严重”、“重要”、“一般”三个级别
告警类型说明
(一)平台配置库状态检测
说明:该项检测记录平台配置库是否存在服务异常或主从复制状态异常。当执行了一次平台配置库状态检测,将记录一个历史事件,记录检测结果。
告警项:平台配置库服务故障、平台配置库复制异常、平台配置库复制延迟
(二)定时检测异常监控
说明:该项检测记录平台定时检测是否存在异常。当执行了一次定时检测,将记录一个历史事件,记录检测结果。
告警项:平台配置数据备份情况、机房切换预检测。
通知策略
管理平台支持通过邮件/短信/APP/站内通知的方式对集群运行中发生的故障或异常问题进行告警提示,用户可在“事件-通知策略”菜单页面下配置详细的告警通知方式。目前管理员用户界面支持平台配置库状态监控和定时检测异常监控。
Note:
为确保告警通知信息的成功发送,用户需同时在“设置-通知设置”中配置告警通知的发送参数,并确保对应监控项打开。
(一)添加通知策略
管理员用户界面的添加通知策略方式与普通用户一致,可配置邮件、短信、APP、站内通知,并设置通知时间段。具体操作方法可参考普通用户角色下的添加通知策略。
(二)监控项说明
每项监控项中的下拉框可选择监控项的告警级别,分为严重告警、重要告警和一般告警;用户可自定义告警级别,在发送通知时不同的告警类型会按照设置的等级进行提醒;邮件通知时,会按照颜色区分告警等级,严重告警为红色,重要告警为橙色,一般告警为黄色。
- 平台配置库信息监控
说明:默认为重要告警,包括平台配置库服务鼓掌、平台配置库复制异常、平台配置库复制延迟。
- 定时检测异常监控
说明:默认为一般告警,包括平台配置数据备份情况检测、机房切换预检测。
平台设置
平台设置可以配置登录验证码、平台访问是否采用https加密、定时检测、以及告警通知等。
登录验证码
用户登录管理平台增加了验证码的校验,当前可支持邮件、短信的验证方式登录。
功能入口: 登录管理用户界面->设置->登录验证码
通过页面右上角的验证码发送方式,用户可自行设置登录验证模式,默认不使用验证码。
说明:若非tar包更新或更新后还原了application文件,则需增加配置hotdb.management.enableloginverification=0(该参数0是不发送,1是邮件发送,2是短信发送)与页面右上角验证码发送方式一致。
以下详细的邮件/短信发件箱参数设置,可参考设置-通知设置章节
邮件验证码
邮件验证码设置参数如下图所示:
填写相关参数,点击“测试”,测试成功后,开启邮件验证码方式,登录时即可发送验证码到登录用户的邮箱中。
测试邮件内容如下图所示:
短信验证码
短信验证码设置参数如下图所示:
首先用户在第三方短信服务平台(阿里云或联通)申请短信模板。
短信验证码内容模板:您登录数据库管理平台的验证码为xxxxxx。
短信模板配置说明:
-
阿里云:必须是已添加、并通过审核的短信模板。短信模板中必须将${verification_code}关键字作为变量进行配置。模板示例:您登录数据库管理平台的验证码为${verification_code}。
-
联通:必须提前将短信模板申请通过。且短信模板正文配置示例为:您登录数据库管理平台的验证码为{xxxxxx}。注意: 其中的{xxxxxx}代表短信模板中的变量部分,一个x代表一个字或者字符,{}为变量标识,实发变量字数小于等于x的个数,故x的位数必须配置足够位数,防止短信发送无法成功。
短信模板审核通过后填写相关参数,点击“测试”,测试成功后,会收到一条测试短信。开启短信验证码方式,登录时即可发送验证码到登录用户的电话号码上。开通短信验证码的登录页面与邮件验证码的登录页面相同。
测试短信内容如下图所示:
平台访问
用于配置是否启用https方式加密访问。
功能入口: 登录管理用户界面->设置->登录验证码
可配置是否开启https,是否同时支持http/https访问,https端口,秘钥文件,秘钥库密码等相关访问信息。若仅开启https访问,则通过http访问将会自动跳转到https的方式,修改访问方式后管理平台将自动重启。
机房切换预检测
机房切换预检测用于配置机房切换预检测的定时任务。包含定时检测计划和检测记录。
功能入口:登录管理用户界面->设置->机房切换预检测
定时检测计划:
单击“+”号增加一行定时计划。定时计划最多只能添加六条,可按照检测周期选择“每日”、“每周”、“每月”及时间;
- “选择集群”中仅显示同时包含中心机房和灾备机房的集群;
- 定时计划推荐与“事件-通知策略”功能相结合。通过添加邮件/短信/APP报警提醒策略,可在定时计划执行完成时对执行结果异常的进行报警;
- 添加、编辑、删除计划等操作会纳入“审计日志-管理员操作”,操作类型为“定时检测设置”;
- 定时计划的执行结果会纳入“事件-历史事件”,报警类型为“机房切换前预检测”
检测记录:
记录每一次的检测结果,包含时间、集群名称、检测结果和检测详情。用户可对正常、告警、异常状态的结果进行筛选。
通知设置
通知设置用于配置管理平台邮件/短信/APP通知信息的发送参数,以及设置监控项的通知开关和通知频率。 功能入口:登录管理用户界面->设置->通知设置
邮件通知设置
管理员可通过此页面配置邮件通知的参数信息,包括发件箱参数设置和邮件通知频率设置。
(一)发件箱参数设置
- 发信人名称:发信人的备注信息
- 发信人邮箱地址:发信人的完整电子邮箱地址
- 采用SSL与SMTP服务器端口:如果勾选采用SSL的勾选框,则SMTP服务器端口默认为 465;如果未勾选则SMTP服务器端口默认为 25,SMTP服务器端口也可编辑
- SMTP服务器地址:邮件服务器所在的地址,例如:smtp.exmail.qq.com
- SMTP验证:SMTP服务器是否要求验证,默认勾选。如果勾选——>SMTP用户名及SMTP密码为必填项;如果未勾选——>SMTP用户名、SMTP密码不可编辑(如果管理平台在邮箱服务器免密范围内,可不勾选SMTP验证)
- SMTP用户名:一般为发信人邮箱地址@的左侧部分,部分邮箱厂商要求填写完整的电子邮箱地址
- SMTP密码:SMTP用户密码,用于验证SMTP服务器用户的身份
(二)邮件通知频率设置
邮件通知频率设置控制邮件报警中对应项的邮件发送间隔时间。目前提供平台配置库状态监控和定时检测异常监控。
平台配置库状态监控
-
平台配置库状态监控项主要监控与管理平台配置库相关的异常情况,包括配置库服务状态、配置库主从复制状态、配置库数据备份异常
-
开关:默认开启
-
频率配置:可手动配置邮件通知的频率,默认为一分钟
定时检测异常监控
- 定时检测异常监控主要监控平台数据库数据备份情况和机房切换预检测
- 开关:默认开启
- 频率配置:实时通知,仅通知一次
短信通知设置
管理员可通过此页面配置短信通知的参数信息,包括短信通知基础设置、公共请求接口信息设置、短信发送接口信息设置、短信通知频率设置。
(一)短信通知及接口设置
可选择短信服务方式和通知渠道,默认为第三方服务平台的阿里云渠道,不同服务方式不同渠道的接口参数设置有所不同。具体配置方式请参考普通用户界面的短信通知设置。
(二)短信通知频率设置
短信通知频率设置控制短信告警发送间隔时间。目前提供平台配置库状态监控和定时检测异常监控。
平台配置库状态监控
平台配置库状态监控项主要监控与管理平台配置库相关的异常情况,包括配置库服务状态、配置库主从复制状态、配置库数据备份异常
- 开关:默认开启
- 频率配置:可手动配置短信通知的频率,默认为一分钟
定时检测异常监控
- 定时检测异常监控主要监控平台数据库数据备份情况和机房切换预检测
- 开关:默认开启
- 频率配置:实时通知,仅通知一次
APP通知设置
管理员可通过此页面配置APP通知的参数信息,包括APP通知设置、APP通知频率设置。
(一)APP通知设置
- 选择发送通知的APP:可选择企业微信或钉钉。
- 接口请求地址:输入在企业微信或钉钉群配置好的机器人接口地址。添加机器人接口地址生成请参考普通用户界面的APP通知设置。
(二)APP通知频率设置
APP通知频率设置控制报警中对应项的APP信息发送间隔时间,分为实时通知和阶段通知。实时通知在检测到监控项服务存在异常时立即发送APP信息提醒,而后若异常一直存在则按照频率定时发送APP信息提醒,直至异常被修复。阶段通知在检测到监控项服务异常时根据设置频率定时发送APP信息提醒,直至异常被修复。
- APP通知频率设置需配置通知策略后才能正常接收异常短信信息,且部分监控项根据定时检测设置中的异常检测频率执行异常检测,故建议定时检测频率应高于APP通知频率
- APP通知频率时间内,发生故障、修复、再次故障会再次提醒,故频率时间内可能收到多条相同故障的信息
站内通知设置
管理员可通过此页面配置站内通知的参数信息。