当前,无线网络已经成为企业信息化建设不可或缺的一部分,因其高效率、高可用和低成本的特性被广泛应用于IT基础设施建设中。如何保障网线网络的畅通和稳定,正在成为IT运维人员的一项重点任务。
面对无线网络的大规模和高复杂特点,北京智和信通无线网络运维方案以主动监控、实时告警、故障自愈、智能分析的运维管理方式,跟踪无线AC/AP设备的关键性能指标和运行态势,帮助运维人员更好地管理无线网络,更轻松地解决无线网络中的问题。
第1章 无线设备的监控范围与指标
智和信通方案将跨区域、跨厂商、跨型号的AC/AP设备纳入统一管理,针对无线AC控制器、瘦AP、胖AP采取差异化的监控策略,对其健康状态、响应时间、连接信息、流量数据等进行监控管理。
1.1.常见无线设备品牌支持
目前,已实现对国内外常见无线设备品牌,如:华为、锐捷、H3C、思科、TP-Link、Tenda、D-Link、NETGEAR、极进等,小众或较为老旧的品牌型号也可通过灵活可配的模型库进行扩展适配。
1.2.常见资源监测点和指标
智和信通全栈式智慧运维平台内置基础信息识别和CPU、内存、射频、关联站点数、连接用户数等多种资源监测点和对应的监测指标,未覆盖的资源和指标也可以通过模型库不断进行拓展。
设备类型 |
资源监测点 |
监测指标 |
无线AC |
基础信息 |
设备名称、品牌、型号MAC地址、序列号、版本信息、运行时间等 |
Ping |
状态、平均响应时间、丢包率、抖动等 |
|
CPU |
使用率等 |
|
内存 |
使用率、可用内存大小、总内存空间等 |
|
网络接口 |
状态、输入/输出流量、输入/输出带宽、输入/输出速率、丢包率、利用率、误码率等 |
|
瘦AP |
IP地址、设备名称、接口数量、内存大小、SSID、射频传输重传帧比率、射频传输错误帧比率、射频传输总帧数、关联的站点总数、关联失败的站点总数、当前连接用户数、当前断开连接用户数、成功验证的用户的在线时间、空口下行队列平均时延/丢包率、弱/一般/良好/优覆盖区占比等 |
|
电源 |
状态 |
|
SysLog |
监测SysLog事件日志 |
|
胖AP |
基础信息 |
设备名称、品牌、型号、MAC地址、序列号、版本信息、重启次数、运行时间等 |
Ping |
状态、平均响应时间、丢包率、抖动等 |
|
CPU |
使用率等 |
|
内存 |
使用率、可用内存大小、总内存空间等 |
|
电源 |
状态 |
|
用户接入 |
最大支持用户数、用户关联成功率、用户认证成功率、用户平均上线成功率、平均在线用户数、平均激活用户数、累计关联次数等 |
|
网络传输 |
状态、输入/输出流量、输入/输出带宽、输入/输出速率、空口上下行队列平均时延、空口上下行队列平均丢包率、丢包率、利用率、误码率等 |
|
信号覆盖 |
弱/一般/良好/优覆盖区占比等 |
|
SysLog |
监测SysLog事件日志 |
1.3.无线设备的品牌型号及指标扩展
方案采取用户自定义扩展无线设备的品牌、类型及其资源的方式,赋予用户强大的适配能力,最大可能地实现对不同时期、不同品牌、不同型号无线AC控制器、瘦AP、胖AP的管控。
支持自定义无线设备的类型、资源、故障监视器、性能监视器、TRAP监视器等,提供配置无线AC/AP设备的模板的功能,允许用户自定义无线设备的真实面板图。
第2章 无线AC/AP设备实时全面监控
随着无线网络在生产办公环境中的应用场景逐渐广泛,无线AC、胖瘦AP因其厂商众多、位置分散的特点,给运维工作带来了不小挑战。因此对其各项性能指标进行实时监控,发现性能瓶颈和潜在的故障风险。
2.1.无线AC/AP设备的可视化监控
2.1.1.设备自动发现
在网络可达范围内,仅需输入IP范围即可自动发现网络中的无线设备,识别其厂商、型号,生成资源逻辑拓扑或真实面板图,匹配故障与性能监视器。并自动识别AC控制器和无线AP、无线AP与终端设备间连接关系,生成可视化链路,通过可视拓扑动态展示无线AC、胖瘦AP运行状态。
2.1.2.自动生成AP设备点位拓扑
通过智能发现技术,快速识别无线AC控制器和胖瘦AP并通过多种方式进行管理。对于瘦AP可通过AC进行管理,并基于智和信通特有的拓扑技术,运维人员可以选择将瘦AP作为AC的资源或将其升级为设备节点进行管理,在瘦AP升级为设备节点后,即可在拓扑上直观显示。对于胖AP则可通过智和信通全栈智慧运维平台直接纳管。
智和信通全栈智慧运维平台具备强大的拓扑编辑能力,支持在平台内绘制拓扑背景,提供多种基础图形、文字、图片等素材。通过拓扑编辑构建AP点位图,直观展示AP安装位置和覆盖范围,以光效、颜色实时显示区域AP设备的运行状态。
2.1.3.资源逻辑与物理界面展示
在拓扑图的基础上,进一步展示无线AC控制器和胖瘦AP的细节,可以是其物理组件,也可以是用户定义的其他监控对象。提供资源逻辑拓扑,以图形方式展示内存、CPU、电源、用户接入、网络传输等信息,对设备进行细化监控,实时告警,对设备进行事前管理,降低故障发生率。
2.2.无线网络性能态势感知
实时监测并感知无线AC控制器和胖瘦AP的性能状态,多维度处理、分析、展示无线AC/AP设备的性能态势,实现“可观、可管、可控”。
2.2.1.全面监控性能
全面采集无线AC/AP设备的各项性能指标,如CPU使用率、内存使用率、用户关联成功率、用户认证成功率、网络带宽、电源状态等,并可按照时间范围、资源类型、性能指标等多种维度,以图形、表格等多种形式进行展示。
2.2.2.实时、历史性能分析
对实时、历史性能数据进行统计分析,通过曲线图、柱状图或表格等形象化地展示,按天、星期、月查看性能指标变化。运维人员能随时把握无线AC/AP设备的性能变化态势,防患于未然。
2.2.3.多设备的性能对比
支持选择多台无线AC/AP设备进行同维度性能数据分析,提供可视化性能对比视图,通过性能对比分析无线AC/AP设备的性能变化趋势。
2.3.日志与事件管理
接收无线AC/AP设备的主动发送如CPU信息、内存信息、端口UP/DOWN、AP死机日志、重复关联请求、未认证通过、认证失败、报文超时、AP重启失败等事件与日志消息,集中存储、解析处理后,将错误、告警、失败等异常信息及时地通知用户。通过统一界面集中管理事件与日志,提高其完整性和可追溯性,帮助用户快速定位问题并采取相应的解决措施。
2.4.故障告警与智能收敛
搭载多种告警机制,自定义配置告警阈值,具备主动的故障监控功能,从众多的事件和状态中,系统地将零散的状态信息,总结成为当前状态,并对异常状态进行告警,第一时间获取准确的告警信息,快速标示已执行操作的告警,迅速定位产生告警的AP设备。
采用自动去重、风暴抑制、关联聚合、维护期时间屏蔽、依赖屏蔽等多种智能告降噪机制,通过AI算法,对各类告警进行自动压缩收敛,减少90%的无效告警,抑制告警风暴,有效避免误报和漏报,直达故障根因。提升告警处理效率,极大降低因AP设备故障带来的损失。
2.5.自动巡检
可自定义巡检策略,预设执行时间进行自动化巡检,定期巡查无线AC控制器和胖瘦AP的实时运行状态,并向指定邮箱发送结果报告,把握网络运行中的易出现问题的环节,做到预防为先。可自行选择要统计的网络范围、无线AC/AP设备、设备资源类型、关联业务、关联链路等生成巡检报表。
第3章 统计报表和大屏展示
通过定义数据报表的能力,实现无线AC/AP设备的性能和状态的统计分析和灵活展现,通过同比、环比、TOPN等分析方式并结合报表排序规则、过滤规则等能力,周期自动生成报表,帮助用户更好地了解无线AC/AP设备的各项负载情况和运行态势,为优化资源配置和性能调整提供依据。
通过大屏展示核心运维数据态势,所有的网络故障与性能瓶颈都一目了然地呈现,大大降低了管理成本,同时也提高了运维人员处理故障的能力,节省的故障处理时间,为运维人员管理网络提供了可靠的保证。
第4章 AP设备的远程控制和编排式配置
方案提供AP设备的远程控制的能力,采用“监控+运维+控制”的方式,将不同类型、不同型号、不同厂商的AP设备统一纳入控制,集中管理。通过智能算法对AP设备的资源配置进行智能动态调整,以便更高效地利用资源,降低能耗。
4.1.AP设备的远程配置执行
将周期性、重复性、规律性的大量日常AP配置管理工作,如配置AP上线参数、修改AP名称、修改AP组、在线升级AP、切换AP运行模式、复位AP、恢复AP出厂设置、配置上报STA流量、配置AP流量限速、配置AP的LLDP等,转化为依托于平台的自动执行工作流,实现对无线AC/AP设备的批量、定时等自动化控制。
4.2.以配置AP流量限速为例
通过批量为AP设置智能流量控制限速值的方式,在大量的广播、组播和未知单播报文产生时,实现AP自动启动广播、组播和未知单播流量限速,且限速为配置的限速值的效果。从而保障网络稳定与流畅。
效果要求:当大量的广播、组播和未知单播报文产生导致AP的CPU繁忙,使入方向收包队列的buffer减少到一定阈值时,AP自动启动上行、下行的入方向流量限速,限速为配置的限速值。
第一步:统一纳管。将需要管理的瘦AP及其AC控制器或胖AP纳入平台进行监控管理。
第二步:策略流程编排。进入安管模块的运维编排菜单,创建AP流量限速策略。通过进行策略节点拖拽编排的方式规划自愈流程。
第三步:配置触发方式。方式支持通过定时执行和手动执行两种方式触发进行,根据AP日常管理维护要求,我们选择通过手动执行方式触发策略。
第四步:批量或单独执行。在拓扑选中要执行的设备通过右键快速下发策略,或通过列表视图多选设备批量执行。
4.3.配置备份、对比与恢复
支持配置文件批量备份、下载、周期性备份、查看等,对无线AC和AP的多个备份文件进行对比。定期自动对无线AC和AP设备的配置进行巡检备份,并可进行对比分析,为用户管理网络做出合理的建议提供数据支撑,支持进行已备份配置间的对比分析和针对性的配置恢复。
第5章 资产CMDB管理
通过构建无线AC/AP设备的资产数据库,将无线AC/AP设备的信息包括资产编号、资产名称、品牌型号、来源、购买日期、安装方式负责人等信息以及维保到期时间、维保单位等维保信息统一管理。
分别配置AC控制器和AP的资产管理模板,细化资产类别,实现资产分类管控。如AC 资产模板增加字段:适用面积、总带机量、缺省可管理AP数、最大可配置AP数、最大可管理AP数、最大可管理用户数、供电方式、WAN口、LAN口等信息。而AP则关注安装方式、射频规格、传输速率、最大发射功率、用户数限制等信息。
动态感知纳入监控的无线AC/AP设备的运行状态,并以图谱的方式呈现无线AC/AP设备的与其他资产、配品配件、机房、机柜、网络链路、使用人等静态关联关系。
第6章 应用价值
通过北京智和信通无线网络运维方案实现无线AC和AP设备的统一管理,并在统一管理的基础上,智和信通全栈运维平台进一步提供了详尽的监视器功能。这些监视器实时对组网设备进行监控管理,无论是设备运行状态、在网信息,还是接入AP数、使用用户数等关键信息,都能一目了然地展现在集中管理视图中。这使得运维人员能够随时掌握网络设备的运行状况,及时发现并解决潜在问题。
为了应对可能出现的网络中断问题,智和信通无线网络运维方案具备实时网络流量监测能力。通过对网络流量的实时监测,平台能够及时发现流量异常情况,并在流量超过安全带宽限制时采取相应的措施,从而有效减少因流量过大导致的连接中断问题。
同时,基于强大的可视化引擎,将复杂的网络以可视化拓扑的方式进行呈现。并且在拓扑样式的选择上,提供给用户树形结构、平面结构、 区域地图、2.5D机房图、机架图、 面板图等多种样式,满足各类应用场景需求。
在AC或AP设备出现故障时,通过光效、颜色等效果在拓扑图上精准而直观地展示故障位置,帮助运维人员快速定位网络异常节点。这种视觉化的呈现方式,极大的缩短了运维人员排查故障的时间,使得其能够迅速定位到网络异常的节点,进而有针对性地采取措施。
在排障过程中,提供了基于故障设备的链路一键排障功能。运维人员只需轻轻一点,平台便能自动分析故障链路,提出相应的排障建议,甚至能够自动执行排障操作,极大地提高了排障效率。而更加智能的场景化运维编排能力,不仅可以实现对AC或AP设备的远程控制,在此基础上也可针对工作中常见的故障问题和业务配置规划自动执行的编排流程,使得故障自愈和业务批量、快速处置成为可能,大大提高了运维工作的效率和准确性。