背景
在分布式搜索引擎系统(如 Easysearch
、Elasticsearch
和 OpenSearch
)中,性能监控至关重要。为了确保系统的高效运行和资源的合理分配,我们通常需要关注一段时间内关键资源的使用情况,特别是索引、节点和分片的内存与 CPU 占用情况。
通过对这些关键指标进行 TopN 查询,我们能够识别出资源使用最多的节点、索引或分片,帮助我们快速定位潜在的性能瓶颈或过度负载的区域。这种实时监控不仅有助于优化集群的整体资源分配,还能在出现性能问题时迅速采取调整措施,避免对服务产生较大影响。
什么是 Console 的 TopN ?
TopN 是 Console v1.28.0 中新增的主要功能,用于快速识别排名前 N 的关键指标数据点。它通过强大的多维度指标分析能力,帮助用户更高效地进行性能优化与决策分析。
随着集群节点数和索引数的不断增加,传统的监控方式已难以满足高效定位问题的需求。在过去,Console 的监控分析功能更多聚焦于单个节点或单个索引的多维指标,但当用户需要快速从所有节点或索引中找到 最忙、最慢 或 最大 的关键数据点时,往往显得非常不便。
尽管 Console 提供了强大的高级分析功能,但面对大量指标时,加载速度较慢、指标过于密集,难以直观发现问题。TopN 的推出,旨在解决这些痛点,为用户提供更加精准、高效的监控分析能力。
INFINI Console 提供的 TopN 指标功能,能够基于 内存占用、CPU 使用 等关键指标,帮助用户全面了解集群的性能状态。只需通过简单的操作,用户可以快速识别出 TopN 索引、节点或分片,从而进一步优化资源配置和系统性能。
功能介绍
点击左侧菜单 平台管理 》监控报表
,选择 TopN Tab 页,然后您会看到如下界面:
如果我们选中的集群使用的是 INFINI Agent 采集的指标,这里我们看到的将是 节点 和 分片 两个 Tab 页。
当前 Agent 采集模式不支持查看 TopN 索引,未来将增加此功能支持。
这里我们依次按如下步骤操作
- 索引 Tab 页
- 配置 top 值,默认 15
- 选择面积指标,这里我们选择
Segment Memory
- 选择颜色指标(可选操作),这里我们选择
Index Storage
- 点击搜索按钮
然后我们可以看到内存占用最为严重的 15 个索引,如下所示:
默认我们使用面积指标进行 Top 排序,如果需要按选中的颜色指标排序,可以点击上图中的交换按钮来实现
如果您不是通过全新安装的 INFINI Console, 而是通过旧版本升级的,那么您需要如下额外操作才能正常使用,具体操作参见:升级说明。
如果您想查看简洁模式,可以点击表格模式切换,如下图所示:
总结
INFINI Console 的 TopN 指标功能 使得用户能够更加高效地进行性能监控与分析,尤其是在面对大量节点、索引和分片时。通过直观的 TopN 排序,用户可以快速识别出最占资源的节点、索引或分片,帮助提前发现性能瓶颈并进行及时优化。无论是在 内存占用、CPU 使用 还是 索引存储 等关键指标上,TopN 功能都能提供清晰的视图,从而促进系统资源的合理分配和性能的持续提升。
随着集群规模的不断扩大,传统的监控方式可能显得繁琐且低效。INFINI Console 的这一新功能通过简洁易用的操作界面和强大的多维度数据分析能力,极大提升了性能优化和决策分析的效率。在实际使用中,用户可以根据需求灵活配置,实时获取最需要关注的资源消耗点,进而采取优化措施,保证系统的稳定性和高效性。
关于 INFINI Console
INFINI Console 是一款非常轻量级的多集群、跨版本的搜索基础设施统一管控平台。通过对流行的搜索引擎基础设施进行跨版本、多集群的集中纳管,企业可以快速方便的统一管理企业内部的不同版本的多套搜索集群。INFINI Console 还可以对集群内的索引及数据进行操作管理,可以配置灵活的告警规则,可以指定统一的安全策略,可以查看各个维度的日志和审计信息,真正实现企业级的搜索服务平台化建设和运营。
INFINI Console 现已开源(https://github.com/infinilabs/console),如有相关问题或建议,欢迎提交 PR 或 Issue,一起参与开源共建!