17个需要监控的 Linux 日志文件,如何通过它们查漏补缺?

news/2025/3/27 0:37:23/文章来源:https://www.cnblogs.com/xxllx/p/18788891
监控领域,通常最应该监控的是业务的北极星指标、应用的RED指标,因为这些指标直接关联业务营收和用户体验。对于下层的机器类指标、日志等,通常也会配置告警规则,但是级别通常比较低,这类告警的核心价值相当于提前从纷繁复杂的指标、日志数据中提取了一些重点信息,帮助我们在故障时优先读取这些少量的有价值的信息,提升故障定位效率。
系统日志是最基础的监控数据,Linux 系统日志文件通常存储在 /var/log 目录下,不同的日志文件记录了不同的信息,本文会罗列一些常见的 Linux 日志文件,以及它们的作用。帮你查漏补缺。

1、/var/log/syslog 或 /var/log/messages

系统日志文件捕获广泛的系统消息,包括来自各种守护进程、系统进程和内核消息的消息。它们作为系统活动的综合记录。
对于一般的 Linux 日志分析至关重要,因为它们包含有关系统错误、警告和其他重要事件的信息(常见的,比如 OOM 的日志)。这些日志有助于诊断影响系统稳定性和性能的问题。

2、/var/log/auth.log 或 /var/log/secure

auth.log 或 secure 日志记录认证相关的事件,例如成功和失败的登录尝试、用户权限更改和其他身份验证机制。对于识别未经授权的访问尝试和潜在的安全漏洞至关重要。通过此日志我们可以了解到谁访问系统以及何时访问系统。

通过 grep “Failed password” /var/log/auth.log 可以查看登录失败的记录,那自然也可以把Failed password 作为关键词配置告警规则。

3、/var/log/kern.log

kern.log 包含了 Linux 内核消息。它包括有关硬件事件、驱动程序消息和其他内核相关活动的信息。内核日志对于诊断与硬件和驱动程序相关的问题至关重要,这对于系统稳定性和性能至关重要。
当然,也可以通过 dmesg 命令查看内核日志,比如 dmesg -T | grep -i error 可以查看内核错误。同样的,也可以把 error 作为关键词配置告警规则。

4、/var/log/boot.log

boot.log 记录与系统启动过程相关的事件,包括启动的服务及其状态。此日志对于排查启动问题至关重要。它有助于识别启动失败的服务、启动过程的延迟以及其他与启动相关的问题。

比如使用 less /var/log/boot.log 浏览这个文件,查找标有“FAILED”或“ERROR”的行,以找出启动失败的服务。

5、/var/log/dmesg

dmesg 日志包含来自内核 ring buffer 的消息,其中包括有关硬件组件、驱动程序和内核初始化的信息。此日志对于硬件诊断和监控系统性能很有价值。它有助于识别硬件故障和性能瓶颈。

6、/var/log/cron

cron 日志记录的是计划任务的运行情况。有助于诊断任务调度和执行方面的问题。

7、/var/log/maillog 或 /var/log/mail.log

Mailog 或 mail.log 捕获与邮件服务器活动相关的事件,包括电子邮件投放和错误。监控邮件日志对于邮件服务器管理和解决电子邮件投递问题至关重要。它们有助于确保组织内外的可靠通信。
使用 tail -f /var/log/maillog 检查邮件日志,查找包含“error”或“failed”的行以识别问题。

8、/var/log/httpd/access.log 或 /var/log/apache2/access.log

此日志记录对 Web 服务器的所有访问请求,包括 IP 地址、请求类型和响应状态等详细信息。访问日志对于监控 Web 流量和识别潜在安全威胁至关重要。它们提供对访问者行为的洞察,并有助于优化网站性能。

9、/var/log/httpd/error.log 或 /var/log/apache2/error.log

此日志捕获 Apache Web 服务器遇到的错误,包括 Apache 服务器配置问题、应用程序错误和客户端相关问题。错误日志对于诊断 Web 服务器及其上运行的应用程序的问题至关重要。它们有助于确保网站和 Web 服务的顺利运行。

10、/var/log/NGINX/access.log

此日志记录对 NGINX Web 服务器的所有访问请求,包括 IP 地址、请求方法、响应状态和用户代理等详细信息。监控 NGINX 访问日志对于了解 Web 流量和用户行为以及识别潜在的安全威胁(如 DDoS 攻击或未经授权的访问尝试)至关重要。

使用 tail -f /var/log/NGINX/access.log 实时监控访问,分析这些日志有助于优化Web性能和改进安全措施,像 goaccess 这样的工具可以提供实时Web日志分析和可视化报告。

11、/var/log/NGINX/error.log

此日志捕获 NGINX Web 服务器遇到的错误,包括配置问题、服务器错误和与客户端相关的问题。错误日志对于诊断Web服务器及其托管的应用程序的问题至关重要。它们通过提供对问题所在和时间的见解来帮助确保您的网站和Web服务的顺利运行。

12、/var/log/mysql.log 或 /var/log/mysql/error.log

此日志记录与MySQL数据库服务器相关的活动和错误,包括查询、连接和性能问题。监控MySQL日志对于数据库管理、故障排除问题和确保高效的数据库操作至关重要。

13、/var/log/ufw.log

ufw.log 记录与简单防火墙(UFW)相关的事件,包括允许和拒绝的连接尝试。防火墙日志对于监控网络安全和检测未经授权的访问尝试至关重要。它们有助于维护安全的网络环境。
通过 tail 等命令查看 UFW 日志,比如查找来自同一IP的重复拒绝尝试,这可能表明存在安全威胁。定期审查有助于确保防火墙规则有效。

14、/var/log/audit/audit.log

审计日志包含来自审计守护程序的详细记录,捕获广泛的系统事件以用于安全审计和合规性目的。审计日志对于详细的安全分析和遵守法规至关重要。它们提供了系统活动和更改的全面视图。
使用aussearch 和 auReport 工具从审计日志中搜索和生成报告。定期审计有助于确保系统安全和符合策略。

15、/var/log/daemon.log

守护进程日志记录来自系统守护进程的消息,这些守护进程是系统上运行的后台服务。守护程序日志对于监控后台服务的运行状况和性能至关重要。它们有助于解决服务操作问题。

16、/var/log/btmp

Btmp 日志记录失败的登录尝试,提供未经授权的访问尝试的记录。Btmp对于安全监控至关重要。它有助于检测和响应未经授权的访问尝试,增强系统安全性。
使用lastb 命令查看失败的登录尝试。

17、/var/log/wtmp

wtmp 日志记录登录和注销事件,跟踪系统上的用户活动。wtmp 对于跟踪用户行为和了解系统使用模式很重要。它有助于审核用户活动和检测异常。

使用 last 命令查看登录历史记录。分析模式以确保用户遵循预期行为并检测任何可疑活动。

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.hqwc.cn/news/904696.html

如若内容造成侵权/违法违规/事实不符,请联系编程知识网进行投诉反馈email:809451989@qq.com,一经查实,立即删除!

相关文章

更换数据库连接池失败

更换数据库连接池失败 将数据库连接池更换为druid,一直无法更换,保持默认的HiKari原因: 配置文件代码错误,在下图中,可以看见一个黄线的警告,这里出现了关键词错误.这个错误是导致出现配置失败的原因. 教训:配置文件的警告需要引起足够的重视.

SANA-Sprint:基于连续时间一致性蒸馏的单步扩散模型,0.1秒即可生成图像

扩散模型已成为现代文本到图像 (T2I) 生成技术的核心,能够生成高质量图像,但其迭代式推理过程导致生成速度缓慢。多数模型通常需要 20–50 个去噪步骤,这严重制约了其在实时应用中的部署。 现有的蒸馏技术旨在加速扩散模型的采样过程,然而,这些方法往往会引入稳定性问题,…

华为无线网络射频调优及WLAN跨VLAN的三层漫游示例

1.业务需求企业用户通过WLAN接入网络,以满足移动办公的最基本需求。 在覆盖区域内移动发生跨VLAN的漫游时,不影响用户的业务使用。2.组网需求AC组网方式:旁挂三层组网。DHCP部署方式:AC作为DHCP服务器为AP分配IP地址。 汇聚交换机SwitchB作为DHCP服务器为STA分配IP地址。业…

大型通用电子制造执行系统(MES)

​简介:系统参考西门子MOM智能制造Opcenter工业软件制造执行系统Camstar电子套件人机料法环数据建模业务对象和车间生产执行事务逻辑,采用面向对象分层设计与C#编程开发:包含电子制造企业人机料法环业务数据建模实体对象,数据实体持久化映射,数据工厂会话配置,车间生产服务…

物料需求波动大、生产计划变化频繁?一文教你用工厂ERP系统MRP精确计算生产物料!

今天咱们来聊一聊一个大多数工厂都会遇到的问题: 物料需求波动大 和 生产计划变化频繁 。 这些问题可能让你在生产过程中经常“踩雷”,比如物料没采购够,生产停工; 或者物料买多了,库存积压,浪费了钱。有没有办法避免这些问题呢? 答案是: 有 !那就是通过工厂的 ERP系统…

docker使用GPU总结

在docker容器中使用显卡 一 docker19.03以前的事情 1.1 指定显卡硬件名 最初的容器中使用显卡,需要指定硬件名。经历了两种方式使用lxc驱动程序运行docker守护进程,以便能够修改配置并让容器访问显卡设备(非常麻烦,参考链接中最久远的回答)Docker 0.9中放弃了lxc作为默认执…

掌握 K8s Pod 基础应用 (二)

Pod生命周期 我们一般将pod对象从创建至终的这段时间范围称为pod的生命周期,它主要包含下面的过程:pod创建过程运行初始化容器(init container)过程运行主容器(main container)容器启动后钩子(post start)、容器终止前钩子(pre stop)容器的存活性探测(liveness prob…

叉车人员防撞报警系统

叉车人员防撞报警系统采用机器视觉图像感知技术,通过人工智能深度学习技术,对行人和车辆的精确检测,叉车人员防撞报警系统实现对人体和车辆检测分析识别,在机器视觉图像景中,通过特征识别算法建立人体和车辆图像模型,完成自动识别目标,并能以视觉图像智能分析精确区分干…

课堂在线点名助手

适合老师上课随机提问学生的小工具。前情概要 为提高程序的普适性,学生姓名用学号代替。 在线点卯在线提问点名助手body0 { font-family: Arial, sans-serif; background-image: url(https://img2024.cnblogs.com/blog/992978/202503/992978-20250324092106498-1518746661.jpg…

随堂笔记之Java方法

此内容源自B站狂神说Java基础的课后笔记与总结,用于复习和查看,因此写得比较简陋,不太适合萌新学习 方法定义方法调用 调用方法:对象名.方法名(实参列表)方法返回一个值的时候,方法调用通常被当做一个值 方法返回值是void,方法调用是一条语句*值传递和引用传递: Java全…

3.24

Android Studio 启动模拟器出现“Timed out after 300seconds waiting for emulator to come online“解决方案 问题: Timed out after 300seconds waiting for emulator to come online.**解决方法: 检查自己的Emulator是否是最新版本,如果不是检查更新到最新

使用ESP32的语音到文本转换

ESP32 + INMP441麦克风+ SD卡+ Deepgram API =语音到文本只需3秒!即时记录、存储和转录。现在就试试! 最快!使用ESP32板的语音到文本转换语音转文本技术改变了许多项目的游戏规则。从在智能家居中实现免提控制到为残疾人创建无障碍解决方案,将口语转换为文本的能力打开了无限的…