Effective log parsing in log streams using fixed depth forest 论文笔记

news/2025/3/13 14:24:55/文章来源:https://www.cnblogs.com/mianmaner/p/18758237

挑战

主要讲的是 Drain 的一些问题:
① 对于变量开头的日志会存在解析错误
② 常量在变量之前发生变化的日志也会导致解析错误

框架

image-20240910193055054

预处理

对于源日志,采用随机修改 token 的下标(即顺序)分成几个子日志,相当于数据增强

候选模版生成

这里采用的就是 Drain 的解析过程,为子日志生成候选模版,子日志得到一次候选模版相当于为该候选模版投一次票

模版选择

从投票最多的候选模版中,比较各自的变量数,筛掉变量数不同的模版,然后进行 OOV 检查(这里的假设是:开源词汇表之外的词更有可能是变量),最后对指定为变量的标记进行交叉比较

总结

这篇工作就是针对 Drain 的问题作出改进,使问题得到解决

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.hqwc.cn/news/895199.html

如若内容造成侵权/违法违规/事实不符,请联系编程知识网进行投诉反馈email:809451989@qq.com,一经查实,立即删除!

相关文章

P2241 统计方形(数据加强版)

题目背景 1997年普及组第一题 题目描述 有一个 $n \times m$ 方格的棋盘,求其方格包含多少正方形、长方形(不包含正方形)。 输入格式 一行,两个正整数 $n,m$($n \leq 5000,m \leq 5000$)。 输出格式 一行,两个正整数,分别表示方格包含多少正方形、长方形(不包含正方形…

2025扩展可能性采购和供应链管理使用AI报告100+份汇总解读|附PDF下载

原文链接:https://tecdat.cn/?p=40348 在当今快速发展的商业环境中,采购和供应链管理领域正经历着深刻变革,人工智能(AI)技术的融入成为推动这一变革的关键力量。 本报告汇总解读聚焦于AI在采购和供应链管理中的应用,深入剖析其发展现状、面临挑战与潜在机遇。通过对大量…

通义灵码AI程序员深度测评:这些能力体验感拉满!满血版 DeepSeek 玩法大揭秘

随着科技的发展,AI编程,或者说是AI辅助编程,已经成为了每一位程序员的福利。今天我们要说的AI程序员,相对于传统的AI辅助编程工具, AI 程序员具备多文件代码修改(Multi-file Edit)和工具使用(Tool-use)的能力,可以与开发者协同完成编码任务,如需求实现、问题解决、单…

从星链到数字样机:直升机智能化升级的双引擎

​直升机作为一种多功能航空器,凭借其垂直起降、空中悬停的独特优势,在军事、民用、救援等多个领域发挥着重要作用。然而,受制于传统通信导航性能瓶颈与机械系统脆弱性叠加效应,直升机在复杂环境下仍面临通信中断、导航精度不足、数据传输受限等问题,其物理特性与技术架构…

manim边学边做--局部缩放的场景类

在动画制作中,尤其是数学和科学可视化领域,有时我们需要将观众的注意力集中在场景的某个特定部分。 Manim提供了一个强大的工具 ZoomedScene,它允许我们在场景中创建一个独立的缩放视图,从而实现对局部细节的深入展示。 本文将详细介绍ZoomedScene的作用、参数、方法,并通…

docker-compose文件目录

/usr/local/binEND作者:超级鲨鱼辣椒 转载请注明原文链接:https://www.cnblogs.com/jinzlblog/p/18758160

Linux重启nginx命令

cd /usr/sbin ./nginx -s reloadEND作者:超级鲨鱼辣椒 转载请注明原文链接:https://www.cnblogs.com/jinzlblog/p/18758164

使用Nginx实现域名解析到同一台服务器不同服务端口

作为个人网站的服务器,一般都是一台。上面部署了各种应用,都是不同的端口。但是域名只能解析到 80 端口,而且如果你使用 隐性URL、显性URL 转发的话,又会直接 301 跳转,体验非常不好。这可如何是好呢?这就需要用到 Nginx 做反向代理了。什么是反向代理?我们先来看一下解…

Inventor pro 2025下载与安装教

1、安装包 扫描下方二维码关注「软知社」,后台回复【054】三位数字即可免费获取分享链接,无广告拒绝套路;2、安装教程(建议关闭杀毒软件)双击Setup.exe安装,弹窗安装对话框勾选‘我同意,点击下一步选择软件安装路径,建议C盘之外进行安装,点击下一步默认所有组件,点击安…

基于Fluent和深度学习算法驱动的流体力学计算与应用

流体力学基础 一、流体力学基础理论与编程实战 1、流体力学的主要内容 2、不可压缩流体力学的基本方程 3、Navier–Stokes方程的数值求解介绍 4、有限体积法与有限差分法介绍 案例实践: 1、Matlab编程实现有限差分(案例) 2、使用深度学习框架(如TensorFlow或PyTorch)进行流…

YC 孵化项目 Pinch:实时语音翻译视频会议平台;Mistral OCR:能处理多语言多模态复杂文档丨日报

开发者朋友们大家好:这里是 「RTE 开发者日报」 ,每天和大家一起看新闻、聊八卦。我们的社区编辑团队会整理分享 RTE(Real-Time Engagement) 领域内「有话题的 技术 」、「有亮点的 产品 」、「有思考的 文章 」、「有态度的 观点 」、「有看点的 活动 」,但内容仅代表编辑…

Atcoder beginner contest 394(ABCD,补E

atcoder beginner contest 394 (ABCD补E) A:模拟 B:模拟 C:小模拟 idea:根据样例WWA,发现更新第一个WA为AC时,序列变为WAC,此时又出现一个WA,再次更新为ACC,所以每次找到WA时,往前更新W为AC即可 #include<bits/stdc++.h> using namespace std; typedef long lon…