【文章学习系列之模型】DAGMM

本章内容

  • 文章概况
  • 模型结构
  • 损失函数
  • 实验结果
  • 实验分析
  • 总结

文章概况

《Deep Autoencoding Gaussian Mixture Model for Unsupervised Anomaly Detection》是2018年发表于ICLR的一篇论文,该论文提出一种端到端的无监督异常检测方法DAGMM,取得了不错的效果。

文章链接
代码链接

模型结构

在这里插入图片描述
深度自编码高斯混合模型(DAGMM)主要由压缩网络和评估网络两大部分组成。

上图左侧橙框,压缩网络通过自编码器对输入样本进行降维,从降维空间和重构误差特征中提取低维表示,并将表示提供给后续的评估网络

上图右侧红框,评估网络获取压缩网络提供的数据,并在高斯混合模型 (GMM) 框架中预测它们的可能性/能量。

压缩网络的特征提包含两个部分:由深度自动编码器学习到的低维特征 Z c Z_c Zc和重构误差得到的低维特征 Z r Z_r Zr,随后 Z c Z_c Zc Z r Z_r Zr组成 Z Z Z,提供给后续的评估网络,并经过多层全连接最终得到模型的输出值 π ^ \hat{π} π^,其中包含了经过 s o f t m a x softmax softmax后的类别概率 γ ^ \hat{γ} γ^

在这里插入图片描述
获得模型的输出结果后,根据上图所示的多元高斯概率密度相关公式和评估能量公式,可以得到当前样本的能量,并通过预先选择的阈值预测高能量样本为异常。

损失函数

在这里插入图片描述
损失函数包含三个部分。

第一个是重构误差。若重构误差较小,则表明低维数据能够保存原始数据的关键信息并进行高效重构。

第二个是样本能量。通过最小化样本能量寻找压缩网络和评估网络的最佳组合。

第三个是正则项。协方差矩阵的每个元素都需要计算期望值,而期望值的计算需要大量的数据,当混合模型的点数不足时,协方差矩阵计算容易出现偏差,出现奇异性问题,因此添加一项正则项,一定程度上减弱奇异性带来的影响。

此外 λ \lambda λ为超参数,用于平衡损失函数的三个部分。

实验结果

作者没有使用预训练的方式对模型进行训练,而是采用端到端的方式训练整个网络,因为预先训练好的压缩网络性能有限,不利于后续评估任务的训练,相反,压缩网络和评估网络的端到端训练可以相互提高性能。
在这里插入图片描述
作者使用多种模型和变体在多种数据集中进行对比,实验表明本文所提方法取得不错的检测效果。

实验分析

在这里插入图片描述
为了测试模型抗污染能力,作者先选取50%的随机样本,再在剩下的样本中选择所有的正常样本和c%的异常样本。正如所料,随着异常样本占比增加,所有方法的检测性能均产生了显著的下降,在5%时,本文所提方法的各项指标依旧保持在0.85左右,远远优于其他方法的所有试验结果。这表明通过端到端训练学习到的DAGMM在公共基准数据集上达到了最先进的精度,并为无监督异常检测提供了一种很有前途的替代方法。

在这里插入图片描述
上图可视化展示了DAGMM更好地将红蓝点进行划分,而其他三种表现类似,蓝红错杂程度更高。

总结

这篇论文的模型结构和训练方式对后来的研究者有着深远的影响,不少异常检测的无监督研究依旧是沿用这一套路线继续探索,并取得了不错的效果。从以下三个方面解决了无监督异常检测方面的挑战。
1.DAGMM在低维空间中保留了输入样本的关键信息,包括降维特征和重构误差特征。
2.DAGMM利用学习到的低维空间上的高斯混合模型(GMM)来处理具有复杂结构的输入数据的密度估计任务。
3.利用端到端的训练方式,DAGMM的估计网络引入的正则化极大地帮助压缩网络中的自动编码器避免陷入局部最优。

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.hqwc.cn/news/175899.html

如若内容造成侵权/违法违规/事实不符,请联系编程知识网进行投诉反馈email:809451989@qq.com,一经查实,立即删除!

相关文章

数据结构-散列表

列表(Hash Table),又称哈希表,是一种数据结构,特点是:数据元素的关键字与其存储地址直接相关 例:有一堆数据元素,关键字分别为{19,14,23&#xff…

Ansys Lumerical | 用于增强现实系统的表面浮雕光栅

在本示例中,我们使用 RCWA 求解器设计了一个斜面浮雕光栅 (SRG),它将用于将光线耦合到单色增强现实 (AR) 系统的波导中。光栅的几何形状经过优化,可将正常入射光导入-1 光栅阶次。 然后我们将光栅特性导出为 Lumerical Sub-Wavelength Model …

【NI-DAQmx入门】触发相关

触发概述 触发采集为用户提供了两个主要好处:它对输入信号相对于触发事件进行计时,因此用户仅捕获感兴趣区域中的信号,从而节省硬件带宽和内存。 模拟触发和数字触发 模拟触发和数字触发的区别在于触发源的不同。数字触发是一种 TTL 信号&am…

压测工具主要功能是什么?该怎样选择?

压测工具是一类用于模拟并评估系统在不同负载条件下的性能的软件应用程序。通过模拟大量用户同时访问系统,压测工具能够帮助开发者识别系统的瓶颈、性能瓶颈以及潜在的故障点。这种实时、模拟的方式允许开发者在正式投入使用之前发现并解决问题,提高系统…

数据库操作入门:PyMongo 和 MongoDB 的基本用法

MongoDB MongoDB是一种流行的NoSQL数据库,它将数据存储在类似JSON的文档中,使数据库非常灵活和可扩展 PyMongo Python需要一个MongoDB驱动程序来访问MongoDB数据库。在本教程中,我们将使用MongoDB驱动程序 “PyMongo”。建议使用PIP来安装…

基于JavaWeb+SSM+Vue微信小程序校园兼职任务平台系统的设计和实现

基于JavaWebSSMVue微信小程序校园兼职任务平台系统的设计和实现 源码传送入口前言主要技术系统设计功能截图Lun文目录订阅经典源码专栏Java项目精品实战案例《500套》 源码获取 源码传送入口 前言 随着社会的发展和全球疫情的冲击,大学生的就业形势越来越严峻。越…

数据结构与算法【递归】Java实现

递归 递归是一种解决计算问题的方法,其中解决方案取决于同一类问题的更小子集。 特点: 自己调用自己,如果说每个函数对应着一种解决方案,自己调用自己意味着解决方案是一样的(有规律的)每次调用&#xf…

算法——滑动窗口

什么是窗口?就是符合题目要求的区域内的数据,将每次符合数据的窗口内的数据记录下来,然后将窗口后移,寻找其他符合要求的数据,每次进入窗口和退出窗口都需要一定的要求 一、长度最小的子数组 LCR 008. 长度最小的子数…

element el-upload上传功能

2023.11.14今天我学习了如何使用el-upload: <!--drag设置可拖动--><!--accept".xlsx"设置上传的文件类型--><!--:limit1上传文件的最大个数--><!--:auto-upload"false"是否在选取后直接上传--><!--:before-upload"beforeU…

城市内涝对策,万宾科技内涝积水监测仪使用效果

随着城市化进程的加速&#xff0c;城市道路积水问题明显越来越多&#xff0c;给人们的出行和生活带来更多的不便。内涝积水监测仪作为高科技产品能够实时监测道路积水情况&#xff0c;为城市排水系统的管理和维护提供重要的帮助。 在城市生命线的基础设施规划之中&#xff0c;地…

第三天课程 RabbitMQ

RabbitMQ 1.初识MQ 1.1.同步和异步通讯 微服务间通讯有同步和异步两种方式&#xff1a; 同步通讯&#xff1a;就像打电话&#xff0c;需要实时响应。 异步通讯&#xff1a;就像发邮件&#xff0c;不需要马上回复。 两种方式各有优劣&#xff0c;打电话可以立即得到响应&am…

python数据结构与算法-02_数组和列表

线性结构 本节我们从最简单和常用的线性结构开始&#xff0c;并结合 Python 语言本身内置的数据结构和其底层实现方式来讲解。 虽然本质上数据结构的思想是语言无关的&#xff0c;但是了解 Python 的实现方式有助于你避免一些坑。 我们会在代码中注释出操作的时间复杂度。 数…