【文献阅读笔记】深度异常检测模型

文章目录

  • 导读
  • 相关关键词及其英文描述记录
  • 深度异常检测模型
    • Supervised deep anomaly detection 有监督深度异常检测
    • Semi-Supervised deep anomaly detection 半监督深度异常检测
    • Hybrid deep anomaly detection 混合深度异常检测
    • One-class neural network for anomaly detection 用于异常检测的一类神经网络
    • Unsupervised deep anomaly detection 无监督深度异常检测
    • 其他方法
  • 下一步计划

导读

论文:DEEP LEARNING FOR ANOMALY DETECTION: A SURVEY
时间:2019
在这里插入图片描述

本文是关于论文“DEEP LEARNING FOR ANOMALY DETECTION: A SURVEY”的阅读笔记。本笔记是在阅读论文的基础上,对基本内容进行提炼,旨在进一步理解论文内容,加深对基于深度学习的异常检测方向的学习。论文中对深度异常检测模型进行总结,论文中分为六类进行介绍。

相关关键词及其英文描述记录

deep learning 深度学习
anomaly detection 异常检测
supervised 监督
semi-supervised 半监督
unsupervised 无监督
feature extraction network 特征提取网络
classifier network 分类器网络
GAN 生成对抗网络
transfer learning 迁移学习
deep reainforcement learning 深度强化学习

深度异常检测模型

Supervised deep anomaly detection 有监督深度异常检测

  1. 监督学习依赖于分离数据类,而无监督学习注重解释和理解数据特征
  2. 有监督深度学习包含两个自网络:特征提取网络、分类器网络
  3. 计算复杂度:取决于输入数据维数和使用反向传播算法的隐层数
  4. 优点:1)比无监督和半监督更精确。2)基于分类基础的测试阶段是快速的
  5. 缺点:1)多类监督技术要求对各种正常类和异常类进行准确标记。2)当特征空间高度复杂和非线性时,无法区分正常数据和异常数据

Semi-Supervised deep anomaly detection 半监督深度异常检测

  1. 所有训练实例只有一个类
  2. 依赖以下假设将实例打分为异常:1)在输入空间和学习特征空间中彼此接近的点可能共享同一个标签。2)在隐层中学习鲁棒特征,并保留用于分离正常数据点和离群数据的属性
  3. 复杂度:取决于输入数据维度和用于代表特征学习的隐层数
  4. 优点:1)半监督模式下的GAN有巨大的希望。2)可以比无监督实现更高的性能
  5. 缺点:在隐层中提取的分层特征,可能不能代表较少的异常情况,容易出现过拟合

Hybrid deep anomaly detection 混合深度异常检测

  1. 深度学习模型被用在特征提取器来学习鲁棒特征,然后学习到的特征输入到传统算法中
  2. 依赖假设:1)在深度神经网络的隐层中提取鲁棒特征,帮助分离隐层中能够隐藏存在的无关特征。2)在复杂的高维空间中建立鲁棒的异常检测模型,需要特征提取器和异常检测器。
  3. 复杂度:深度神经网络的复杂度和传统算法的复杂度之和
  4. 优点:1)特征提取器显著降低了维数诅咒。2)由于线性和非线性核在降低输入维数的基础上运行,混合模型具有更高的可伸缩性和计算效率。
  5. 缺点:1)混合方法是次优的。2)更深层的混合模型效果更好,但需要的计算开销更大

One-class neural network for anomaly detection 用于异常检测的一类神经网络

  1. 将深度网络与一类目标相结合,以提取数据表示,从而分离正常和异常数据
  2. 依赖假设:1)提取深度神经网络隐层内数据分布中的公共变异因子。2)执行组合表示学习,并为测试类数据生成离群值得分。3)异常样本不能包含变异因素
  3. 复杂度:深度网络的复杂度
  4. 优点:1)联合训练一个深度神经网络,同时优化输出空间的数据超平面。2)提出一种交替最小化算法来学习模型的参数
  5. 缺点:1)对于高维数据的训练时间和模型更新时间较长。2)输入空间变化,模型更新也需要更长的时间

Unsupervised deep anomaly detection 无监督深度异常检测

  1. 自动编码器是用于异常检测的基本无监督学习框架
  2. 依赖假设:1)正常数据和异常数据能够区分开。2)数据集中大部分是正常数据。3)根据数据集的内在属性,产生数据实例的离群值得分
  3. 复杂度:取决于运算次数、网络参数和隐层
  4. 优点:1)学习固有数据的特征,识别样本中共性。2)不需要为训练算法增加注释
  5. 缺点:1)在高维空间找到共性比较困难。2)使用自动编码器需要选择正确的压缩程度。3)对噪声和数据破坏比较敏感

其他方法

  1. 基于迁移学习的异常检测
  2. 基于零镜头的异常检测
  3. 基于集成的异常检测
  4. 基于聚类的异常检测
  5. 基于深度强化学习的异常检测
  6. 深度异常检测的统计技术

下一步计划

对于工业异常检测:工业生产中,生产的多数都是正常产品,而异常产品非常少,并且异常的类型很难确定,有监督的方法虽然能够实现更高的效果,但是很难找到足够多的样本。因此,下一步打算阅读无监督学习方式的异常检测相关论文。

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.hqwc.cn/news/61048.html

如若内容造成侵权/违法违规/事实不符,请联系编程知识网进行投诉反馈email:809451989@qq.com,一经查实,立即删除!

相关文章

心跳跟随的心形灯(STM32(HAL)+WS2812+MAX30102)

文章目录 前言介绍系统框架原项目地址本项目开发开源地址硬件PCB软件功能 详细内容硬件外壳制作WS2812级联及控制MAX30102血氧传感器0.96OLEDFreeRTOS 效果视频总结 前言 在好几年前,我好像就看到了焊武帝 jiripraus在纪念结婚五周年时,制作的一个心跳跟…

Android进阶之SeekBar动态显示进度

SeekBar 在开发中并不陌生,默认的SeekBar是不显示进度的,当然用吐司或者文案在旁边实时显示也是可以的,那能不能移动的时候才显示,默认不显示呢,当然网上花哨的三方工具类太多了,但是我只是单纯的想在SeekBar的基础上去添加一个可以跟随移动显示的气泡而…

Python爬虫在电商数据挖掘中的应用

作为一名长期扎根在爬虫行业的专业的技术员,我今天要和大家分享一些有关Python爬虫在电商数据挖掘中的应用与案例分析。在如今数字化的时代,电商数据蕴含着丰富的信息,通过使用爬虫技术,我们可以轻松获取电商网站上的产品信息、用…

在WebStorm中通过live-server插件搭建Ajax运行环境

1.下载node.js 官网: https://nodejs.cn/download/ 2.配置Node.js的HTTPS 使用淘宝的镜像: npm config set registry https://registry.npm.taobao.org 也可以使用cnpm npm install -g cnpm --registryhttps://registry.npm.taobao.org 配置之后可以验证是否成…

http相关知识点

文章目录 长链接http周边会话保持方案1方案2 基本工具postmanFiddlerFiddler的原理 长链接 一张网页实际上可能会有多种元素组成,这也就说明了网页需要多次的http请求。可由于http是基于TCP的,而TCP创建链接是有代价的,因此频繁的创建链接会…

中国信息安全测评中心CISP家族认证一览

随着国家对网络安全的重视,中国信息安全测评中心根据国家政策、未来趋势、重点内容陆续增添了很多CISP细分认证。 今日份详细介绍,部分CISP及其子品牌相关认证内容,一定要收藏哟! 校园版CISP NISP国家信息安全水平考试&#xff…

【C# 基础精讲】循环语句:for、while、do-while

循环语句是C#编程中用于重复执行一段代码块的关键结构。C#支持for、while和do-while三种常见的循环语句,它们允许根据条件来控制代码块的重复执行。在本文中,我们将详细介绍这三种循环语句的语法和使用方法。 for循环 for循环是一种常见的循环结构&…

【Linux】云服务器自动化部署VuePress博客(Jenkins)

前言 博主此前是将博客部署在 Github Pages(基于 Github Action)和 Vercel 上的,但是这两种部署方式对于国内用户很不友好,访问速度堪忧。因此将博客迁移到自己的云服务器上,并且基于 Jenkins(一款开源持续…

代码审计-Thinkphp框架审计前置知识点

代码审计必备知识点: 1、代码审计开始前准备: 环境搭建使用,工具插件安装使用,掌握各种漏洞原理及利用,代码开发类知识点。 2、代码审计前信息收集: 审计目标的程序名,版本,当前环境(系统,中间件…

OCR让纸质文档秒变电子文档,让自动驾驶成为现实

OCR文字识别具有广泛的应用范围,以下是一些常见和广泛应用的领域: 1. 文档数字化:OCR可以将印刷的文档、书籍、报纸等纸质文档转换为可编辑和可搜索的电子文本,从而实现文档的数字化存储和管理。这在图书馆、档案馆、企业和政府机…

webpack基础知识十:与webpack类似的工具还有哪些?区别?

一、模块化工具 模块化是一种处理复杂系统分解为更好的可管理模块的方式 可以用来分割,组织和打包应用。每个模块完成一个特定的子功能,所有的模块按某种方法组装起来,成为一个整体(bundle) 在前端领域中,并非只有webpack这一款…