Rethinking Reconstruction Autoencoder-Based Out-of-Distribution Detection

Rethinking Reconstruction Autoencoder-Based Out-of-Distribution Detection

    • 摘要
    • 1引言
    • 2相关工作
    • 3前提
    • 4方法

摘要

在某些场景中,分类器需要检测远离其训练数据的分布外样本。具有理想的特性,基于重构自动编码器的方法通过使用输入重构误差作为新颖性与正常性的度量来解决这个问题。我们将这种方法的本质形式化为四元域转换,其内在偏见只查询条件数据不确定性的代理。因此,改进的方向被形式化为最大限度地压缩自动编码器的潜在空间,同时确保其作为描述的域转换器的重构能力。由此,我们引入了包括语义重构、数据确定性分解和标准化L2距离的策略,以大幅改进原始方法,这些方法共同在各种基准测试中建立了最先进的性能,例如,CIFAR-100与TinyImagenet-crop在Wide-ResNet上的FPR@95%TPR为0.2%。重要的是,我们的方法无需任何额外的数据、难以实现的结构、耗时的流程,甚至不会损害已知类别的分类精度。代码已在github上发布。https://github.com/SDret/Pytorch-implementation-for-Rethinking-Reconstruction-Autoencoder-Based-Out-of-Distribution-Detection。

1引言

监督性判别深度分类器实际上是在一个静态封闭世界的假设下设计的,其中模型在部署环境中面对的数据应该是从与训练集相同的分布中采样的。然而,对于在野外的应用,如关键安全的自动驾驶车辆,测试数据往往很难提前知道。更糟糕的是,神经网络,特别是那些基于 relu 或 softmax 构建的网络,可以轻易地对完全无法识别或无关的样本产生不仅是错误的,而且是任意自信的类别预测,因此,赋予系统标记或放弃未知预测的能力是重要的。

分布外(OoD)检测是一种二元分类,用于检测从与训练数据不同的分布中采样的输入[11]。许多现有的方法依赖于使用来自其他类别[28, 32]、对手[15, 19]或训练样本的留出子集[30]的标记为OoD的数据进行训练或调整。然而,对于具有大尺寸(例如,图像)的数据[20],覆盖OoD的全空间是棘手的,这导致一个捕获OoD分布有限方面的监督方法在没有数据选择偏见的情况下很难泛化[24]。同时,通过引入具有额外训练目标的OoD数据,分类器在分布内(ID)图像上的准确性会波动[28,30]。这些因素暴露了OoD检测的无监督性质。

在一类无监督方法中,输入重构残差被视为一种新颖度度量,以避免上述问题[22]。基本的假设是,一个学会重建ID样本的自动编码器在测试期间无法相对地重建OoD[5]。然而,已经广泛报道,自动编码器可以更好地有效地重建各种OoD样本[7, 22],导致这些方法在应用于具有挑战性的多类OoD检测任务时性能较差。在本文中,我们从四元域转换的角度,以精确的方式研究异常值的重构问题,通过形式化两个具体的前提条件,其中输入的重构误差是一个有效的数据不确定性度量。首先,其潜在特征位于编码ID样本的域内。其次,解码器具有足够的重构能力来桥接ID图像和它们的潜在表示的域。

预设条件1要求系统捕获潜在表示的异常值。我们不依赖在高维度中表现弱的核密度估计器[1, 7, 23],类似于考虑紧凑潜在表示的方案[2, 3],我们最小化一个正则化损失以限制ID潜在特征分布在某个特定空间内。结合输入重构的训练,当这个空间被足够压缩时,任何潜在特征的异常值都会位于其外部。

存在一个耦合问题,即过度限制的潜在空间可能无法为大规模ID图像提供足够的重构能力,这违反了预设条件2。为了缓解这个问题,我们将重构目标从图像改为其提取的激活向量(AV)特征,以减少对潜在空间表达能力的不必要要求。进一步地,从域转换的角度,我们推导出一个基本方程来模拟输入重构误差和数据确定性之间的内在联系。通过概率链规则,我们进一步将其因式分解,将数据确定性表示为由逐层编码器特征重构误差定义的条件密度的乘积。尽管从整个编码过程中累积的大量信息损失使得很难直接从紧凑的潜在空间恢复输入以满足预设条件2,但存在一个等价的预设条件可以被满足,因为它只要求分别恢复每个不可逆编码层后丢失的信息。因此,受以上概念的启发,我们提出了一个理论上定义良好的OoD检测框架,即逐层语义重构。

在这个框架中,我们只使用一个全连接(FC)层和softmax函数作为编码器架构,并利用简单的交叉熵损失来限制潜在空间。我们提供了实验证据和数学洞察,表明在这样的设置下,潜在特征的最大值可以作为过滤出可能被重构的OoD数据的领域亲和力。由于分类器倾向于在OoD数据上产生较小的神经激活[25, 27],为了使我们的方法对其具有鲁棒性,我们使用提出的归一化L2距离来评估重构的准确性。

我们的贡献主要有三方面:首先,我们为理解基于自编码器的OoD检测建立了一个新的视角,找出了一种通过最大限度地压缩自编码器的潜在空间同时保留对ID数据的足够重构能力来改进它们的方向。基于此,其次,我们开发了一个逐层语义重构的框架。第三,我们使用各种基准数据集对我们的提议进行了全面的分析,并进行了消融和鲁棒性研究,以展示其效能,表明基于自编码器的方法的潜力并不像以前显示的那样黯淡。

• 我们的方法在各种具有挑战性的基准测试中,与SOTA(最先进)方法的性能相当。
• 作为一个辅助模块,我们的OoD检测器的训练方式与分类器是正交的。
• 我们的方法在无监督的效率和适用性模式下运行,不需要额外的数据。

2相关工作

自编码器由一个编码器组成,用于将输入投影到一个维度较少的潜在空间(也称为瓶颈特征),以及一个解码器,用于从其潜在表示中恢复输入。在训练过程中,输入会依次通过编码器和解码器进行处理,以最小化重构误差,这是输入和解码器的重构输出之间的L2距离差异。基于重构的自编码器OoD检测器的基本假设是,专门训练来恢复ID样本的自编码器无法成功地重构OoD样本。因此,重构误差成为测试中OoD检测的一个可能有效的决策函数。然而,与这个期望相反,据报道,自编码器能够准确地重构不同类型的OoD样本[18, 29]。

在[6]中指出,训练样本中的大量噪声使得难以学习大多数ID样本的稳健潜在表示。因此,提出了一种神经网络扩展的稳健主成分分析(RPCA)[4]。在[7]中,将Mahalanobis距离和自编码器的OoD检测方法合并到一个统一的框架中,假设后者可以因此得到增强。最近关于潜在空间自回归的工作[2]提出通过应用自回归密度估计器来约束自编码器从恒等函数中,以最小化ID潜在特征分布的微分熵。我们的提议也利用了限制ID潜在特征分布的优势。不同的是,我们寻求一个最大限度地压缩的潜在空间,紧密覆盖ID潜在代码的领域,以得到这个领域的近似值,而无需参数密度估计器[26]。两种方法的比较详细地在实验部分中进行,结果显示我们的方法在相当大的范围内优于现有的方法。

3前提

在这一部分,我们将介绍我们框架的概念。正式地,我们假设存在一个由所有ID图像特征化的域 X ⊂ R N X \subset R^N XRN。当样本 z z z 不在 X X X 中时,我们将其视为OoD样本。本质上,任何 x ∈ X x \in X xX 是一个ID样本,任何 z ∈ Z = R N − X z \in Z = R^N - X zZ=RNX是一个OoD。对于一个在ID样本数据集上训练的自编码器,由编码器 E ( ⋅ ) E(·) E() 和解码器 D ( ⋅ ) D(·) D() 组成,让 E ( x ) E(x) E(x) 的域,对于所有的 x ∈ X x \in X xX,被 S I D ⊂ R M SID \subset R^M SIDRM 所覆盖。在假设解码器具有足够的重构能力,可以作为 S I D → X SID \rightarrow X SIDX 的域转换器的情况下, E ( ⋅ ) E(·) E() D ( ⋅ ) D(·) D() 是学习 X X X S I D SID SID 之间的前向和后向映射关系的函数:
在这里插入图片描述
当编码时,X和Z可能会有重叠,如果我们将编码的OoD样本的域表示为SOoD,它可以被分解为 S O o D = S O o D ∩ S I D + S O o D ∩ ( R M − S I D ) SOoD = SOoD∩SID + SOoD∩(RM-SID) SOoD=SOoDSID+SOoD(RMSID)。使用等式2,任何编码到 S I D ∩ S O o D SID∩SOoD SIDSOoD的OoD样本都可以被解码回X。对于这部分OoD样本,我们预期会有更大的重构误差,因为它们被解码到了一个不同的域X。此外,对于这些OoD样本,它们在RN中离X越远,重构误差可能就越大。这与数据确定性度量的特性是一致的。

在这里插入图片描述
图1. 描述的四元域转换的示意图。对于编码到 S I D ∩ S O o D SID \cap SOoD SIDSOoD 的OoD样本 z 1 z1 z1,其潜在表示 E ( z 1 ) E(z1) E(z1) 可能等于ID样本 x x x 的表示。因此, E ( z 1 ) E(z1) E(z1) 可以被解码为 X X X 中的一个不同的样本 x x x,从而导致大的重构误差。然而,对于潜在表示 E ( z 2 ) E(z2) E(z2) 位于 S I D SID SID 外部的OoD样本 z 2 z2 z2,并不能保证它不能被很好地重构。

然而,对于具有潜在特征 E ( z ) ∈ S O o D ∩ ( R M − S I D ) E(z) \in SOoD \cap (R^M - SID) E(z)SOoD(RMSID) 的OoD样本 z z z,并不能保证阻止其重构。尽管 E ( z ) E(z) E(z) 可能远离编码的ID数据,但 z z z 可能位于由自编码器的参数和架构确定的流形上,在该流形上,数据可以被精确地重构。一个例子是所有元素都为零的OoD图像。在经过没有移位操作的自编码器处理后,其重构自然会全为零,从而导致OoD的完美重构。自然地,与图1中图示的概念一起封装,对于一个不可知的输入 r r r,给定 E ( r ) ∈ S I D E(r) \in SID E(r)SID,其重构误差是数据不确定性 P ( r ∉ X ) P(r \notin X) P(r/X) 的有效度量。这个概念被建模为:
在这里插入图片描述
对于满足等式2的解码器 D ( ⋅ ) D(·)

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.hqwc.cn/news/659585.html

如若内容造成侵权/违法违规/事实不符,请联系编程知识网进行投诉反馈email:809451989@qq.com,一经查实,立即删除!

相关文章

车载气象站:可移动监测的气象站

TH-CZ5车载气象站是一种专门针对车辆、船舶等应急环境检测设备而设计的可移动监测的气象站。 一、系统介绍 车载气象站系统采用先进的高精度GPS及三轴电子罗盘,可实现车行驶时的风速、风向检测。整机为野外型设计,同时还可对气温、相对湿度、雨量、气压…

智能门店管理新纪元:百数低代码平台与千米快修数字化革新的技术实现

随着连锁门店的迅猛发展,企业面临着复杂的管理挑战。传统的门店管理方式已经无法满足现代企业的需求,而数字化管理平台则为企业提供了更加高效、便捷的管理方式。在这场变革中,千米快修与百数携手合作,共同打造了一个智能门店管理…

Spirng 当中 Bean的作用域

Spirng 当中 Bean的作用域 文章目录 Spirng 当中 Bean的作用域每博一文案1. Spring6 当中的 Bean的作用域1.2 singleton 默认1.3 prototype1.4 Spring 中的 bean 标签当中scope 属性其他的值说明1.5 自定义作用域,一个线程一个 Bean 2. 总结:3. 最后: 每…

做等保测评的意义

1、有利于在信息化建设过程中同步建设信息安全设施,保障信息安全与信息化建设协调; 2、有利于为信息系统安全建设和管理提供系统性、针对性、可行性的指导和服务; 3、有利于优化信息安全资源的配置,重点保障基础信息网络和关系国家…

二维码门楼牌管理应用平台建设:共治力量信息管理的革新

文章目录 前言一、二维码门楼牌管理应用平台的建设背景二、共治力量信息管理的重要性三、二维码门楼牌管理应用平台在共治力量信息管理中的应用四、二维码门楼牌管理应用平台的优势与挑战五、结语 前言 随着信息技术的飞速发展,二维码门楼牌管理应用平台的建设已成…

thinkphp6 workerman无法使用框架Db/model等类库方法解决方案

thinkphp6 workerman无法使用框架Db/model相关操作解决 执行安装相关扩展 composer require webman/gateway-worker引入成功后编辑服务类文件,直接展示代码 <?phpnamespace app\server\controller;use GatewayWorker\BusinessWorker; use GatewayWorker\Gateway; use Gate…

vue+element之解决upload组件上传文件失败后仍显示在列表上、自动上传、过滤、findIndex、splice、filter

MENU 前言错误案例(没有用)正确方法结束语 前言 el-upload上传失败后&#xff0c;文件仍显示在列表上。 这个pdf文件上传失败&#xff0c;仍显示在列表&#xff0c;给人错觉是上传成功&#xff0c;所以要把它去掉。 在element中&#xff0c;file-list和v-model:file-list是用于…

【LeetCode:1103. 分糖果 II + 模拟】

&#x1f680; 算法题 &#x1f680; &#x1f332; 算法刷题专栏 | 面试必备算法 | 面试高频算法 &#x1f340; &#x1f332; 越难的东西,越要努力坚持&#xff0c;因为它具有很高的价值&#xff0c;算法就是这样✨ &#x1f332; 作者简介&#xff1a;硕风和炜&#xff0c;…

【论文阅读】ELAN-Efficient Long-Range Attention Network for Image Super-resolution

ELAN-Efficient Long-Range Attention Network for Image Super-resolution 论文地址简介1 引言2相关工作2.1 基于 CNN 的 SR 方法2.2 基于 Transformer 的 SR 方法 3 方法论3.1 ELAN 的整体流程3.2 Efficient Long-range Attention Block (ELAB) 4实验4.1实验设置4.2 与轻量级…

体验分改革!抖音小店重视服务体验,对商家有何影响?

大家好&#xff0c;我是电商花花。 最近关注抖音小店规则的应该都知道抖音小店又更新了体验分&#xff0c;关于新版的体验分有还说呢么变动&#xff0c;下面给大家阐述一下&#xff0c;都对哪些指标进行了调整。 不过大家也不要太慌&#xff0c;新版体验分过着预计在2024年6月…

知了汇智引领新产教融合:成都纺织高专与西南石油大学电商学子走进国际商贸城

随着数字经济浪潮的汹涌澎湃&#xff0c;新业态、新模式、新技术层出不穷&#xff0c;AI、网络直播、短视频、AI大模型等创新技术如雨后春笋般涌现&#xff0c;不仅改变了人们的生活方式&#xff0c;也深刻影响着传统行业的经营模式。在这一背景下&#xff0c;市场对数字营销人…

Linux挂载硬盘

1、查看硬盘数量 fdisk -l # 可以看到三个磁盘 # /dev/vda 50G # /dev/vdb 100G 新增 # /dev/vdc 100G 新增2、查看当前挂载情况 df -h # 可以看到50G的已经挂载3、格式化待挂载盘 # 对新的数据盘进行挂载前要进行格式化&#xff0c;只有格式化后才可以挂载 mkfs.ext4 /dev/…