0
  • 聊天消息
  • 系统消息
  • 评论与回复
登录后你可以
  • 下载海量资料
  • 学习在线课程
  • 观看技术视频
  • 写文章/发帖/加入社区
会员中心
创作中心

完善资料让更多小伙伴认识你,还能领取20积分哦,立即完善>

3天内不再提示

基于重构的方法存在的“恒等映射”问题

CVer 来源:CVer 作者:CVer 2022-10-24 09:52 次阅读

Introduction

异常检测已经取得了非常突出的进展。考虑到异常的多样性,通常的异常检测方案是首先拟合出正常样本的分布,之后检测该分布之外的离群点作为异常。因此,异常检测需要学习出一个非常紧凑的正常样本的边界 (下图a)。出于这种目的,当前所有的异常检测方法都只能用一个模型解决一个类别 (下图c)。但是,这种“一个模型只处理一个类别”的separate setting是十分耗费储存空间的,并且无法处理正常样本具有一定多样性的场景 (比如,一种物体有多种正常的型号)。

1d754198-52ed-11ed-a3b6-dac502259ad0.jpg

传统的separate setting V.S. our unified setting

我们致力于解决一个更困难的unified setting,那就是用一个模型解决所有类别的异常检测 (上图d)。这就需要所有类别共享相同的分类边界 (上图b),因此,如何拟合出多类正常样本的分布是十分重要的。

基于重构的方法是一种常用的异常检测方法。这种方法在正常样本上训练一个重构模型,并假设重构只能在正常样本上成功,对于异常样本将会具有较大的重构误差。因此,重构误差可以作为异常评分。但是,基于重构的方法会遇到“恒等映射”的问题。所谓“恒等映射”指的是,虽然重构模型是在正常样本上训练的,其遇到异常样本同样会重构成功。这使得正常样本和异常样本的重构误差都很小,难以被区分开来。更重要的是,相比于传统的separate setting,在unified setting下,正常样本的分布更加复杂,这加剧了“恒等映射”的问题 (详见paper的实验及分析)。

1d7c637e-52ed-11ed-a3b6-dac502259ad0.jpg

MLP, CNN, transformer都会遇到“恒等映射”的问题

我们首先follow了特征重构 [2] 的框架,并测试了3种通用的网络架构MLP、CNN、transformer (上图)。我们发现,3种网络结构都会遇到“恒等映射”的问题。这使得在训练过程中,重构的loss (上图蓝线) 可以降到非常小,但其检测性能 (上图绿线) 和定位性能 (上图红线) 甚至会随着loss的下降而下降。这证明了“恒等映射”的问题,即,可以非常好地完成重构,但却无法区分正常和异常。

因此,我们希望,从重构网络的结构设计上彻底解决“恒等映射”问题。具体的,我们提出了三个创新点,构成了我们的UniAD网络。

1d825b6c-52ed-11ed-a3b6-dac502259ad0.jpg

UniAD网络结构

创新点一:Layer-wise Query Embedding

我们观察到,transformer中“恒等映射”的问题比MLP和CNN要轻微一些。第一,在transformer中,loss并不会完全降低到0。第二,在transformer中,检测性能和定位性能的下降幅度远小于MLP和CNN。因此,我们认为transformer中必然存在一种结构可以抑制“恒等映射”。经过数学分析和消融实验,我们认为,具有query embedding的attention可以抑制“恒等映射” (分析与实验详见paper)。

但是,现有的transformer网络,一些不具有query embedding (如类似于ViT的),一些只在decoder的第一层有query embedding (如类似于DETR的)。我们希望通过增加query embedding,来增加其抑制“恒等映射”的能力。因此,我们以transformer为基础,提出了Layer-wise Query Embedding,即,在decoder的每一层都加入query embedding。

创新点二:Neighbor Masked Attention

我们认为,在传统的Attention中,一个token是可以利用自己的信息的,这可能会防止信息泄漏,即,直接将输入进行输出,形成“恒等映射”。因此,我们提出了Neighbor Masked Attention,即,一个token是不能利用自己和自己的邻居的信息的。这样,网络就必须通过更远处的token来理解这个点的信息应该是什么,进而在这个过程中理解了正常样本,拟合了正常样本的分布。

1d871300-52ed-11ed-a3b6-dac502259ad0.jpg

Neighbor Masked Attention

创新点三:Feature Jittering

受到De-noising Auto-Encoder的启发,我们设计了一个Feature Jittering策略。即,在输入的feature tokens中加入噪声,而重构的目标依然是未加噪声的feature tokens。因此,Feature Jittering可以将重构任务转化为去噪任务。网络通过去除噪声来理解正常样本,并拟合正常样本的分布。同时,恒等映射在这种情况下不能使得loss等于0,也就不是最优解了。

性能对比

我们在MVTec-AD上“一个模型处理所有类别”的unified setting下,在检测指标上远超baseline达到了8.4%,在定位指标上远超baseline达到了7.3%。

1d8cabbc-52ed-11ed-a3b6-dac502259ad0.jpg

MVTec-AD的异常检测指标

1d9964e2-52ed-11ed-a3b6-dac502259ad0.jpg

MVTec-AD的异常定位指标

我们的异常检测的可视化结果如下图所示,从左到右依次为,正常 (作为reference)、异常、异常的重构结果、ground-truth、我们的检测结果。结果证明,我们的方法可以将异常重构为对应的正常,所以重构的差异可以准确地定位出异常区域。

1da206c4-52ed-11ed-a3b6-dac502259ad0.jpg

可视化结果

我们还将unified setting拓展到了CIFAR-10数据集中,我们的方法同样稳定地超越了Baseline。

1dc9996e-52ed-11ed-a3b6-dac502259ad0.jpg

CIFAR-10的异常检测指标

消融实验

消融实验证明了我们所设计模块的有效性。

1dd64646-52ed-11ed-a3b6-dac502259ad0.jpg

消融实验

结论

首先,我们提出了异常检测的unified setting,即,可以仅仅使用一个模型,解决所有类别的异常检测问题。之后,我们分析了基于重构的方法存在的“恒等映射”问题,并针对性地提出了三点改进,形成了我们的UniAD网络。我们的方法在MVTec-AD上,显著地超越了baseline达到8.4% (异常检测) 和7.3% (异常定位)。

审核编辑:彭静
声明:本文内容及配图由入驻作者撰写或者入驻合作网站授权转载。文章观点仅代表作者本人,不代表电子发烧友网立场。文章及其配图仅供工程师学习之用,如有内容侵权或者其他违规问题,请联系本站处理。 举报投诉
  • 异常检测
    +关注

    关注

    1

    文章

    42

    浏览量

    9726
  • 模型
    +关注

    关注

    1

    文章

    3140

    浏览量

    48672
  • 网络架构
    +关注

    关注

    1

    文章

    92

    浏览量

    12553

原文标题:NeurIPS 2022 | 上交&清华等提出UniAD:一个模型解决所有类别的异常检测!

文章出处:【微信号:CVer,微信公众号:CVer】欢迎添加关注!文章转载请注明出处。

收藏 人收藏

    评论

    相关推荐

    FPGA的重构方式

      根据重构方法不同,FPGA的重构可分为静态重构和动态重构两种,前者是指在系统空闲期间进行在线编程,即断开先前的电路功能后,重新下载存贮
    发表于 05-27 10:22

    有什么FPGA可重构方法可以对EPCS在线编程?

    的简单操作来完成FPGA的工作方式重构,这种可重构方式结构简单,配置灵活,用户操作更加方便。本文首先介绍了FPGA常用的配置方式,然后详细阐述了有什么FPGA可重构方法可以对EPCS在
    发表于 07-31 07:15

    IDE的自动重构方法

    IDE的自动重构
    发表于 12-15 07:02

    求一种高档FPGA可重构配置方法

    求大神分享一种高档FPGA可重构配置方法
    发表于 04-29 06:16

    空间映射方法研究及其在LTCC设计中的应用

    介绍了空间映射方法的一些基本概念、发展和数学表达。为了能在含大量复杂结构的LTCC电路建模和优化中实现空间映射方法应用,开发了空间映射系统实
    发表于 12-13 02:03 55次下载

    大本体的分块与映射方法研究

    在本体的映射研究中,现实本体或大本体之间的映射算法是研究的难点。该文提出一种针对大层次本体的映射方法。根据本体的结构和概念之间的语义距离,应用向量空间模式(VSM)将
    发表于 03-21 15:52 19次下载

    STEP模式映射的一种实用方法

    STEP模式映射的一种实用方法 在STEP标准的应用中, 常需要通过不同STEP应用协议之间或其中某一应用协议的不同视图之间的映射来实现异构系统间的数据交换。本文提
    发表于 02-22 14:37 10次下载

    基于对EPCS在线编程的FPGA可重构方法

    基于对EPCS在线编程的FPGA可重构方法 0 引言    可重构体系结构已经成为FPGA系统开发的研究热点,并已有许多令人瞩目的研究成果及产品应用。FPGA可
    发表于 12-08 17:22 1458次阅读

    基于SFS方法的超空泡三维重构研究

    通过采用阴影恢复图像的方法(即SFS方法)对超空泡的实验图像进行三维重构,并与理想光照条件下的半球重构图像进行对比分析,为以后有关超空泡的三维重构
    发表于 02-17 11:23 13次下载
    基于SFS<b class='flag-5'>方法</b>的超空泡三维<b class='flag-5'>重构</b>研究

    基于规范变量分析的数据重构方法及应用_卢娟

    基于规范变量分析的数据重构方法及应用_卢娟
    发表于 03-16 14:54 0次下载

    波形重构方法比较

    在使用电子测量仪器的时候,波形查看是最常用到的功能,那么波形的采集和重构一般是怎样实现呢?在采集方法上比较典型的两种仪器就是示波器和功率分析仪,今天小编就简单介绍一下瞬态、稳态测量仪器常见的波形采集方法
    发表于 07-28 15:23 1781次阅读
    波形<b class='flag-5'>重构</b>的<b class='flag-5'>方法</b>比较

    基于单元相邻关系的重构区域构造方法

    针对基于非结构网格方法的飞行器多体分离数值模拟中的局部网格重构问题,提出了一种基于单元相邻关系的重构区域构造方法。首先,根据单元半径比检查网格质量并标记
    发表于 12-18 10:57 0次下载
    基于单元相邻关系的<b class='flag-5'>重构</b>区域构造<b class='flag-5'>方法</b>

    一种多重映射的自动短文摘方法

    传统自动文摘一般对字数没有明确限制,运用传统技术进行短文摘提取时,受字数限制,难以获取均衡的性能。针对该问题,提出一种多重映射的自动短文摘方法。通过计算关联度映射值、长度映射值、标题
    发表于 12-23 11:46 0次下载
    一种多重<b class='flag-5'>映射</b>的自动短文摘<b class='flag-5'>方法</b>

    空间映射的分形图像编码方法

    映射压缩因子,再计算和量化空间映射灰度变换的其他系数,提高range块和domam块成功匹配的可能性。实验证明,该方法在不降低重构图像质量的前提下,减少了编码块数,提高了图像的压缩比,
    发表于 02-08 17:13 1次下载

    采用ARM和CPLD结构的检测系统可重构设计方法

    检测系统的可重构设计是检测技术的发展方向。可重构设计是指利用可重用的软硬件资源,根据不同的应用需求,灵活地改变自身体系结构的设计方法。对于检测系统而言,可重构可以分为软件可
    发表于 10-20 10:40 2217次阅读
    采用ARM和CPLD结构的检测系统可<b class='flag-5'>重构</b>设计<b class='flag-5'>方法</b>