ECCV 2022 Oral | 无需微调即可泛化！RegAD：少样本异常检测新框架

会员服务 ·

ECCV 2022 Oral | 无需微调即可泛化！RegAD：少样本异常检测新框架

2022 年 8 月 3 日 极市平台

↑ 点击蓝字关注极市平台

作者丨王延峰、张娅

来源丨机器之心

编辑丨极市平台

极市导读

本文介绍了一种少样本异常检测框架 RegAD，用于学习多个异常检测任务之间共享的通用模型。RegAD 无需模型参数调整，仅利用少量正常样本，就可以直接应用于新的异常检测任务。 >>加入极市CV技术交流群，走在计算机视觉的最前沿

论文链接： https://arxiv.org/abs/2207.07361

代码链接： https://github.com/MediaBrain-SJTU/RegAD

前言

近年来，异常检测在工业缺陷检测、医疗诊断，自动驾驶等领域有着广泛的应用。“异常”通常定义为 “正常” 的对立面，即所有不符合正常规范的样本。通常来说，相比于正常，异常事件的种类是不可穷尽的，且十分稀有，难以收集，因此不可能收集详尽的异常样本进行训练。因此，近期关于异常检测的研究主要致力于无监督学习，即仅使用正常样本，通过使用单类别（one-class）分类，图像重建（reconstruction），或其他自监督学习任务对正常样本进行建模，之后，通过识别不同于模型分布的样本来检测异常。

大多数现有的异常检测方法都专注于为每个异常检测任务训练一个专用模型。然而，在诸如缺陷检测之类的真实场景中，考虑到要处理数百种工业产品，为每种产品均收集大量训练集是不划算的。对此，上海交通大学 MediaBrain 团队和上海人工智能实验室智慧医疗团队等提出了一个基于配准的少样本异常检测框架，通过学习多个异常检测任务之间共享的通用模型，无需进行模型参数调整，便可将其推广到新的异常检测任务。目前，这项研究已被 ECCV2022 接收为 Oral 论文，完整训练代码及模型已经开源。

方法简介

在这项工作中，少样本异常检测通用模型的训练受到了人类如何检测异常的启发。事实上，当尝试检测图像中的异常时，人们通常会将该检测样本与某个已经被确定为正常的样本进行比较，从而找出差异，有差异的部分就可以被认为是异常。为了实现这种类似于人类的比较的过程，本文作者采用了配准技术。本文作者认为，对于配准网络而言，只要知道如何比较两个极度相似的图像，图像的实际语义就不再重要，因此模型就更能够适用于从未见过的异常检测新任务。配准特别适用于少样本异常检测，因为配准可以非常方便地进行跨类别推广，模型无需参数微调就能够快速应用于新的异常检测任务。

上图概述了基于配准的少样本异常检测的框架。与常规的异常检测方法（one-model-per-category）不同，这项工作（one-model-all-category）首先使用多类别数据联合训练一个基于配准的异常检测通用模型。来自不同类别的正常图像一起用于联合训练模型，随机选择来自同一类别的两个图像作为训练对。在测试时，为目标类别以及每个测试样本提供了由几个正常样本组成的支撑集。给定支撑集，使用基于统计的分布估计器估计目标类别注册特征的正态分布。超出统计正态分布的测试样本被视为异常。

这项工作采用了一个简单的配准网络，同时参考了 Siamese [1], STN [2] 和 FYD [3]。具体地说，以孪生神经网络（Siamese Network）为框架，插入空间变换网络（STN）实现特征配准。为了更好的鲁棒性，本文作者利用特征级的配准损失，而不是像典型的配准方法那样逐像素配准，这可以被视为像素级配准的松弛版本。

实验结果

在与其他少样本异常检测方法的比较上，RegAD 无论在检测性能、适用到新类别数据的自适应时间上，相比于基准方法 TDG [4] 和 DiffNet [5] 都有显著的优势。这是由于其他的方法都需要针对新的类别数据进行模型的多轮迭代更新。另外，RegAD 相比于没有进行多类别特征配准联合训练的版本（RegAD-L），性能也得到了显著的提升，体现出基于配准的通用异常检测模型的训练是十分有效的。本文在异常检测数据集 MVTec [6] 和 MPDD [7] 上进行实验。更多的实验结果和消融实验可参考原论文。

此外，作者还展示了异常定位可视化的结果。可以看到，联合训练可以使得模型的异常定位变得更加准确。

T-SNE 的可视化也显示出，基于配准的训练可以使得同类别的正常图像特征变得更加紧凑，从而有利于异常数据的检出。

总结

这项工作主要探索了异常检测的一个具有挑战性但实用的设置：1）训练适用于所有异常检测任务的单一模型（无需微调即可推广）；2）仅提供少量新类别图像（少样本）；3）只有正常样本用于训练（无监督）。尝试探索这种设置是异常检测走向实际大规模工业应用的重要一步。为了学习类别无关的模型，本文提出了一种基于比较的解决方案，这与流行的基于重建或基于单分类的方法有很大不同。具体采用的配准模型建立在已有的配准方案基础上，充分参考了现有的杰出工作 [1,2,3]，在不需要参数调整的前提下，在新的异常检测数据上取得了令人印象深刻的检测效果。

参考文献

[1] Xinlei Chen and Kaiming He. Exploring simple siamese representation learning. CVPR. 2021.

[2] Max Jaderberg et. al. Spatial transformer networks. NeurIPS. 2015.

[3] Ye Zheng et. al. Focus your distribution: Coarse-to-fine non-contrastive learning for anomaly detection and localization. arXiv:2110.04538. 2021.

[4] Shelly Sheynin et. al. A hierarchical transformation-discriminating generative model for few shot anomaly detection. ICCV. 2021.

[5] Marco Rudolph et.al. Same same but differnet: Semi-supervised defect detection with normalizing flows. WACV. 2021.

[6] Paul Bergmann et. al. MVTec AD--A Comprehensive Real-World Dataset for Unsupervised Anomaly Detection. CVPR. 2019.

[7] Stepan Jezek et. al. Deep learning-based defect detection of metal parts: evaluating current methods in complex conditions. ICUMT. 2021.

公众号后台回复“ECCV2022”获取论文分类资源下载～

‍

△点击卡片关注极市平台，获取最新CV干货

‍

极市干货

算法项目： CV工业项目落地实战｜目标检测算法上新！（年均分成5万）

实操教程：Pytorch - 弹性训练原理分析｜《CUDA C 编程指南》导读

极视角动态：极视角作为重点项目入选「2022青岛十大资本青睐企业」榜单！｜极视角发布EQP激励计划，招募优质算法团队展开多维度生态合作！｜极市AI校园大使招募

“

点击阅读原文进入CV社区

收获更多技术干货

登录查看更多

相关内容

异常检测

关注 102

在数据挖掘中，异常检测（英语：anomaly detection）对不符合预期模式或数据集中其他项目的项目、事件或观测值的识别。通常异常项目会转变成银行欺诈、结构缺陷、医疗问题、文本错误等类型的问题。异常也被称为离群值、新奇、噪声、偏差和例外。特别是在检测滥用与网络入侵时，有趣性对象往往不是罕见对象，但却是超出预料的突发活动。这种模式不遵循通常统计定义中把异常点看作是罕见对象，于是许多异常检测方法（特别是无监督的方法）将对此类数据失效，除非进行了合适的聚集。相反，聚类分析算法可能可以检测出这些模式形成的微聚类。有三大类异常检测方法。[1] 在假设数据集中大多数实例都是正常的前提下，无监督异常检测方法能通过寻找与其他数据最不匹配的实例来检测出未标记测试数据的异常。监督式异常检测方法需要一个已经被标记“正常”与“异常”的数据集，并涉及到训练分类器（与许多其他的统计分类问题的关键区别是异常检测的内在不均衡性）。半监督式异常检测方法根据一个给定的正常训练数据集创建一个表示正常行为的模型，然后检测由学习模型生成的测试实例的可能性。

CVPR 2022 Oral | 基于熵筛选的半监督三维旋转回归

专知会员服务

18+阅读 · 2022年4月18日

重邮高新波等最新《少样本目标检测算法》综述论文

专知会员服务

35+阅读 · 2021年11月2日