在开放世界中分类是验证模型安全性的重要方式,也是一个真正能够商用落地的模型不可避免要面对的问题。传统的分类模型都是在一个封闭的世界中进行训练,即假设测试数据和训练数据都来自同样的分布(称作分布内,in-distribution)。例如我们利用一组猫、狗照片训练一个猫、狗分类器。然而,部署的模型在实际使用中总是会遇到一些不属于封闭世界类别的图片,例如老虎。或者也会遇到一些和训练图片视觉上大相径庭的照片,例如卡通猫。模型应当如何去处理这些不属于训练分布的图片(即分布外样本,out-of-distribution),是开放世界领域所关注的问题。

开放世界领域中时常能够见到如下几个任务:

  • OD: Outlier Detection, 离群检测
  • AD: Anomaly Detection, 异常检测
  • ND: Novelty Detection, 新类检测
  • OSR: Open Set Recognition, 开集识别
  • OOD Detection: Out-of-Distribution Detection, 分布外检测

它们之间虽然各有千秋,却又有千丝万缕的联系。虽然现有工作也有尝试着将自己的任务和别的任务进行区分,但是各任务之间也不统一,使得整个领域都缺乏对各个任务准确的定义。让外界甚至参与者都对各个任务的具体目标困惑。

为了解决这个问题,一篇名为《Generalized Out-of-Distribution Detection: A Survey》的综述解决了这些困惑,将以上五个任务归纳进一个「广义 · 分布外检测」(Generalized OOD Detection)的大框架内。至此,这些任务都能进行准确的定位,而它们之间的关系也顿时清晰可辨。

论文地址: https://www.zhuanzhi.ai/paper/c934e74c6afb7fea3ed931c98877448f 项目主页:https://github.com/Jingkang50/OODSurvey

摘要:分布外检测(Out-of-distribution,OOD)是确保机器学习系统可靠性和安全性的关键。例如,在自动驾驶中,我们希望驾驶系统在检测到以前从未见过的不寻常场景或物体,无法做出安全决定时,发出警报,并将控制权交给人类。该问题最早出现于2017年,从那时起就越来越受到研究领域的关注,由此产生了大量的研究方法,从基于分类到基于密度再到基于距离的方法。同时,在动机和方法论方面,还有几个问题与OOD检测密切相关。这些方法包括异常检测(AD)、新奇检测(ND)、开放集识别(OSR)和异常点检测(OD)。尽管有不同的定义和问题设置,这些问题经常混淆读者和从业人员,因此,一些现有的研究误用术语。在本次综述中,我们首先提出了一个称为广义OOD检测的通用框架,它包含了前面提到的五个问题,即AD、ND、OSR、OOD检测和OD。在我们的框架下,这五个问题可以看作是特殊情况或子任务,更容易区分。然后,我们通过总结它们最近的技术发展,对这五个领域进行全面的调研。我们总结了这个调研查的开放挑战和潜在的研究方向。

成为VIP会员查看完整内容
28

相关内容

在数据挖掘中,异常检测(英语:anomaly detection)对不符合预期模式或数据集中其他项目的项目、事件或观测值的识别。通常异常项目会转变成银行欺诈、结构缺陷、医疗问题、文本错误等类型的问题。异常也被称为离群值、新奇、噪声、偏差和例外。 特别是在检测滥用与网络入侵时,有趣性对象往往不是罕见对象,但却是超出预料的突发活动。这种模式不遵循通常统计定义中把异常点看作是罕见对象,于是许多异常检测方法(特别是无监督的方法)将对此类数据失效,除非进行了合适的聚集。相反,聚类分析算法可能可以检测出这些模式形成的微聚类。 有三大类异常检测方法。[1] 在假设数据集中大多数实例都是正常的前提下,无监督异常检测方法能通过寻找与其他数据最不匹配的实例来检测出未标记测试数据的异常。监督式异常检测方法需要一个已经被标记“正常”与“异常”的数据集,并涉及到训练分类器(与许多其他的统计分类问题的关键区别是异常检测的内在不均衡性)。半监督式异常检测方法根据一个给定的正常训练数据集创建一个表示正常行为的模型,然后检测由学习模型生成的测试实例的可能性。
视觉识别的无监督域适应研究综述
专知会员服务
30+阅读 · 2021年12月17日
【CMU博士论文】开放世界目标检测与跟踪,168页pdf
专知会员服务
58+阅读 · 2021年6月14日
MIT最新《贝叶斯深度学习》综述论文,37页pdf
专知会员服务
50+阅读 · 2021年1月4日
【NeurIPS2020】基于能量的分布外检测
专知会员服务
13+阅读 · 2020年10月10日
《小样本元学习》2020最新综述论文
专知会员服务
172+阅读 · 2020年7月31日
可解释推荐:综述与新视角
专知会员服务
111+阅读 · 2019年10月13日
异常检测(Anomaly Detection)综述
极市平台
20+阅读 · 2020年10月24日
【ICML2020】小样本目标检测
专知
7+阅读 · 2020年6月2日
目标检测领域中的数据不均衡问题综述
极市平台
6+阅读 · 2020年5月18日
【小样本·多分类】如何解决「小样本」+「多分类」问题?
深度学习自然语言处理
3+阅读 · 2020年5月5日
学界 | 综述论文:四大类深度迁移学习
机器之心
16+阅读 · 2018年9月15日
人体骨骼关键点检测综述
极市平台
21+阅读 · 2018年6月29日
干货|用机器学习检测异常点击流
全球人工智能
6+阅读 · 2017年7月30日
Arxiv
0+阅读 · 2021年12月20日
Arxiv
0+阅读 · 2021年12月17日
Generalized Out-of-Distribution Detection: A Survey
Arxiv
15+阅读 · 2021年10月21日
A Survey on GANs for Anomaly Detection
Arxiv
7+阅读 · 2021年9月14日
One-Class Classification: A Survey
Arxiv
7+阅读 · 2021年1月8日
Arxiv
14+阅读 · 2020年10月26日
Anomalous Instance Detection in Deep Learning: A Survey
Object Detection in 20 Years: A Survey
Arxiv
48+阅读 · 2019年5月13日
VIP会员
相关VIP内容
视觉识别的无监督域适应研究综述
专知会员服务
30+阅读 · 2021年12月17日
【CMU博士论文】开放世界目标检测与跟踪,168页pdf
专知会员服务
58+阅读 · 2021年6月14日
MIT最新《贝叶斯深度学习》综述论文,37页pdf
专知会员服务
50+阅读 · 2021年1月4日
【NeurIPS2020】基于能量的分布外检测
专知会员服务
13+阅读 · 2020年10月10日
《小样本元学习》2020最新综述论文
专知会员服务
172+阅读 · 2020年7月31日
可解释推荐:综述与新视角
专知会员服务
111+阅读 · 2019年10月13日
相关资讯
异常检测(Anomaly Detection)综述
极市平台
20+阅读 · 2020年10月24日
【ICML2020】小样本目标检测
专知
7+阅读 · 2020年6月2日
目标检测领域中的数据不均衡问题综述
极市平台
6+阅读 · 2020年5月18日
【小样本·多分类】如何解决「小样本」+「多分类」问题?
深度学习自然语言处理
3+阅读 · 2020年5月5日
学界 | 综述论文:四大类深度迁移学习
机器之心
16+阅读 · 2018年9月15日
人体骨骼关键点检测综述
极市平台
21+阅读 · 2018年6月29日
干货|用机器学习检测异常点击流
全球人工智能
6+阅读 · 2017年7月30日
相关论文
Arxiv
0+阅读 · 2021年12月20日
Arxiv
0+阅读 · 2021年12月17日
Generalized Out-of-Distribution Detection: A Survey
Arxiv
15+阅读 · 2021年10月21日
A Survey on GANs for Anomaly Detection
Arxiv
7+阅读 · 2021年9月14日
One-Class Classification: A Survey
Arxiv
7+阅读 · 2021年1月8日
Arxiv
14+阅读 · 2020年10月26日
Anomalous Instance Detection in Deep Learning: A Survey
Object Detection in 20 Years: A Survey
Arxiv
48+阅读 · 2019年5月13日
微信扫码咨询专知VIP会员