标记数据通常是昂贵和耗时的,特别是对于目标检测和实例分割等任务,这需要密集的图像标记。虽然少样本目标检测是关于用很少的数据在新的(看不见的)目标类上训练模型,但它仍然需要在许多标记的基类(见)的示例上进行预训练。另一方面,自监督方法旨在从未标记的数据中学习表示,这些数据可以很好地转移到下游任务,如目标检测。将少样本和自监督目标检测相结合是一个很有前景的研究方向。在这个综述中,我们回顾和描述了最近的方法在少样本和自监督的目标检测。然后,我们给出了主要的结论,并讨论了未来的研究方向。

https://arxiv.org/abs/2110.14711

引言

传统的目标检测器依赖于大型的监督目标检测数据集,如Pascal VOC[27]和MS COCO[71],这些数据集每个目标类别都有超过成百上千的注释示例。然而,标记数据通常是昂贵和耗时的。在目标检测和实例分割的情况下尤其如此,这需要为每个对象密集地标记包围盒/掩码,与目标分类相比,这一过程更慢,需要更多的注释员训练。此外,对于细粒度目标检测应用,如植物或动物物种识别,预先标记的数据集可能不存在,标签可能必须由专家就地收集。

为了解决这些问题,少样本目标检测(FSOD)方法尝试仅基于几个例子来识别新的(看不见的)目标类,在训练了许多标记的基类(见过的)示例后。直到最近,在少样本头目标检测的标准方法是预先训练一个主干用于ImageNet分类,然后在这个主干之上的基类上训练一个目标检测器,最后对新类进行精细调整[54,109,114,120,125]。由于学习自监督表示的巨大进步,一些(少样本)检测方法现在用ImageNet和MS COCO上的无监督前置任务预训练的表示初始化主干网络。[6,68,86,113,117,121]。

典型的自监督预训练方法(如SimCLR[15]或MoCo[43])的问题是,它们是面向分类的,通常设计为在ImageNet上最大化Top-1性能[110]。然而,在分类(例如翻译)中学习到的一些不变性在定位任务中可能是不可取的,因此该表示可能丢弃用于目标检测的关键信息。此外,已有研究表明,较高的ImageNet Top-1精度并不一定保证较高的目标检测性能[110]。针对这些缺点,出现了越来越多的自监督目标检测方法。这些方法(22、110、113、117、121]不仅试图补救classification-geared表示的缺点,而且预训练更多组件,如该区域提议网络(RPN)和检测头。特别是,目前在MS COCO上的FSOD是一种对主干和目标探测器[6]进行自监督预训练的方法。

因此,这促使我们撰写了这一项综述,结合了关于少样本和自监督目标检测的最新方法,这两种方法之前都没有被调研过(见第2节)。在接下来的章节中,我们简要总结目标检测的关键概念(第三节)。我们回顾少样本目标检测任务和基准(第四节)和我们讨论的最新发展是少样本目标检测(第四节)和自监督目标检测预训练(第五节)。我们得出这个调研,总结主要的工作, 我们在图1中提供了流行的少样本和自监督的目标检测方法的分类,并在此基础上构建了本次综述。

本文综述了目标检测方法的分类。我们根据以下层次对其进行分类:主干监督前训练方法、主干和检测头的自监督预训练方法和主干自监督预训练方法。同时,我们还根据这些方法是否在常规目标检测、少样本/低样本目标检测和ImageNet分类上进行了基准测试,来标记(阴影矩形)这些方法。正如在第5节中讨论的,许多自监督分类方法也被用于初始化目标检测主干并在目标检测基准上进行评估。DETReg[6]是一种自监督的目标检测方法,在MSCOCO上获得了最先进的FSOD结果,并对整个体系结构进行了自监督预训练。

成为VIP会员查看完整内容
42

相关内容

自监督学习(self-supervised learning)可以被看作是机器学习的一种“理想状态”,模型直接从无标签数据中自行学习,无需标注数据。
视觉识别的无监督域适应研究综述
专知会员服务
30+阅读 · 2021年12月17日
专知会员服务
30+阅读 · 2021年9月23日
专知会员服务
26+阅读 · 2021年8月24日
领域自适应研究综述
专知会员服务
54+阅读 · 2021年5月5日
【CVPR2021】多实例主动学习目标检测
专知会员服务
41+阅读 · 2021年4月18日
专知会员服务
32+阅读 · 2021年3月7日
最新《对比监督学习》综述论文,20页pdf
专知会员服务
82+阅读 · 2020年11月5日
深度学习目标检测方法综述
专知会员服务
274+阅读 · 2020年8月1日
无监督学习中的目标检测
计算机视觉战队
3+阅读 · 2019年6月24日
最全综述 | 图像目标检测
计算机视觉life
31+阅读 · 2019年6月24日
深度学习目标检测算法综述
AI研习社
25+阅读 · 2019年2月1日
教程 | 单级式目标检测方法概述:YOLO与SSD
机器之心
4+阅读 · 2018年8月6日
综述:深度学习时代的目标检测算法
极市平台
27+阅读 · 2018年3月17日
Arxiv
17+阅读 · 2021年2月15日
Frustratingly Simple Few-Shot Object Detection
Arxiv
3+阅读 · 2020年3月16日
Arxiv
24+阅读 · 2020年3月11日
TensorMask: A Foundation for Dense Object Segmentation
Arxiv
10+阅读 · 2019年3月28日
Augmentation for small object detection
Arxiv
11+阅读 · 2019年2月19日
Zero-Shot Object Detection
Arxiv
9+阅读 · 2018年7月27日
Arxiv
4+阅读 · 2018年3月23日
Arxiv
4+阅读 · 2016年12月29日
VIP会员
相关VIP内容
视觉识别的无监督域适应研究综述
专知会员服务
30+阅读 · 2021年12月17日
专知会员服务
30+阅读 · 2021年9月23日
专知会员服务
26+阅读 · 2021年8月24日
领域自适应研究综述
专知会员服务
54+阅读 · 2021年5月5日
【CVPR2021】多实例主动学习目标检测
专知会员服务
41+阅读 · 2021年4月18日
专知会员服务
32+阅读 · 2021年3月7日
最新《对比监督学习》综述论文,20页pdf
专知会员服务
82+阅读 · 2020年11月5日
深度学习目标检测方法综述
专知会员服务
274+阅读 · 2020年8月1日
相关论文
Arxiv
17+阅读 · 2021年2月15日
Frustratingly Simple Few-Shot Object Detection
Arxiv
3+阅读 · 2020年3月16日
Arxiv
24+阅读 · 2020年3月11日
TensorMask: A Foundation for Dense Object Segmentation
Arxiv
10+阅读 · 2019年3月28日
Augmentation for small object detection
Arxiv
11+阅读 · 2019年2月19日
Zero-Shot Object Detection
Arxiv
9+阅读 · 2018年7月27日
Arxiv
4+阅读 · 2018年3月23日
Arxiv
4+阅读 · 2016年12月29日
微信扫码咨询专知VIP会员