蒙特利尔最新《自监督少样本目标检测》，20页pdf131系统性阐述少样本和自监督的目标检测研究进展

标记数据通常是昂贵和耗时的，特别是对于目标检测和实例分割等任务，这需要密集的图像标记。虽然少样本目标检测是关于用很少的数据在新的(看不见的)目标类上训练模型，但它仍然需要在许多标记的基类(见)的示例上进行预训练。另一方面，自监督方法旨在从未标记的数据中学习表示，这些数据可以很好地转移到下游任务，如目标检测。将少样本和自监督目标检测相结合是一个很有前景的研究方向。在这个综述中，我们回顾和描述了最近的方法在少样本和自监督的目标检测。然后，我们给出了主要的结论，并讨论了未来的研究方向。

https://arxiv.org/abs/2110.14711

引言

传统的目标检测器依赖于大型的监督目标检测数据集，如Pascal VOC[27]和MS COCO[71]，这些数据集每个目标类别都有超过成百上千的注释示例。然而，标记数据通常是昂贵和耗时的。在目标检测和实例分割的情况下尤其如此，这需要为每个对象密集地标记包围盒/掩码，与目标分类相比，这一过程更慢，需要更多的注释员训练。此外，对于细粒度目标检测应用，如植物或动物物种识别，预先标记的数据集可能不存在，标签可能必须由专家就地收集。

为了解决这些问题，少样本目标检测(FSOD)方法尝试仅基于几个例子来识别新的(看不见的)目标类，在训练了许多标记的基类(见过的)示例后。直到最近，在少样本头目标检测的标准方法是预先训练一个主干用于ImageNet分类，然后在这个主干之上的基类上训练一个目标检测器，最后对新类进行精细调整[54,109,114,120,125]。由于学习自监督表示的巨大进步，一些(少样本)检测方法现在用ImageNet和MS COCO上的无监督前置任务预训练的表示初始化主干网络。[6,68,86,113,117,121]。

典型的自监督预训练方法(如SimCLR[15]或MoCo[43])的问题是，它们是面向分类的，通常设计为在ImageNet上最大化Top-1性能[110]。然而，在分类(例如翻译)中学习到的一些不变性在定位任务中可能是不可取的，因此该表示可能丢弃用于目标检测的关键信息。此外，已有研究表明，较高的ImageNet Top-1精度并不一定保证较高的目标检测性能[110]。针对这些缺点，出现了越来越多的自监督目标检测方法。这些方法(22、110、113、117、121]不仅试图补救classification-geared表示的缺点,而且预训练更多组件,如该区域提议网络(RPN)和检测头。特别是，目前在MS COCO上的FSOD是一种对主干和目标探测器[6]进行自监督预训练的方法。

因此，这促使我们撰写了这一项综述，结合了关于少样本和自监督目标检测的最新方法，这两种方法之前都没有被调研过(见第2节)。在接下来的章节中，我们简要总结目标检测的关键概念(第三节)。我们回顾少样本目标检测任务和基准(第四节)和我们讨论的最新发展是少样本目标检测(第四节)和自监督目标检测预训练(第五节)。我们得出这个调研,总结主要的工作, 我们在图1中提供了流行的少样本和自监督的目标检测方法的分类，并在此基础上构建了本次综述。

本文综述了目标检测方法的分类。我们根据以下层次对其进行分类:主干监督前训练方法、主干和检测头的自监督预训练方法和主干自监督预训练方法。同时，我们还根据这些方法是否在常规目标检测、少样本/低样本目标检测和ImageNet分类上进行了基准测试，来标记(阴影矩形)这些方法。正如在第5节中讨论的，许多自监督分类方法也被用于初始化目标检测主干并在目标检测基准上进行评估。DETReg[6]是一种自监督的目标检测方法，在MSCOCO上获得了最先进的FSOD结果，并对整个体系结构进行了自监督预训练。

成为VIP会员查看完整内容