点击上方“CVer”,选择加"星标"置顶
重磅干货,第一时间送达
本文转载自:AI深度学习视线 | 论文已上传,文末附下载方式
Rejected by ECCV 2020; Reformated
AutoAssign:以52.1%的AP成就最强Anchor-free目标检测网络!用于密集目标检测的可微标签分配,模型表现SOTA!优于所有现有的一级检测器,如ATSS、FreeAnchor和FCOS等网络,注:并没有成功收录到ECCV 2020。
作者团队:旷视研究院
链接:https://arxiv.org/abs/2007.03496
1
摘要
2
主要思路
2.1 检测现状
检测需要密集的提取正负样本,而根据它们的空间位置进行正负样本分配的过程,称之为标签分配。现代基于cnn的检测器通常采用多尺度特征(如FPN[10])来缓解尺度方差,因此标签分配不仅需要在空间特征映射图中选择位置,还需要选择合适尺度的特征。
(2)Anchor-free检测器
2.2 发现问题
2.3 解决思路
首先遵循像FCOS这样的无锚方式,在没有人为设计锚的情况下在每个位置上直接预测对象。
为了适应不同类别和领域的分布,提出了一个分类加权模块,名为中心加权,从数据中学习每个类别的分布。
为了适应每一种姿态的外观和尺度,提出了一个置信加权模块来在空间和尺度维度上对位置的正置信和负置信进行建模。
然后结合这两个模块来生成所有位置的正权值映射和负权值映射。加权的整个过程是可微的,可以通过反向传播方便进行优化。
2.4 本文贡献
1. 针对密集目标检测,提出了一种新的可微标签分配策略——自动分配算法。此外,可学习范式使它能够在不进行任何修改的情况下转换到不同的数据集和任务。
2. 两个加权模块,即在空间和尺度两个维度上,提出了中心加权和置信加权,以自适应地增加特定类别的分布和特定实例的采样策略。
3.在具有挑战性的MS COCO[12]数据集和来自不同领域的其他数据集(如pascal VOC[3,4]、Object365[19]和宽面[22])上进行了具有竞争性结果的广泛实验,证明了自动分配的有效性和广泛适用性。
3
AutoAssign
3.1 Overview
标签分配是一个完全数据驱动的方式。它从头开始构建,没有传统的组件,例如锚点、IoU阈值、top-k或scale范围,而是直接使用网络预测动态调整每个位置的正/负置信度。
为了优化整个标签分配过程,我们提出了一个完全可区分的策略,在空间和尺度上动态调整特定类别和特定实例的采样策略。策略框架如图3所示。
首先采用FCOS等无锚方式,放弃预先设计的锚,直接预测每个有限元位置上的对象。对于每个实例,我们在它的边界框中保留了所有缩放级别的位置,包括正、负。
然后生成正权值和负权值图w+和w−,以精确地修正训练中对正、负权值的预测。因此,我们将整个分配步骤转换为两个权值映射。
为了适应不同类别的分布,提出了一个名为center weights的分类和依赖数据的权重模块。它先从标准中心开始,然后从数据中学习每个类别的分布。
为了适应每种姿态的外观和尺度,进一步提出了一个实例加权模型,称为置信加权。它根据每个目标的预测置信度,动态地对目标在空间和尺度上的位置进行加权。最后,结合两个权重模块来生成所有位置的正权值和负权值。给定一个对象n,我们构建应用整个加权机制后的训练损失如下式所示:
3.2 Center Weighting
先验分布是标签分配的基本要素,特别是在训练的早期阶段。一般来说,物体的分布以中心优先为主。然而,来自不同类别的对象,例如长颈鹿和人类可能有不同的分布。保持采样中心的位置不能捕捉实际实例的不同分布。对于不同类别的对象,自适应中心分布更适合去血缘化。基于中心先验,我们引入了一个具有可学习参数的分类高斯形状加权函数G。“分类的方式”是指每个类别都有其独特的参数(μ,σ),而同一类别的所有对象共享相同的参数。这里我们将G定义为:
3.3 Confidence Weighting
现有的动态策略在设计时考虑到网络可以很容易地获得高置信度的合适样本,同时倾向于对次样本进行低置信度的预测。其中,置信度指标分别在尺度选择和空间分配(锚一致性)中被证明是有效的。在置信度加权中,我们提出了分类和局部化的联合置信度指标来指导空间和尺度上的加权策略。
给定一个空间位置,其分类的置信度可以自然定义为Pi(cls|θ)式中为模型参数。然而,为了确保考虑到所有合适的位置,我们首先考虑了盒子内的所有空间位置。由于一个对象很难完全填满它的边框,初始的正集往往会包含相当一部分背景位置。如果一个位置实际上是背景,那么该位置中的所有类谓词都应该是不合理的。因此,将太多的低背景位置作为正确率将损害检测性能。
为了抑制来自劣质位置的假正样本,引入了一个新的Implicit-Objectness分支,如图3所示。它的工作原理与RPN[17]和YOLO[14]中的Objectness一样,是一个基于前景和背景的二元分类任务。但这里存在缺乏明确标签的问题。RPN和YOLO采用预先定义的赋值,带有一致的正标签,而我们需要动态地寻找和强调适当的正标签。因此,我们将Objectness和classification分支一起优化,因此它不需要显式标签。这就是为什么它被称为隐含对象(ImpObj)。对于位置i∈Sn,应用ImpObj后,可以定义分类置信度Pi(cls|θ):
在联合置信表示Pi(θ)的基础上,我们将置信加权函数C(Pi)以指数形式提出,以强调包含高度置信对象的位置为:
3.4 Weight Maps
给定一个目标i,对于其边框内的所有位置,应该关注正确的位置,并做出更准确的预测。然而,在训练过程的开始,网络参数被随机初始化,使得其预测的置信区间不合理。因此,来自先验的指导信息也很重要。对于位置i∈Sn,我们将中心权重模块的特定类别先验G(~di)和置信度权重模块C(Pi)组合在一起,生成正权重wi+为:
一个边界盒通常包含一定数量的真实背景位置,我们还需要加权的负损失来抑制这些位置,消除假positive标签。此外,由于方框内的位置总是倾向于预测positive的高置信度,我们倾向于使用位置信度来生成无偏假positive label。矛盾的是,负分类对回归任务没有梯度,这意味着位置信度不应该进一步优化。因此,我们在每个位置的预测建议和所有对象之间使用IoUs来生成我们的负权值wi- as:
3.5 Loss Function
通过生成正权和负权映射,实现了为每个实例动态分配更合适的空间位置和自动选择合适的FPN阶段的目的。由于权重映射会导致训练损失,因此以可微的方式处理标签分配。AutoAssign的最终损失函数:
S表示所有尺度上的所有位置。因此对于边界盒内的某个位置,正损失和负损失都将以不同的权重进行计算。这与其他标签分配策略有很大的不同。为了处理负位置之间的不平衡问题,采用了focal loss。
4
实验结果
4.1 消融实验
Center weighting and confidence weighting
中心权重和置信权重的贡献
Analysis of center weighting
Analysis of confidence weighting
4.2 SOTA对比实验
COCO数据集:
下载
在CVer公众号后台回复:AutoAssign,即可下载本论文
重磅!CVer-目标检测 微信交流群已成立
扫码添加CVer助手,可申请加入CVer-目标检测 微信交流群,目前已汇集4100人!涵盖2D/3D目标检测、小目标检测、遥感目标检测等。互相交流,一起进步!
同时也可申请加入CVer大群和细分方向技术群,细分方向已涵盖:目标检测、图像分割、目标跟踪、人脸检测&识别、OCR、姿态估计、超分辨率、SLAM、医疗影像、Re-ID、GAN、NAS、深度估计、自动驾驶、强化学习、车道线检测、模型剪枝&压缩、去噪、去雾、去雨、风格迁移、遥感图像、行为识别、视频理解、图像融合、图像检索、论文投稿&交流、PyTorch和TensorFlow等群。
一定要备注:研究方向+地点+学校/公司+昵称(如目标检测+上海+上交+卡卡),根据格式备注,可更快被通过且邀请进群
▲长按加群
▲长按关注我们
整理不易,请给CVer点赞和在看!