【CVPR2020-港科大-腾讯】基于注意力机制及多关系检测器的小样本物体检测

本文由香港科技大学和腾讯优图实验室联合提出。目标检测网络已经被广泛应用到安保，自动驾驶，医学图像等各个领域。然而传统的目标检测网络需要使用大量高质量的训练样本对模型进行训练。这些训练样本需要大量的人力物力进行标注，往往无法快速获得，所以无法将目标检测模型快速部署到新样本的检测中，而小样本目标检测方法可以很好地解决这一问题。我们提出了一种基于深度孪生网络的小样本目标检测模型，通过基于注意力机制的候选框网络，多关系检测器以及三元组对比训练方法对网络进行改进，使得网络能够不对新物体重新训练即可应用于新类别检测。此外，我们提供了一个1000类的小样本物体检测数据集，希望可以方便该领域的研究。

我们的工作主要有以下贡献：

首先，我们使用注意力机制对物体检测候选框进行筛选。我们将待检测新物体的特征作为滤波器在输入图片上进行卷积，以此找出潜在的候选框区域。

然后，我们使用多关系检测器对这些候选框进行分类以及位置调整。多关系检测器对候选框和新物体进行像素级、区域级和全图级的多级关系匹配，以此找出匹配程度最高的区域作为检测输出。

最后，我们构建（目标样本，正样本，负样本）训练样本三元组对模型进行训练，使得网络能够同时学习到相同物体间的相似性和不同物体间的差异性，从而大大提升网络在新样本上的检测性能。我们的方法在多个数据集上均取得了最好的结果，且无需在新物体上进行任何训练。其基本框架图如下：

成为VIP会员查看完整内容

相关内容

注意力机制

关注 120

Attention机制最早是在视觉图像领域提出来的，但是真正火起来应该算是google mind团队的这篇论文《Recurrent Models of Visual Attention》[14]，他们在RNN模型上使用了attention机制来进行图像分类。随后，Bahdanau等人在论文《Neural Machine Translation by Jointly Learning to Align and Translate》 [1]中，使用类似attention的机制在机器翻译任务上将翻译和对齐同时进行，他们的工作算是是第一个提出attention机制应用到NLP领域中。接着类似的基于attention机制的RNN模型扩展开始应用到各种NLP任务中。最近，如何在CNN中使用attention机制也成为了大家的研究热点。下图表示了attention研究进展的大概趋势。

【CVPR2020】通过获取高质量的关键点对来提升目标检测性能

专知会员服务

44+阅读 · 2020年6月30日

【CVPR2020】跨模态哈希的无监督知识蒸馏

专知会员服务

61+阅读 · 2020年6月25日

【ICML2020-华为港科大】RNN和LSTM有长期记忆吗？

专知会员服务

78+阅读 · 2020年6月25日

【CVPR2020-北京大学】自适应间隔损失的提升小样本学习

专知会员服务

85+阅读 · 2020年6月9日