Few-shot object detection (FSOD) localizes and classifies objects in an image given only a few data samples. Recent trends in FSOD research show the adoption of metric and meta-learning techniques, which are prone to catastrophic forgetting and class confusion. To overcome these pitfalls in metric learning based FSOD techniques, we introduce Attention Guided Cosine Margin (AGCM) that facilitates the creation of tighter and well separated class-specific feature clusters in the classification head of the object detector. Our novel Attentive Proposal Fusion (APF) module minimizes catastrophic forgetting by reducing the intra-class variance among co-occurring classes. At the same time, the proposed Cosine Margin Cross-Entropy loss increases the angular margin between confusing classes to overcome the challenge of class confusion between already learned (base) and newly added (novel) classes. We conduct our experiments on the challenging India Driving Dataset (IDD), which presents a real-world class-imbalanced setting alongside popular FSOD benchmark PASCAL-VOC. Our method outperforms State-of-the-Art (SoTA) approaches by up to 6.4 mAP points on the IDD-OS and up to 2.0 mAP points on the IDD-10 splits for the 10-shot setting. On the PASCAL-VOC dataset, we outperform existing SoTA approaches by up to 4.9 mAP points.


翻译:微小的物体探测(FSOD)在仅提供少量数据样本的图像中将对象本地化和分类,FSOD研究的最近趋势表明,采用了衡量和元学习技术,这些技术容易发生灾难性的遗忘和阶级混乱。为了克服基于FSOD的标准化学习技术中这些缺陷,我们引入了“注意引导”Cosine 边距(AGCM),这有利于在物体探测器的分类头部中创建更紧、分明的分类特有特征组群。我们新型的“加速建议”模块通过减少同级之间出现的差异,尽量减少灾难性的忘记。与此同时,拟议的Cosine Margin交叉Entropy损失使混淆的班级之间的角差加大了克服已经学到的(基础)和新增加的(新)类之间等级混乱的挑战。我们进行了关于挑战性印度驾驶数据集的实验,该数据集与流行的FSSODD基准PA-VC(A)相比,真实的等级平衡。我们的方法超越了国家艺术差异。同时,拟议的CSOS交叉损失分类之间的角段之间的角差差差差间,通过6.MA-MA-S-10-MASDMDS-S-S-S-S-SAS-10-DM-S-SDM-S-S-S-S-SAS-S-S-S-S-S-S-S-S-S-S-S-SD-S-S-S-S-S-S-S-S-S-SAP-S-S-S-S-S-S-S-SD-S-S-S-S-S-S-S-S-S-S-S-S-S-S-S-S-S-S-S-S-S-S-S-S-S-S-S-S-S-S-S-S-S-S-S-SAP-SAP-SAP-SAP-SAP-SAP-S-S-S-S-S-S-S-S-S-S-S-S-S-S-S-S-S-S-S-S-S-S-S-S-S-S-S-S-S-S-

0
下载
关闭预览

相关内容

专知会员服务
30+阅读 · 2021年6月12日
专知会员服务
52+阅读 · 2020年11月3日
近期必读的5篇AI顶会CVPR 2020 GNN (图神经网络) 相关论文
专知会员服务
78+阅读 · 2020年3月3日
Stabilizing Transformers for Reinforcement Learning
专知会员服务
57+阅读 · 2019年10月17日
[综述]深度学习下的场景文本检测与识别
专知会员服务
77+阅读 · 2019年10月10日
Hierarchically Structured Meta-learning
CreateAMind
23+阅读 · 2019年5月22日
Transferring Knowledge across Learning Processes
CreateAMind
25+阅读 · 2019年5月18日
CVPR2019 | 全景分割:Attention-guided Unified Network
极市平台
9+阅读 · 2019年3月3日
Unsupervised Learning via Meta-Learning
CreateAMind
41+阅读 · 2019年1月3日
《pyramid Attention Network for Semantic Segmentation》
统计学习与视觉计算组
44+阅读 · 2018年8月30日
Focal Loss for Dense Object Detection
统计学习与视觉计算组
11+阅读 · 2018年3月15日
Frustratingly Simple Few-Shot Object Detection
Arxiv
3+阅读 · 2020年3月16日
Arxiv
11+阅读 · 2019年4月15日
Arxiv
12+阅读 · 2019年4月9日
Few-shot Adaptive Faster R-CNN
Arxiv
3+阅读 · 2019年3月22日
Arxiv
7+阅读 · 2018年12月5日
Arxiv
19+阅读 · 2018年5月17日
VIP会员
相关VIP内容
相关论文
Frustratingly Simple Few-Shot Object Detection
Arxiv
3+阅读 · 2020年3月16日
Arxiv
11+阅读 · 2019年4月15日
Arxiv
12+阅读 · 2019年4月9日
Few-shot Adaptive Faster R-CNN
Arxiv
3+阅读 · 2019年3月22日
Arxiv
7+阅读 · 2018年12月5日
Arxiv
19+阅读 · 2018年5月17日
Top
微信扫码咨询专知VIP会员