Lacking enough high quality proposals for RoI box head has impeded two-stage and multi-stage object detectors for a long time, and many previous works try to solve it via improving RPN's performance or manually generating proposals from ground truth. However, these methods either need huge training and inference costs or bring little improvements. In this paper, we design a novel training method named APDI, which means augmenting proposals by the detector itself and can generate proposals with higher quality. Furthermore, APDI makes it possible to integrate IoU head into RoI box head. And it does not add any hyperparameter, which is beneficial for future research and downstream tasks. Extensive experiments on COCO dataset show that our method brings at least 2.7 AP improvements on Faster R-CNN with various backbones, and APDI can cooperate with advanced RPNs, such as GA-RPN and Cascade RPN, to obtain extra gains. Furthermore, it brings significant improvements on Cascade R-CNN.


翻译:对于RoI箱头,由于缺少足够高质量的建议,长期阻碍两阶段和多阶段物体探测器,以往的许多工作都试图通过改进RPN的性能或从地面真相中人工生成建议来解决这个问题。然而,这些方法要么需要大量的培训和推断费用,要么几乎没有什么改进。在本文件中,我们设计了名为APDI的新颖的培训方法,这意味着探测器本身会增加建议,并能够产生更高质量的建议。此外,APDI使得有可能将IOU头纳入RoI箱头。它并没有增加任何有利于未来研究和下游任务的任何超参数。COCO数据集的广泛实验表明,我们的方法至少可以带来2.7个AP改进速度更快的R-CNN和各种主干网,而APDI可以与先进的RPN,例如GA-RPN和Cascade RPN合作,以获得额外收益。此外,它给Cascade R-CNN带来重大改进。

0
下载
关闭预览

相关内容

iOS 8 提供的应用间和应用跟系统的功能交互特性。
  • Today (iOS and OS X): widgets for the Today view of Notification Center
  • Share (iOS and OS X): post content to web services or share content with others
  • Actions (iOS and OS X): app extensions to view or manipulate inside another app
  • Photo Editing (iOS): edit a photo or video in Apple's Photos app with extensions from a third-party apps
  • Finder Sync (OS X): remote file storage in the Finder with support for Finder content annotation
  • Storage Provider (iOS): an interface between files inside an app and other apps on a user's device
  • Custom Keyboard (iOS): system-wide alternative keyboards

Source: iOS 8 Extensions: Apple’s Plan for a Powerful App Ecosystem
大数据白皮书(2020年), 72页pdf
专知会员服务
58+阅读 · 2020年12月31日
深度学习目标检测方法综述
专知会员服务
273+阅读 · 2020年8月1日
商业数据分析,39页ppt
专知会员服务
160+阅读 · 2020年6月2日
专知会员服务
160+阅读 · 2020年4月21日
已删除
将门创投
8+阅读 · 2019年6月13日
Unsupervised Learning via Meta-Learning
CreateAMind
42+阅读 · 2019年1月3日
Arxiv
0+阅读 · 2021年3月22日
Arxiv
12+阅读 · 2019年4月9日
Augmentation for small object detection
Arxiv
11+阅读 · 2019年2月19日
Arxiv
5+阅读 · 2018年5月16日
Arxiv
4+阅读 · 2016年12月29日
VIP会员
相关VIP内容
大数据白皮书(2020年), 72页pdf
专知会员服务
58+阅读 · 2020年12月31日
深度学习目标检测方法综述
专知会员服务
273+阅读 · 2020年8月1日
商业数据分析,39页ppt
专知会员服务
160+阅读 · 2020年6月2日
专知会员服务
160+阅读 · 2020年4月21日
相关资讯
已删除
将门创投
8+阅读 · 2019年6月13日
Unsupervised Learning via Meta-Learning
CreateAMind
42+阅读 · 2019年1月3日
相关论文
Arxiv
0+阅读 · 2021年3月22日
Arxiv
12+阅读 · 2019年4月9日
Augmentation for small object detection
Arxiv
11+阅读 · 2019年2月19日
Arxiv
5+阅读 · 2018年5月16日
Arxiv
4+阅读 · 2016年12月29日
Top
微信扫码咨询专知VIP会员