点击上方“CVer”,选择加"星标"或“置顶”
重磅干货,第一时间送达
前言
一个月内 Amusi 整理了 目标检测(Object Detection)较为值得关注的论文:
一文看尽10篇目标检测最新论文(SpineNet/AugFPN/LRF-Net/SABL/DSFPN等)
一文看尽16篇目标检测最新论文(ATSS/MnasFPN/SAPD/CSPNet/DIoU Loss等)
恰逢2019年即将结束,本文再次更新近期值得关注的最新检测论文。这次分享的paper将同步推送到 github上,欢迎大家 star/fork(点击阅读原文,也可直接访问):
https://github.com/amusi/awesome-object-detection
注意事项:
【1】APRICOT:对目标检测模型进行物理对抗攻击的数据集
《APRICOT: A Dataset of Physical Adversarial Attacks on Object Detection》
链接:https://arxiv.org/abs/1912.08166
注:作者说APRICOT是世界第一个开源的带物体对抗攻击的目标检测数据集,其实说是开源,但原文并没有附上开源链接,需要数据集的小伙伴还是直接email给原作者吧
【2】零售商品检测的基准:密集目标检测的强大baseline
《Benchmark for Generic Product Detection: A strong baseline for Dense Object Detection》
链接:https://arxiv.org/abs/1912.09476
https://github.com/ParallelDots/generic-sku-detection-benchmark
注:
含6大零售场景下密集商品检测的数据集,如SKU110K、WebMarket等,并提供强大的baseline!
《Generating Positive Bounding Boxes for Balanced Training of Object Detectors》
链接:https://arxiv.org/abs/1909.09777
代码:
https://github.com/kemaloksuz/BoundingBoxGenerator
注:论文
使用提出的pRoI生成器训练Faster R-CNN,与传统训练相比,针对低IoU可获得更好或同等的性能,而针对Pascal VOC和MS COCO数据集针对较高IoU进行训练时则可获得显著改善。
【4】MFPN:
多种结构的新型混合特征金字塔网络
《MFPN: A Novel Mixture Feature Pyramid Network of Multiple Architectures for Object Detection》
链接:https://arxiv.org/abs/1912.09748
注:作者
首先研究特征金字塔网络(FPN),并将其简要地分为三种典型方式:自顶向下(top-down),自底向上(bottom-up)和融合分离(fusing-splitting),它们主要用来检测小物体,大物体和中型物体。于是设计了三种不同架构的FPN,并提出了一种新颖的混合特征金字塔网络(MFPN),该网络通过将这三种FPN组装成并行多分支架构并混合这些特征来继承这三种FPN的优点。MFPN可以显著增强one-stage和two-stage基于FPN的检测器,其MS-COCO基准上的平均精度(AP)大约增加2%,而在运行时间延迟方面的牺牲很小。
Our MFPN performs best: detecting objects of small-size, medium-size and large-size with the highest IoU. Green boxes: ground truth, Red boxes: detection result.
四种FPN的性能对比:
【5】带有注意力RPN和多关系检测器的小样本目标检测网络和数据集
《Few-Shot Object Detection with Attention-RPN and Multi-Relation Detector》
链接:https://arxiv.org/abs/1908.01998v2
代码和数据集:https://github.com/fanq15/Few-Shot-Object-Detection-Dataset
注:
提出适合小样本(Few-shot)目标检测网络,在多个数据集上表现SOTA!并开源第一个含1000个类别的FSOD数据集
Multi-Relation Detector
【6
】Scale Match(SM):
用于"小人"(Tiny Person)检测
《Scale Match for Tiny Person Detection》
链接:https://arxiv.org/abs/1912.10664
代码和数据集:https://github.com/ucas-vg/TinyBenchmark
注:
终于看到小目标检测的研究论文,提出TinyPerson数据集(物体小于20个像素),也提出小目标检测新方法SM,即将开源!
Scale Match
【7
】O^2-DNet:
将旋转目标视为一对中间线
《Oriented Objects as pairs of Middle Lines》
链接:https://arxiv.org/abs/1912.10694
注:
前有将目标视为点,现有将目标视为一对中间线,O^2-DNet是一个单阶段,anchor-free和无NMS的模型,可以应用在场景文本检测和遥感目标检测上。
O^2-DNet
《Computation Reallocation for Object Detection》
链接:https://arxiv.org/abs/1912.11234
注:CR-NAS(计算重新分配神经网络架构搜索),它可以在目标检测数据集上直接学习跨不同特征分辨率和空间位置的计算重新分配策略。提出了用于阶段和空间重新分配的两级重新分配空间。采用一种新颖的分层搜索程序来应对复杂的搜索空间。
作者
将CR-NAS应用于多个backbone并实现持续改进。如CR-ResNet50和CR-MobileNetV2分别比基线高出1.9%和1.7%的COCO AP,而没有任何额外的计算代价。CR-NAS搜索的模型可以用于其他强大的检测neck/head,并可以轻松迁移到其他数据集,例如PASCAL VOC和其他视觉任务,例如实例分割。
【9】Dense RepPoints:
表示具有密集点集的视觉对象
《Dense RepPoints: Representing Visual Objects with Dense Point Sets》
作者团队:北大&港中文&浙大&上交&多伦多大学&MSRA
链接:https://arxiv.org/abs/1912.11473
注:Dense RepPoints是RepPoints(CVPR2019)的升级版,也是Anchor-Free阵营的,其在COCO test上可达45.8mAP,性能优于CenterNet、CornerNet等网络
为了方便下载,我已经将上述论文打包,在 CVer公众号 后台回复:20191226 即可获得打包链接。
如果各位CVer喜欢这样的"看尽"系列,请给这篇文章点个"在看",如果点击"在看"的人多,其它CV方向的"看尽"系列也会尽快推出!
CVer 推荐阅读
等待YOLOv4的期间,它还在更新
大盘点 | 2019年4篇目标检测算法最佳综述
大盘点 | 2019年3篇目标跟踪算法最佳综述
目标检测三大开源神器:Detectron2/mmDetectron/SimpleDet
YOLACT++:更强的实时实例分割网络,可达33.5 FPS/34.1mAP!
重磅!CVer-目标检测交流群已成立
扫码可添加CVer助手,可申请加入CVer大群和细分方向群,细分方向已涵盖:目标检测、图像分割、目标跟踪、人脸检测&识别、OCR、姿态估计、超分辨率、SLAM、医疗影像、Re-ID、GAN、NAS、深度估计、自动驾驶、强化学习、车道线检测、模型剪枝&压缩、去噪、去雾、去雨、风格迁移、遥感图像、行为识别、视频理解、图像融合、图像检索等群。
一定要备注:研究方向+地点+学校/公司+昵称(如目标检测+上海+上交+卡卡),根据格式备注,可更快被通过且邀请进群
▲长按加群
▲长按关注我们
麻烦给我一个在看!