点击上方“CVer”,选择加"星标"或“置顶”
重磅干货,第一时间送达
本文作者:跑者小越
https://zhuanlan.zhihu.com/p/134310466
本文已由原作者授权,不得擅自二次转载
更新日期:2020.4.23
由于知乎已经有几篇关于旋转检测的优秀综述类文章了( 文末会给出连接 ),所以我就选择另辟蹊径,以论文作者为主线来谈谈目前旋转检测的发展趋势。希望能够给自己和小伙伴们提供一些研究思路和灵感~
在腾讯优图实习的时候帮忙搜集过旋转目标检测的数据集,结果很让人诧异。除了遥感和文字检测领域,很少有其他的目标检测数据集会标注旋转框。这可能说明对于大部分目标检测任务来说,正框已经足够了。而在所有的旋转框数据集中,遥感图像领域占据了相当大的比例。
因此,这里把遥感旋转目标检测作为一个特殊的研究领域,单独拎出来聊聊。也正是由于遥感目标检测的特殊性,使得其在 CV 领域并不受审稿人待见。但是近年来遥感目标检测逐渐被 CV 领域所接受,这和 DOTA 数据集的出现以及下面要说的各位大佬们的努力是分不开的。不过目前如果单纯以遥感旋转框检测的名义还是很难发论文,还是需要对论文的立意进行一些包装或者加入文字数据集进行对比。
关于遥感旋转目标检测的数据集可以参考:
https://zhuanlan.zhihu.com/p/113579163
这里就不再赘述~
------------------------------------------------
那么遥感旋转框目标检测有哪些大佬呢?其实可以从 DOTA 数据集的 Oriented Leaderboard 就可以看出个大概:
其实前十名主要可以分为几个阵营:武大,南京理工,国科大,阿里,中科大
第一名是武大遥感国重实验室夏桂松组的学生 dingjian,你可能不知道这个实验室是什么概念,就是很厉害的那种!要知道,DOTA 数据集就是夏桂松老师和华科的白翔等人完成的。
第二名是南京理工的 pca_lab, 他们凭借强悍的模型一举包揽了 CVPR2019 Challenge on Object Detection in Aerial Images 水平框检测赛道的冠军以及旋转框检测赛道的亚军。
其中最大的阵营非国科大空天信息研究院莫属,前十名中就占据了4个位置,分别是 CITC,changzhonghan,Cyber.AI,yangxue. 据可靠消息,赛博智能据说是挂靠在研究院下面的公司,而 changzhonghan 和 yangxue 都曾在国科大读研。
小朋友你是否有很多问号?他们到底用是何许人也?不要急,接下来我们一个一个慢慢聊~
(然鹅我也并不是全都了解,所以只能说说我知道的,后续再补充吧~)
github:https://github.com/dingjiansw101
代表作:CVPR2019《Learning roi transformer for oriented object detection in aerial images》
时间:2018.12
论文链接:https://arxiv.org/abs/1812.00155
该论文是目前 DOTA 数据集旋转框目标检测赛道的第1名,原版是 mxnet,由于大多科研人员不会用 mxnet,作者良心地又写了个 mmdetection 版本。虽然使用的 mmdetection 基础版本比较老,好在经过一顿操作还是可以跑通的!从观察其 github 仓库竟发现了 DOTA 数据集工具包可以推出,此人不简单,必定是武大夏桂松组的硬核男人!
github:
代表作:CVPR2019 workshop《Learning Object-Wise Semantic Representation for Detection in Remote Sensing Imagery》
时间:2018.12
论文链接:
http://openaccess.thecvf.com/content_CVPRW_2019/papers/DOAI/Li_Learning_Object-Wise_Semantic_Representation_for_Detection_in_Remote_Sensing_Imagery_CVPRW_2019_paper.pdf
enhanced FPN
github:https://github.com/yangxue0827
代表作:ICCV2019《SCRDet: Towards More Robust Detection for Small, Cluttered and Rotated Objects》
时间:2018.11
论文链接:https://arxiv.org/abs/1811.07126
目前上海交大荣誉博士在读,平时在知乎很活跃。他凭借一己之力,让遥感旋转检测走进了我的世界 (句句属实,不吹不黑),他同时是两个 github 组织的成员:
Thinklab at Shanghai Jiao Tong University
UCAS-Det
前者是他在国科大读研时的目标检测组,后者是交大 Junchi Yan 教授的创建的思维工场实验室。他的论文代码全部使用 tensorflow 实现,从最开始的 R2CNN 到后来的 SCRDet,R3Det 以及最新的 SCRDet,所有代码全部开源,非常硬核!下面是他在知乎的几篇论文解读,感兴趣的朋友可以关注一波~
https://zhuanlan.zhihu.com/p/108185873
https://zhuanlan.zhihu.com/p/111493759
yangxue 专门整理了一个DOTA数据集相关文章的仓库:
https://github.com/SJTU-Thinklab-Det/DOTA-DOAI
github:暂无
代表作:《Adaptive Period Embedding for Representing Oriented Objects in Aerial Images》
时间:2019.06
论文链接:https://arxiv.org/abs/1906.09447
Length Independent IoU(LIIoU), 凭借这个模型包揽了 CVPR2019 Challenge on Object Detection in Aerial Images 旋转框检测赛道的冠军以及水平框检测赛道的亚军。
除了上述大佬外,还有一些大佬于近期取得了不错的研究成果!
代表作:CVPR2020 oral《Dynamic Refinement Network for Oriented and Densely PackedObject Detection》
时间:2019.11
论文链接:https://arxiv.org/abs/2005.09973
中科院自动化所模式识别实验室博士,师从董未名老师。该篇论文是他在腾讯优图实习期间所写,论文以 CenterNet 为 baseline,通过引入 Feature Selection Module 和 Dynamic Refinement Head ,解决了感受野与不同对象之间的失调问题并缓解了一般知识配置的模型与特定对象之间的矛盾。
代表作:TPAMI《Gliding vertex on the horizontal bounding box for multi-oriented object detection》
时间:2019.11
论文链接:https://ieeexplore.ieee.org/document/9001201
代码地址:https://github.com/MingtaoFu/gliding_vertex
quadrilateral bbox
https://zhuanlan.zhihu.com/p/105841613
https://zhuanlan.zhihu.com/p/105881332
以上就是这一期的全部内容了,谢谢各位小伙伴们观看!
如有疏略,还劳指出!若有猛料,欢迎补充!
十分期待接下来在遥感检测领域看到大佬们更多优秀的研究成果!
未完待续~
CVer-目标检测&遥感图像 交流群已成立
扫码添加CVer助手,可申请加入CVer-目标检测&遥感图像 微信交流群,目前已汇集3900人!涵盖2D/3D目标检测、小目标检测、遥感目标检测等。互相交流,一起进步!
同时也可申请加入CVer大群和细分方向技术群,细分方向已涵盖:目标检测、图像分割、目标跟踪、人脸检测&识别、OCR、姿态估计、超分辨率、SLAM、医疗影像、Re-ID、GAN、NAS、深度估计、自动驾驶、强化学习、车道线检测、模型剪枝&压缩、去噪、去雾、去雨、风格迁移、遥感图像、行为识别、视频理解、图像融合、图像检索、论文投稿&交流、PyTorch和TensorFlow等群。
一定要备注:研究方向+地点+学校/公司+昵称(如目标检测/遥感图像+上海+上交+卡卡),根据格式备注,可更快被通过且邀请进群
▲长按加群
▲长按关注我们
请给CVer一个在看!