点击上方“计算机视觉life”,选择“星标”
快速获得最新干货
CVPR 2019 已经过去一年了,本文盘点其中影响力最大的 20 篇论文,这里的影响力以谷歌学术上显示的论文的引用量排序,截止时间为2020年7月22日。
其中的一些结论蛮有意思的:
1. 这 20 篇论文全部开源了。不开源的论文复现代价大,别人参考的门槛会高很多,维护好论文对应的开源软件能极大提高论文影响力。
2. 方向分布在GAN、人脸识别、神经架构搜索、语义分割、图像合成、姿态估计、迁移学习、3D目标检测、全景分割、目标跟踪、图像分类、网络结构设计(可变形卷积)、对抗学习、三维重建等方向。
3. 引用数排名第一的 StyleGAN 引用次数 956 远超第二名 ArcFace 689 次,和第三名 Mnasnet 486 次。第 10 名 FBnet 228次,第20 名 Sophie 157 次。
4. 这些论文绝大多数有工业界巨头的身影,英伟达贡献 2 篇 (第一名来自英伟达),谷歌贡献 4 篇,Facebook 贡献 4 篇,亚马逊1篇, 国内微软亚研院2篇,商汤 1 篇,京东 1篇。
5. 目标检测是计算机视觉领域非常火的方向,但入选的两篇全是3D点云目标检测。
6. 人脸识别在工业界应用很火,但只有一篇论文入前20(大名鼎鼎的 ArcFace),说明这个领域的技术也许已经趋于成熟。
。。。
大家发现还有那些有意思的规律,欢迎在文末留言交流。
No.2 Arcface 人脸识别
Arcface: Additive angular margin loss for deep face recognition
用于深度人脸识别的加法角余量损失
作者 | Jiankang Deng, Jia Guo, Niannan Xue, Stefanos Zafeiriou
单位 | 伦敦帝国学院;InsightFace
论文 | https://arxiv.org/abs/1801.07698
代码 | https://github.com/deepinsight/insightface
解读 | https://zhuanlan.zhihu.com/p/76541084
引用次数 | 689
No.3 Mnasnet,神经架构搜索
Mnasnet: Platform-aware neural architecture search for mobile
移动端自动设计网络
作者 | Mingxing Tan, Bo Chen, Ruoming Pang, Vijay Vasudevan, Mark Sandler, Andrew Howard, Quoc V. Le
单位 | 谷歌
论文 | https://arxiv.org/abs/1807.11626
代码 | https://github.com/tensorflow/tpu/tree/
master/models/official/mnasnet
引用次数 | 486
场景分割的双注意力网络
作者 | Jun Fu, Jing Liu, Haijie Tian, Yong Li, Yongjun Bao, Zhiwei Fang, Hanqing Lu
单位 | 中科院自动化所;京东;国科大
论文 | https://arxiv.org/abs/1809.02983
代码 | https://github.com/junfu1115/DANet
引用次数 | 400
AutoAugment: Learning augmentation strategies from data
作者 | Ekin D. Cubuk, Barret Zoph, Dandelion Mane, Vijay Vasudevan, Quoc V. Le
单位 | 谷歌大脑
论文 | https://arxiv.org/abs/1805.09501
代码 | https://github.com/tensorflow/models/tree/
master/research/autoaugment
引用次数 | 377
No.6 SPADE 图像合成
Semantic image synthesis with spatially-adaptive normalization
具有空间适应性归一化的语义图像合成技术
作者 | Taesung Park, Ming-Yu Liu, Ting-Chun Wang, Jun-Yan Zhu
单位 | UC Berkeley ;英伟达;MIT CSAIL
论文 | https://arxiv.org/abs/1903.07291
代码 | https://github.com/NVlabs/SPADE
备注 | CVPR 2019 Oral
引用次数 | 292
用于人体姿态估计的深度高分辨率表征学习
作者 | Ke Sun, Bin Xiao, Dong Liu, Jingdong Wang
单位 | 中国科学技术大学;微软亚洲研究院
论文 | https://arxiv.org/abs/1902.09212
代码 | https://github.com/leoxiaobin/deep-high-resolution-net.pytorch
解读 | https://zhuanlan.zhihu.com/p/57876066
引用次数 | 282
No.8 Auto-Deeplab NAS+语义分割
作者 | Chenxi Liu, Liang-Chieh Chen, Florian Schroff, Hartwig Adam, Wei Hua, Alan Yuille, Li Fei-Fei
单位 | 约翰斯霍普金斯大学;谷歌;斯坦福大学
论文 | https://arxiv.org/abs/1901.02985
代码 | https://github.com/tensorflow/models/tree/
master/research/deeplab
解读 | 谷歌Auto-DeepLab:自动搜索图像语义分割架构算法开源实现
备注 | CVPR 2019 Oral
引用次数 | 233
No.9 迁移学习
作者 | Simon Kornblith, Jonathon Shlens, Quoc V. Le
单位 | 谷歌大脑
论文 | https://arxiv.org/abs/1805.08974
代码 | https://github.com/lsh3163/Imagenet-Better
备注 | CVPR 2019 Oral
引用次数 | 232
No.10 FBNet 神经架构搜索
通过可微的神经架构搜索实现硬件感知的高效convnet设计
作者 | Bichen Wu, Xiaoliang Dai, Peizhao Zhang, Yanghan Wang, Fei Sun, Yiming Wu, Yuandong Tian, Peter Vajda, Yangqing Jia, Kurt Keutzer
单位 | UC Berkeley;普林斯顿大学;Facebook
论文 | https://arxiv.org/abs/1812.03443
代码 | https://github.com/facebookresearch/
mobile-vision
引用次数 | 228
PointRCNN 第一个基于原始点云的3D目标检测
作者 | Shaoshuai Shi, Xiaogang Wang, Hongsheng Li
单位 | 香港中文大学
论文 | https://arxiv.org/abs/1812.04244
代码 | https://github.com/sshaoshuai/PointRCNN
解读 | https://zhuanlan.zhihu.com/p/71564244
引用次数 | 207
No.12 Pointpillars 3D目标检测
从点云中进行目标检测的快速编码器
作者 | Alex H. Lang, Sourabh Vora, Holger Caesar, Lubing Zhou, Jiong Yang, Oscar Beijbom
单位 | nuTonomy: an APTIV company
论文 | https://arxiv.org/abs/1812.05784
代码 | https://github.com/nutonomy/second.pytorch
引用次数 | 191
No.13 全景分割开山之作
Panoptic segmentation
作者 | Alexander Kirillov, Kaiming He, Ross Girshick, Carsten Rother, Piotr Dollár
单位 | FAIR;海德堡大学
论文 | https://arxiv.org/abs/1801.00868
代码 | https://github.com/facebookresearch/detectron2/
引用次数 | 186
作者 | Bo Li, Wei Wu, Qiang Wang, Fangyi Zhang, Junliang Xing, Junjie Yan
单位 | 商汤;中科院自动化所;中科院计算所
论文 | https://arxiv.org/abs/1812.11703
代码 | http://github.com/STVIR/pysot
主页 | http://bo-li.info/SiamRPN++/
解读 | https://zhuanlan.zhihu.com/p/56254712
引用次数 | 188
Fast Online Object Tracking and Segmentation: A Unifying Approach
作者 | Qiang Wang, Li Zhang, Luca Bertinetto, Weiming Hu, Philip H.S. Torr
单位 | 中科院自动化所;牛津大学;FiveAI
论文 | https://arxiv.org/abs/1812.05050
代码 | https://github.com/foolwood/SiamMask
主页 | http://www.robots.ox.ac.uk/~qwang/SiamMask/
解读 | CVPR 2019 | 惊艳的SiamMask:开源快速同时进行目标跟踪与分割算法
引用次数 | 185
单位 | 亚马逊
论文 | https://arxiv.org/abs/1812.01187
代码 | https://github.com/dmlc/gluon-cv
引用次数 | 183
No.17 升级版可变形卷积
Deformable convnets v2: More deformable, better results
作者 | Xizhou Zhu, Han Hu, Stephen Lin, Jifeng Dai
单位 | 中国科学技术大学;微软亚洲研究院
论文 | https://arxiv.org/abs/1811.11168
代码 | https://github.com/msracver/Deformable-ConvNets
解读 | https://zhuanlan.zhihu.com/p/77644792
引用次数 | 182
作者 | Cihang Xie, Yuxin Wu, Laurens van der Maaten, Alan Yuille, Kaiming He
单位 | 约翰斯霍普金斯大学;FAIR
论文 | https://arxiv.org/abs/1812.03411
代码 | https://github.com/facebookresearch/ImageNet-Adversarial-Training
引用次数 | 179
作者 | Jeong Joon Park, Peter Florence, Julian Straub, Richard Newcombe, Steven Lovegrove
单位 | 华盛顿大学;麻省理工学院;Facebook Reality Labs
论文 | https://arxiv.org/abs/1901.05103
代码 | https://github.com/facebookresearch/DeepSDF
引用次数 | 172
Sophie: An attentive gan for predicting paths compliant to social and physical constraints
作者 | Amir Sadeghian, Vineet Kosaraju, Ali Sadeghian, Noriaki Hirose, S. Hamid Rezatofighi, Silvio Savarese
单位 | 斯坦福大学;佛罗里达大学;阿德莱德大学
论文 | https://arxiv.org/abs/1806.01482
代码 | https://github.com/StanfordVL/sophie
引用次数 | 157
从0到1学习SLAM,戳↓
欢迎加入公众号读者群一起和同行交流,目前有SLAM、三维视觉、传感器、自动驾驶、计算摄影、检测、分割、识别、医学影像、GAN、算法竞赛等微信群(以后会逐渐细分),请扫描下面微信号加群,备注:”昵称+学校/公司+研究方向“,例如:”张三 + 上海交大 + 视觉SLAM“。请按照格式备注,否则不予通过。添加成功后会根据研究方向邀请进入相关微信群。请勿在群内发送广告,否则会请出群,谢谢理解~
投稿、合作也欢迎联系:simiter@126.com
长按关注计算机视觉life