干货 | 一键收藏，2017值得推荐的6篇计算机视觉论文！

会员服务 ·

干货 | 一键收藏，2017值得推荐的6篇计算机视觉论文！

2017 年 12 月 15 日 雷锋网 AI 慕课

2017年，中国计算机视觉初创公司屡创纪录，前有商汤4.1亿，后有旷视4.6亿；涉及计算机视觉技术的无人便利店作为新零售领域中的延伸，成为创投圈风口之一。Computer Vision 开始走入大众视野，作为人工智能一个很重要的研究方向。

雷锋网 AI 科技评论对一些优秀计算机视觉类论文进行了简单的整理，推荐给大家！

1.「Densely Connected Convolutional Networks」

论文作者：康奈尔大学 Gao Huang，清华大学 Zhuang Liu，康奈尔大学 Kilian Q. Weinberger，Facebook 人工智能研究院 Laurens van der Maaten

论文地址：https://arxiv.org/abs/1608.06993

论文简介：近期的研究已经展现这样一种趋势，如果卷积网络中离输入更近或者离输出更近的层之间的连接更短，网络就基本上可以更深、更准确，训练时也更高效。这篇论文就对这种趋势进行了深入的研究，并提出了密集卷积网络（DenseNet）。

2.「Learning From Simulated and Unsupervised Images through Adversarial Training」

论文作者：苹果公司 Ashish Shrivastava, Tomas Pfister, Oncel Tuzel, Josh Susskind, Wenda Wang, Russ Webb

论文地址：https://arxiv.org/abs/1612.07828

论文简介：随着图像领域的进步，用生成的图像训练机器学习模型的可行性越来越高，大有避免人工标注真实图像的潜力。但是，由于生成的图像和真实图像的分布有所区别，用生成的图像训练的模型可能没有用真实图像训练的表现那么好。为了缩小这种差距，论文中提出了一种模拟+无监督的学习方式，其中的任务就是学习到一个模型，它能够用无标注的真实数据提高模拟器生成的图片的真实性，同时还能够保留模拟器生成的图片的标注信息。

3.「Annotating Object Instance with a Polygon-RNN」

论文作者：多伦多大学计算机学院Llu´ıs Castrejon，Kaustav Kundu，Raquel Urtasun，Sanja Fidler

论文地址：https://arxiv.org/abs/1704.05548

论文简介：论文中介绍了一种半自动的物体标注方法。这套系统的思路是，不再像以往一样把图像中的物体分割作为一种像素标注问题，把它看作一个多边形位置预测问题，从而模仿目前已有的标注数据集的方式生成检测标注框。

4.「YOLO9000: Better, Faster, Stronger」

论文作者：华盛顿大学，Allen 人工智能学院的 Joseph Redmon 与 Ali Farhadi

论文地址：https://arxiv.org/abs/1612.08242

论文简介：论文中介绍了名为“YOLO9000”的顶级水平的实时物体检测系统，它可以检测的物体种类达到了9000种。论文中首先介绍了对原始的 YOLO 系统的多方面提升，有些是论文中新提出的方法，有些是从之前别人的成果中借鉴的。提升后的 YOLOv2 模型在 PASCAL VOC 和 COCO 这样标准的物体检测任务中有顶级的表现。

5.「Computational Imaging on the Electric Grid」

论文作者：以色列理工学院电气工程学院 Mark Sheinin、Yoav Y. Schechner，多伦多大学计算机学院 Kiriakos N. Kutulakos

论文地址：

http://openaccess.thecvf.com/content_cvpr_2017/papers/Sheinin_Computational_Imaging_on_CVPR_2017_paper.pdf

论文简介：夜晚的风景随着交流电照明一起跳动。通过被动方式感知这种跳动，论文中用一种新的方式揭示了夜景中的另一番画面：夜景中灯泡的类型是哪些、上至城市规模的供电区域相位如何，以及光的传输矩阵。

6.「Object retrieval with large vocabularies and fast spatial matching」

论文作者：牛津大学科学工程学院James Philbin、Ondˇrej Chum、Josef Sivic、Andrew Zisserman，微软硅谷研究院 Michael Isard

论文地址：

https://pdfs.semanticscholar.org/943d/793f6cbbc6551d758c1eefca2a9333bd8921.pdf

论文简介：这篇论文介绍了一个大规模的物体图像搜寻系统。系统把用户在一副图片中框选的区域作为查询输入，然后就可以返回一个有序列表，其中都是从指定的大数据集中找到的含有同一个物体的图像。论文中用从 Flickr 上爬超下来的超过100万张图像组成一个数据集，用牛津大学的地标作为查询输入，展示了系统的可拓展性和查询性能。

更多活动丨转发此文至朋友圈或百人群，截图发小助手（微信 ID:aimooc-xm）

领取计算机视觉论文资料包+30元课程优惠券！

计算机视觉领域这么火，但自学总是感觉知识碎片化、不系统，遇到专业难题也希望能及时找到导师进行指导！

如果您深受上述情况困扰，AI科技评论联合友军AI慕课学院特邀上海交通大学晏轶超博士和卢宪凯博士，为大家带来《计算机视觉基础入门（从算法到实战应用）》课程，课程从算法到实战应用，涵盖CV领域主要知识点；拥有丰富实战经验的讲师团队手把手项目演示，全程提供代码；深度剖析CV研究体系，轻松实战深度学习应用领域！

开课丨1月1日起，每周更新录播，共24个课时，12次课

报名丨戳“阅读原文”或扫描文末二维码

适合人群丨在想入门计算机视觉和深度学习的学生或从业者/未来想从事深度学习工作的求职者

课程导师

晏轶超

上海交通大学五年级博士

发表多篇人工智能及计算机视觉顶级会议，包括AAAI， IJCAI， ECCV， ACM MM等；有多家计算机视觉、互联网公司实习经历，包括滴滴出行，地平线及机器人，云从科技，腾讯优图实验室等。

卢宪凯

上海交通大学博士

主要研究方向是目标跟踪与深度学习。在多个计算机视觉期刊会议上发表多篇学术论文，包括IEEE Transaction on Multimedia，MTA，Neurocomputing，ICASSP；曾参加大华智能监控项目、计算机视觉研讨会等项目，目前在小视科技（Minivision）实习。

课程亮点

涵盖CV领域主要知识点，带你轻松入门
讲师团队授课经验丰富，BAT及AI初创公司工作经历
知识点+案例实战，详细讲解CV相关重要知识点
随到随学，提供代码和学习资料，讲师及助教在线及时答疑

课程大纲

第一课

1. 本课程介绍

2. 计算机视觉历史回顾，从浅层学习到深度学习

第二课

1. 深度卷积网络的原理与模型介绍，

2. CNN(AlexNet, VGGNet, ResNet, DenseNet)

3. 图像分类

4. 项目实战：搭建和训练一个深度学习网络

第三课

1. 人脸识别原理与案例

2. 关键点定位，人脸对齐与识别

3. Deepface, FaceNet

4. 项目实战：人脸识别演示

第四课

1. 目标检测原理与应用

2. Fast-rcnn, Faster-rcnn, Yolo, SSD, RetinaNet

3. 项目实战：目标检测源码分析

第五课

1. 生成模型与应用

2. 对抗生成网络(GAN), 图片生成

3. 项目实战：一个有趣的生成网络实例和分析

第六课

1. 图片分割

2. 语义分割，实例分割

3. 项目实战：源码分析

第七课

1. 深度学习在序列数据中的应用

2. 循环神经网络(RNN)，长短记忆网络(LSTM)

第八课

1. 目标跟踪

2. 单目标跟踪，多目标跟踪

3. 项目实战：目标跟踪实例

第九课

1. 动作识别

2. 光流（Flownet），3D CNN

3. Pose estimation

4. 项目实战：Flownet演示

第十课

1. 视频分割

2. PSPNet， Resnet38

3. 项目实战：视频分割在无人驾驶中的应用

第十一课

1. 强化学习

2. 策略梯度， Q-Learning

3. 项目实战：案例分析，以Flyingbird为例

第十二课

1. 常用的深度学习开发平台

2. Caffe, Tensorflow, Torch

3. 项目实战：架构分析