干货 | 一键收藏,2017值得推荐的6篇计算机视觉论文!

2017 年 12 月 14 日 AI科技评论 AI 慕课

2017年,中国计算机视觉初创公司屡创纪录,前有商汤4.1亿,后有旷视4.6亿;涉及计算机视觉技术的无人便利店作为新零售领域中的延伸,成为创投圈风口之一。Computer Vision 开始走入大众视野,作为人工智能一个很重要的研究方向。


AI 科技评论对一些优秀计算机视觉类论文进行了简单的整理,推荐给大家!



1.「Densely Connected Convolutional Networks」


论文作者:康奈尔大学 Gao Huang,清华大学 Zhuang Liu,康奈尔大学 Kilian Q. Weinberger,Facebook 人工智能研究院 Laurens van der Maaten


论文地址:https://arxiv.org/abs/1608.06993 


论文简介:近期的研究已经展现这样一种趋势,如果卷积网络中离输入更近或者离输出更近的层之间的连接更短,网络就基本上可以更深、更准确,训练时也更高效。这篇论文就对这种趋势进行了深入的研究,并提出了密集卷积网络(DenseNet)。


2.「Learning From Simulated and Unsupervised Images through Adversarial Training」


论文作者:苹果公司 Ashish Shrivastava, Tomas Pfister, Oncel Tuzel, Josh Susskind, Wenda Wang, Russ Webb


论文地址:https://arxiv.org/abs/1612.07828 


论文简介:随着图像领域的进步,用生成的图像训练机器学习模型的可行性越来越高,大有避免人工标注真实图像的潜力。但是,由于生成的图像和真实图像的分布有所区别,用生成的图像训练的模型可能没有用真实图像训练的表现那么好。为了缩小这种差距,论文中提出了一种模拟+无监督的学习方式,其中的任务就是学习到一个模型,它能够用无标注的真实数据提高模拟器生成的图片的真实性,同时还能够保留模拟器生成的图片的标注信息。


3.「Annotating Object Instance with a Polygon-RNN」


论文作者:多伦多大学计算机学院Llu´ıs Castrejon,Kaustav Kundu,Raquel Urtasun,Sanja Fidler


论文地址:https://arxiv.org/abs/1704.05548 


论文简介:论文中介绍了一种半自动的物体标注方法。这套系统的思路是,不再像以往一样把图像中的物体分割作为一种像素标注问题,把它看作一个多边形位置预测问题,从而模仿目前已有的标注数据集的方式生成检测标注框。


4.「YOLO9000: Better, Faster, Stronger」


论文作者:华盛顿大学,Allen 人工智能学院的 Joseph Redmon 与 Ali Farhadi


论文地址:https://arxiv.org/abs/1612.08242 


论文简介:论文中介绍了名为“YOLO9000”的顶级水平的实时物体检测系统,它可以检测的物体种类达到了9000种。论文中首先介绍了对原始的 YOLO 系统的多方面提升,有些是论文中新提出的方法,有些是从之前别人的成果中借鉴的。提升后的 YOLOv2 模型在 PASCAL VOC 和 COCO 这样标准的物体检测任务中有顶级的表现。


5.「Computational Imaging on the Electric Grid」


论文作者:以色列理工学院电气工程学院 Mark Sheinin、Yoav Y. Schechner,多伦多大学计算机学院 Kiriakos N. Kutulakos


论文地址

http://openaccess.thecvf.com/content_cvpr_2017/papers/Sheinin_Computational_Imaging_on_CVPR_2017_paper.pdf 


论文简介:夜晚的风景随着交流电照明一起跳动。通过被动方式感知这种跳动,论文中用一种新的方式揭示了夜景中的另一番画面:夜景中灯泡的类型是哪些、上至城市规模的供电区域相位如何,以及光的传输矩阵。


6.「Object retrieval with large vocabularies and fast spatial matching」


论文作者:牛津大学科学工程学院James Philbin、Ondˇrej Chum、Josef Sivic、Andrew Zisserman,微软硅谷研究院 Michael Isard


论文地址

https://pdfs.semanticscholar.org/943d/793f6cbbc6551d758c1eefca2a9333bd8921.pdf 


论文简介:这篇论文介绍了一个大规模的物体图像搜寻系统。系统把用户在一副图片中框选的区域作为查询输入,然后就可以返回一个有序列表,其中都是从指定的大数据集中找到的含有同一个物体的图像。论文中用从 Flickr 上爬超下来的超过100万张图像组成一个数据集,用牛津大学的地标作为查询输入,展示了系统的可拓展性和查询性能。


更多活动丨转发此文至朋友圈或百人群,截图发小助手(微信 ID:aimooc-xm)

领取计算机视觉论文资料包+30元课程优惠


计算机视觉领域这么火,但自学总是感觉知识碎片化、不系统,遇到专业难题也希望能及时找到导师进行指导!


如果您深受上述情况困扰,AI科技评论联合友军AI慕课学院特邀上海交通大学晏轶超博士和卢宪凯博士,为大家带来《计算机视觉基础入门(从算法到实战应用)》课程,课程从算法到实战应用,涵盖CV领域主要知识点;拥有丰富实战经验的讲师团队手把手项目演示,全程提供代码;深度剖析CV研究体系,轻松实战深度学习应用领域!


开课丨1月1日起,每周更新录播,共24个课时,12次课

报名丨戳“阅读原文”或扫描文末二维码

适合人群丨在想入门计算机视觉和深度学习的学生或从业者/未来想从事深度学习工作的求职者


课程导师


晏轶超

上海交通大学五年级博士


发表多篇人工智能及计算机视觉顶级会议,包括AAAI, IJCAI, ECCV, ACM MM等;有多家计算机视觉、互联网公司实习经历,包括滴滴出行,地平线及机器人,云从科技,腾讯优图实验室等。


卢宪凯

上海交通大学博士


主要研究方向是目标跟踪与深度学习。在多个计算机视觉期刊会议上发表多篇学术论文,包括IEEE Transaction on Multimedia,MTA,Neurocomputing,ICASSP;曾参加大华智能监控项目、计算机视觉研讨会等项目,目前在小视科技(Minivision)实习。


课程亮点 


  1. 涵盖CV领域主要知识点,带你轻松入门

  2. 讲师团队授课经验丰富,BAT及AI初创公司工作经历

  3. 知识点+案例实战,详细讲解CV相关重要知识点

  4. 随到随学,提供代码和学习资料,讲师及助教在线及时答疑


课程大纲 

第一课

1. 本课程介绍

2. 计算机视觉历史回顾,从浅层学习到深度学习

第二课

1. 深度卷积网络的原理与模型介绍,

2. CNN(AlexNet, VGGNet, ResNet, DenseNet)

3. 图像分类

4. 项目实战:搭建和训练一个深度学习网络

第三课

1. 人脸识别原理与案例

2. 关键点定位,人脸对齐与识别

3. Deepface, FaceNet

4. 项目实战:人脸识别演示

第四课

1. 目标检测原理与应用

2. Fast-rcnn, Faster-rcnn, Yolo, SSD, RetinaNet

3. 项目实战:目标检测源码分析

第五课

1. 生成模型与应用

2. 对抗生成网络(GAN), 图片生成

3. 项目实战:一个有趣的生成网络实例和分析

第六课

1. 图片分割

2. 语义分割,实例分割

3. 项目实战:源码分析

第七课

1. 深度学习在序列数据中的应用

2. 循环神经网络(RNN),长短记忆网络(LSTM)

第八课

1. 目标跟踪

2. 单目标跟踪,多目标跟踪

3. 项目实战:目标跟踪实例

第九课

1. 动作识别

2. 光流(Flownet),3D CNN

3. Pose estimation

4. 项目实战:Flownet演示

第十课

1. 视频分割

2. PSPNet, Resnet38

3. 项目实战:视频分割在无人驾驶中的应用

第十一课

1. 强化学习

2. 策略梯度, Q-Learning

3. 项目实战:案例分析,以Flyingbird为例

第十二课

1. 常用的深度学习开发平台

2. Caffe, Tensorflow, Torch

3. 项目实战:架构分析


价格与优惠


原价1099元早鸟价499元

拼团价:399元,4人成团,每人优惠100元!

优惠:转发本文至朋友圈/百人群,截图发小助手领取CV论文资料包+30元优惠券!


报名与咨询


1、报名:进入课程页面,点击“报名”,一键购买

课程地址:http://www.mooc.ai/course/353


2、课程咨询:添加客服慕慕,备注“CV”(微信:aimooc-xm)


3、找人拼团:扫码进课程咨询群,4人+组团享低价优惠



—————  AI 科技评论招人了  —————

AI 科技评论期待你的加入,和我们一起见证未来!

现诚招学术编辑、学术兼职、学术外翻

详情请点击招聘启事

————————————————————

登录查看更多
6

相关内容

计算机视觉是一门研究如何使机器“看”的科学,更进一步的说,就是是指用摄影机和电脑代替人眼对目标进行识别、跟踪和测量等机器视觉,并进一步做图形处理,使电脑处理成为更适合人眼观察或传送给仪器检测的图像。作为一个科学学科,计算机视觉研究相关的理论和技术,试图建立能够从图像或者多维数据中获取‘信息’的人工智能系统。

知识荟萃

精品入门和进阶教程、论文和代码整理等

更多

查看相关VIP内容、论文、资讯等
【资源】100+本免费数据科学书
专知会员服务
107+阅读 · 2020年3月17日
专知会员服务
109+阅读 · 2020年3月12日
抢鲜看!13篇CVPR2020论文链接/开源代码/解读
专知会员服务
49+阅读 · 2020年2月26日
【AAAI2020知识图谱论文概述】Knowledge Graphs @ AAAI 2020
专知会员服务
133+阅读 · 2020年2月13日
AAAI2020接受论文列表,1591篇论文目录全集
专知会员服务
98+阅读 · 2020年1月12日
【深度学习视频分析/多模态学习资源大列表】
专知会员服务
91+阅读 · 2019年10月16日
从十篇热门学术论文看计算机视觉的未来
计算机视觉life
6+阅读 · 2019年9月11日
CVPR 2019 论文解读精选
AI研习社
7+阅读 · 2019年6月16日
视频生成的前沿论文,看我们推荐的7篇就够了
人工智能前沿讲习班
34+阅读 · 2018年12月30日
Arxiv
14+阅读 · 2019年11月26日
VIP会员
相关VIP内容
【资源】100+本免费数据科学书
专知会员服务
107+阅读 · 2020年3月17日
专知会员服务
109+阅读 · 2020年3月12日
抢鲜看!13篇CVPR2020论文链接/开源代码/解读
专知会员服务
49+阅读 · 2020年2月26日
【AAAI2020知识图谱论文概述】Knowledge Graphs @ AAAI 2020
专知会员服务
133+阅读 · 2020年2月13日
AAAI2020接受论文列表,1591篇论文目录全集
专知会员服务
98+阅读 · 2020年1月12日
【深度学习视频分析/多模态学习资源大列表】
专知会员服务
91+阅读 · 2019年10月16日
Top
微信扫码咨询专知VIP会员