2017年,中国计算机视觉初创公司屡创纪录,前有商汤4.1亿,后有旷视4.6亿;涉及计算机视觉技术的无人便利店作为新零售领域中的延伸,成为创投圈风口之一。Computer Vision 开始走入大众视野,作为人工智能一个很重要的研究方向。
AI 科技评论对一些优秀计算机视觉类论文进行了简单的整理,推荐给大家!
1.「Densely Connected Convolutional Networks」
论文作者:康奈尔大学 Gao Huang,清华大学 Zhuang Liu,康奈尔大学 Kilian Q. Weinberger,Facebook 人工智能研究院 Laurens van der Maaten
论文地址:https://arxiv.org/abs/1608.06993
论文简介:近期的研究已经展现这样一种趋势,如果卷积网络中离输入更近或者离输出更近的层之间的连接更短,网络就基本上可以更深、更准确,训练时也更高效。这篇论文就对这种趋势进行了深入的研究,并提出了密集卷积网络(DenseNet)。
2.「Learning From Simulated and Unsupervised Images through Adversarial Training」
论文作者:苹果公司 Ashish Shrivastava, Tomas Pfister, Oncel Tuzel, Josh Susskind, Wenda Wang, Russ Webb
论文地址:https://arxiv.org/abs/1612.07828
论文简介:随着图像领域的进步,用生成的图像训练机器学习模型的可行性越来越高,大有避免人工标注真实图像的潜力。但是,由于生成的图像和真实图像的分布有所区别,用生成的图像训练的模型可能没有用真实图像训练的表现那么好。为了缩小这种差距,论文中提出了一种模拟+无监督的学习方式,其中的任务就是学习到一个模型,它能够用无标注的真实数据提高模拟器生成的图片的真实性,同时还能够保留模拟器生成的图片的标注信息。
3.「Annotating Object Instance with a Polygon-RNN」
论文作者:多伦多大学计算机学院Llu´ıs Castrejon,Kaustav Kundu,Raquel Urtasun,Sanja Fidler
论文地址:https://arxiv.org/abs/1704.05548
论文简介:论文中介绍了一种半自动的物体标注方法。这套系统的思路是,不再像以往一样把图像中的物体分割作为一种像素标注问题,把它看作一个多边形位置预测问题,从而模仿目前已有的标注数据集的方式生成检测标注框。
4.「YOLO9000: Better, Faster, Stronger」
论文作者:华盛顿大学,Allen 人工智能学院的 Joseph Redmon 与 Ali Farhadi
论文地址:https://arxiv.org/abs/1612.08242
论文简介:论文中介绍了名为“YOLO9000”的顶级水平的实时物体检测系统,它可以检测的物体种类达到了9000种。论文中首先介绍了对原始的 YOLO 系统的多方面提升,有些是论文中新提出的方法,有些是从之前别人的成果中借鉴的。提升后的 YOLOv2 模型在 PASCAL VOC 和 COCO 这样标准的物体检测任务中有顶级的表现。
5.「Computational Imaging on the Electric Grid」
论文作者:以色列理工学院电气工程学院 Mark Sheinin、Yoav Y. Schechner,多伦多大学计算机学院 Kiriakos N. Kutulakos
论文地址:
http://openaccess.thecvf.com/content_cvpr_2017/papers/Sheinin_Computational_Imaging_on_CVPR_2017_paper.pdf
论文简介:夜晚的风景随着交流电照明一起跳动。通过被动方式感知这种跳动,论文中用一种新的方式揭示了夜景中的另一番画面:夜景中灯泡的类型是哪些、上至城市规模的供电区域相位如何,以及光的传输矩阵。
6.「Object retrieval with large vocabularies and fast spatial matching」
论文作者:牛津大学科学工程学院James Philbin、Ondˇrej Chum、Josef Sivic、Andrew Zisserman,微软硅谷研究院 Michael Isard
论文地址:
https://pdfs.semanticscholar.org/943d/793f6cbbc6551d758c1eefca2a9333bd8921.pdf
论文简介:这篇论文介绍了一个大规模的物体图像搜寻系统。系统把用户在一副图片中框选的区域作为查询输入,然后就可以返回一个有序列表,其中都是从指定的大数据集中找到的含有同一个物体的图像。论文中用从 Flickr 上爬超下来的超过100万张图像组成一个数据集,用牛津大学的地标作为查询输入,展示了系统的可拓展性和查询性能。
更多活动丨转发此文至朋友圈或百人群,截图发小助手(微信 ID:aimooc-xm)
领取计算机视觉论文资料包+30元课程优惠券!
计算机视觉领域这么火,但自学总是感觉知识碎片化、不系统,遇到专业难题也希望能及时找到导师进行指导!
如果您深受上述情况困扰,AI科技评论联合友军AI慕课学院特邀上海交通大学晏轶超博士和卢宪凯博士,为大家带来《计算机视觉基础入门(从算法到实战应用)》课程,课程从算法到实战应用,涵盖CV领域主要知识点;拥有丰富实战经验的讲师团队手把手项目演示,全程提供代码;深度剖析CV研究体系,轻松实战深度学习应用领域!
开课丨1月1日起,每周更新录播,共24个课时,12次课
报名丨戳“阅读原文”或扫描文末二维码
适合人群丨在想入门计算机视觉和深度学习的学生或从业者/未来想从事深度学习工作的求职者
课程导师
晏轶超
上海交通大学五年级博士
发表多篇人工智能及计算机视觉顶级会议,包括AAAI, IJCAI, ECCV, ACM MM等;有多家计算机视觉、互联网公司实习经历,包括滴滴出行,地平线及机器人,云从科技,腾讯优图实验室等。
卢宪凯
上海交通大学博士
主要研究方向是目标跟踪与深度学习。在多个计算机视觉期刊会议上发表多篇学术论文,包括IEEE Transaction on Multimedia,MTA,Neurocomputing,ICASSP;曾参加大华智能监控项目、计算机视觉研讨会等项目,目前在小视科技(Minivision)实习。
课程亮点
涵盖CV领域主要知识点,带你轻松入门
讲师团队授课经验丰富,BAT及AI初创公司工作经历
知识点+案例实战,详细讲解CV相关重要知识点
随到随学,提供代码和学习资料,讲师及助教在线及时答疑
课程大纲
第一课
1. 本课程介绍
2. 计算机视觉历史回顾,从浅层学习到深度学习
第二课
1. 深度卷积网络的原理与模型介绍,
2. CNN(AlexNet, VGGNet, ResNet, DenseNet)
3. 图像分类
4. 项目实战:搭建和训练一个深度学习网络
第三课
1. 人脸识别原理与案例
2. 关键点定位,人脸对齐与识别
3. Deepface, FaceNet
4. 项目实战:人脸识别演示
第四课
1. 目标检测原理与应用
2. Fast-rcnn, Faster-rcnn, Yolo, SSD, RetinaNet
3. 项目实战:目标检测源码分析
第五课
1. 生成模型与应用
2. 对抗生成网络(GAN), 图片生成
3. 项目实战:一个有趣的生成网络实例和分析
第六课
1. 图片分割
2. 语义分割,实例分割
3. 项目实战:源码分析
第七课
1. 深度学习在序列数据中的应用
2. 循环神经网络(RNN),长短记忆网络(LSTM)
第八课
1. 目标跟踪
2. 单目标跟踪,多目标跟踪
3. 项目实战:目标跟踪实例
第九课
1. 动作识别
2. 光流(Flownet),3D CNN
3. Pose estimation
4. 项目实战:Flownet演示
第十课
1. 视频分割
2. PSPNet, Resnet38
3. 项目实战:视频分割在无人驾驶中的应用
第十一课
1. 强化学习
2. 策略梯度, Q-Learning
3. 项目实战:案例分析,以Flyingbird为例
第十二课
1. 常用的深度学习开发平台
2. Caffe, Tensorflow, Torch
3. 项目实战:架构分析
价格与优惠
原价:1099元,早鸟价499元
拼团价:399元,4人成团,每人优惠100元!
优惠:转发本文至朋友圈/百人群,截图发小助手领取CV论文资料包+30元优惠券!
报名与咨询
1、报名:进入课程页面,点击“报名”,一键购买
课程地址:http://www.mooc.ai/course/353
2、课程咨询:添加客服慕慕,备注“CV”(微信:aimooc-xm)
3、找人拼团:扫码进课程咨询群,4人+组团享低价优惠
————— AI 科技评论招人了 —————
AI 科技评论期待你的加入,和我们一起见证未来!
现诚招学术编辑、学术兼职、学术外翻
详情请点击招聘启事
————————————————————