【ICME2019】出行领域计算机视觉技术,滴滴AI Labs教程,117页PPT

2019 年 7 月 16 日 专知
【ICME2019】出行领域计算机视觉技术,滴滴AI Labs教程,117页PPT

【导读】2019年7月8日-12日,图像视觉领域的知名会议IEEE国际多 媒体 与博览会(ICME)在上海召开。滴滴Computer Vision in Transportation讲习班以实践应用为核心,多方面地讲解当前视觉技术在交通领域的应用与原理。在垂直领域找到与技术深度结合的应用场景是当前计算机视觉技术落地的一个重要命题。计算机视觉技术的落地也势必会直接影响我们衣食住行的方方面面。特别在出行领域,计算机视觉技术的应用将会极大提高交通运行效率和安全水平。


第一部分覆盖交通领域视觉应用背后支撑的方法和原理,包括深度学习知识、图像分类以及目标检测等;第二部分主要集中讲在交通领域的应用中所需要的前沿性探索问题:域适应(Domain Adaptation)和轻量级模型(Lightweight Models);最后一部分讲述了计算机视觉在出行领域的两大应用方向。



1


第一章

计算机视觉导论

(Introduction to Computer Vision)


讲师:滴滴AI Labs 车正平博士


大纲:


 Computer Vision Basics

      • Representation Learning

      • Activation Functions

      • Neural Network Structures

      • Convolution Operators

      • Pooling Layers

      • Batch Normalization

• Image Classification

     • Datasets & Competitions

     • Roadmap

     • Classification Networks

     • Experiments

• Object Detection

     • Introduction & Roadmap

     • Region-Based Methods

     • Region-Free Methods

     • Experiments


亮点:在本演讲中,简明扼要地讲述了深度学习时代的视觉技术基础,如表征学习、激活函数、神经网络、卷积操作、池化层和批归一化等入门知识,详细地介绍了图像分类和目标检测的全局路线图和代表性工作,分享了在实践中发现的几个痛点:模型对昂贵的标注数据的依赖性;已有模型无法在新的环境中直接使用;对计算资源的高需求;以及端上能力推广的局限性。


相关阅读:

《密西根大学40页《20年目标检测综述》最新论文,带你全面了解目标检测方法》


车正平博士讲解计算机视觉基础知识


2


第二章

前沿话题

(Advanced Topics)


讲者:滴滴AI Labs 首席研究员,加拿大carleton University郭玉红教授


大纲


• Domain Adaptation

      • Introduction

      • Application in Computer Vision

      • Domain Adaptation Methods

• Lightweight Models

      • Basics

      • Inception, Xception *

      • SqueezeNet

      • MobileNet / MobileNetV2

      • ShuffleNet / ShuffleNetV2


亮点:基于前文提出的痛点与挑战,在本演讲中分享了两个前沿话题:Domain Adaptation和Lightweight Models。其中Domain Adaptation旨在解决如何从原始问题学习到的模型能够很好地适应与之不相同的目标问题。而Lightweight Models可以很好地解决模型存储和速度问题,通过构建轻量级模型让深度卷积神经网络保持精度的同时,模型体积更小,占用更少的资源。


郭玉红教授讲解前沿话题


3


第三章

应用

(Application)


讲者: 滴滴AI Labs沈海峰博士,李广宇博士

大纲


• Driver Identification

     • Application

     • Overview

     • Experiments

• Driving Scenario Understanding

     • Vision Perception

     • 3D Reconstruction

     • Behavior Analysis


亮点:本演讲中举例计算机视觉在交通的两大应用点,司机认证和驾驶场景理解。其中司机认证主要涉及人脸检测和识别技术。沈海峰博士介绍了人脸技术的一些典型应用,特点和挑战;回顾了人脸检测主流技术以及识别主流技术的演进。并且分享了滴滴在NeurIPS2018的论文Virtual Class Enhanced Discriminative Embedding Learning以及WIDER FACE人脸检测竞赛5项单项第一的算法模型。驾驶场景理解是一个涵盖全方面视觉技术的应用话题。李广宇博士从场景中有什么,物体和车之间的关系(距离)以及司机对环境的反应三个角度,即视觉感知、三维重建和行为分析进行讲解。视觉感知简单地讲述了通用视觉和驾驶场景理解视觉技术不同点,分享了行人检测、车辆检测、车道线分割、交通灯检测等应用;三维重建部分深入浅出地介绍了基础知识和语义重建;最后演讲关注于驾驶场景的深度感知与理解。

请关注专知公众号(点击上方蓝色专知关注

  • 后台回复“DIDICV” 就可以获取《CV in Transportation的下载链接~ 

-END-

专 · 知

专知,专业可信的人工智能知识分发,让认知协作更快更好!欢迎登录www.zhuanzhi.ai,注册登录专知,获取更多AI知识资料!

欢迎微信扫一扫加入专知人工智能知识星球群,获取最新AI专业干货知识教程视频资料和与专家交流咨询

请加专知小助手微信(扫一扫如下二维码添加),加入专知人工智能主题群,咨询技术商务合作~

专知《深度学习:算法到实战》课程全部完成!550+位同学在学习,现在报名,限时优惠!网易云课堂人工智能畅销榜首位!

点击“阅读原文”,了解报名专知《深度学习:算法到实战》课程

登录查看更多
51

相关内容

IEEE多媒体与博览会国际会议(ICME)每年有大约1,000名作者和500名参与者参加,这是由四个IEEE协会主办的联盟多媒体会议。它是一个促进交流多媒体最新进展的论坛从电路和系统,通信,计算机和信号处理社区的研究和开发角度来看的技术,系统和应用程序。 官网地址:http://dblp.uni-trier.de/db/conf/icmcs/

教程题目: Foundations and Trends for Personalized Recommendation

摘要:

个性化推荐在当前的信息消费环境中起着至关重要的作用。本教程主要包括两个部分:基础和趋势。在第一部分中,我们将介绍个性化推荐系统的基本问题,包括用户意图和需求、挑战性问题和最新技术。在第二部分,我们将重点关注相关领域的新趋势话题,包括(但不限于):用户满意度与评价、可解释推荐、基于知识图谱和推理的推荐、跨域异构推荐、推荐系统中的公平性问题等。最后,将与与会者讨论未来的发展方向。

嘉宾介绍

张敏博士是清华大学计算机科学与技术系的终身副教授,专门从事网络搜索和推荐以及用户建模。她是计算机系智能技术与系统实验室副主任,清华-MSRA媒体与搜索实验室执行主任。她还担任ACM信息系统事务(TOIS)的副编辑,SIGIR 2019教程主席,SIGIR 2018短论文主席,WSDM 2017项目主席等。发表论文100余篇,被引用次3500余次,H指数32分。2016年获北京市科技奖(一等奖),2018年获全国高校计算机科学优秀教师奖等。她还拥有12项专利,并与国内外企业进行了大量的合作。

成为VIP会员查看完整内容
0
57

课程简介

麻省理工学院的深度学习入门课程,适用于计算机视觉,自然语言处理,生物学等领域。主要内容包括深度序列建模,深度计算机视觉,深度生成模型,深度强化学习等。旨在让学习者获得深度学习算法的基础知识,并获得在TensorFlow中构建神经网络的实践经验。

课程大纲

  • 第一讲 - 深度学习入门
  • 第二讲 - 深度序列建模
  • 实验一 - Tensorflow简介;音乐产生
  • 第三讲 - 深度计算机视觉
  • 第四讲 - 深度生成建模
  • 实验二 - 消除面部识别系统的偏见
  • 第五讲 - 深度强化学习
  • 第六讲 - 局限性和新领域
  • 实验三 - 像素到控制学习

首席讲师:Alexander Amini、Ava Soleimany

讲师简介

Alexander Amini在麻省理工学院获得了电子工程和计算机科学的理学学士学位和硕士学位,目前为麻省理工学院(MIT)博士生 ,NSF研究员,MIT6.S191的主要组织者和讲师:《深度学习入门》。研究重点是构建用于自主系统的端到端控制(即对执行的感知)的机器学习算法,并为这些算法制定保证。并且从事自动驾驶汽车的控制,深层神经网络的置信度,人类移动性的数学建模以及构建复杂的惯性优化系统等方面的工作。

Ava Soleimany在麻省理工学院获得了计算机科学和分子生物学的理学学士学位,目前为哈弗大学生物学理学博士、麻省理工学院博士生,同为MIT6.S191的主要组织者和讲师:《深度学习入门》。

成为VIP会员查看完整内容
深度学习导论课程ppt.pdf
0
27

报告主题:预训练语言模型的研究与应用

报告摘要:预训练语言模型对自然语言处理领域产生了非常大的影响,华为诺亚方舟实验首席科学家刘群分享了华为诺亚方舟实验室在预训练语言模型研究与应用。他从以下四个方面介绍了他们的工作:一是中文预训练语言模型——哪吒;二是实体增强预训练语言模型——ERINE;三是预训练语言模型——乐府;四是TinyBERT:高效的BERT压缩模型。最后,刘群对预训练语言模型研究与应用做了展望。下一步他们希望研究更好、更强大的预训练语言模型,融入更多的知识,同时跟语音和图像也能够有所结合;此外,也希望将这些预训练模型能应用到更多领域。

邀请嘉宾:刘群,男,华为诺亚方舟实验室,任语音语义首席科学家,主导语音和自然语言处理领域的前沿研究和技术创新。 1989 年毕业于中国科学技术大学计算机系,1992 年于中国科学院计算技术研究所获得硕士学位。刘群博士是自然语言处理和机器翻译领域的国际著名专家,他的研究方向包括多语言信息处理、机器翻译模型、方法与评价等。

成为VIP会员查看完整内容
2019-10-31-02-04-liuqun.pdf
0
23

主题: Artificial Intelligence in Transportation

简介:

交通是生活的基本必需品。在人类历史上,探索更好的交通方式从来没有停止过。近年来,拼车行业的革命和自动驾驶技术的创新每天都产生大量的交通数据。如此庞大的数据量开启了现代智能交通的新时代。许多传统的交通问题可以通过现代机器学习和数据挖掘方法找到更好的解决方案。本教程的目的是为参与者提供一个广泛和全面的基础,最近的发展和交通AI的开放问题。

交通运输是一个非常广泛的研究领域。本教程以全球最大的移动交通平台滴滴出行的实际应用和需求为基础,围绕移动交通平台的主题展开。我们将主题分为三类。首先是地图服务,包括地图匹配、交通预测、预计到达时间(ETA)和路线规划等,为后续的决策过程提供准确的基础信息。这些问题大多在纯交通或地理信息系统的文献中进行了研究。然而,这些都不能满足实时移动交通平台的准确性或效率要求。有必要以现代的观点重新审视这些问题,并探索适应更严格要求的新解决方案。第二类是决策,构建核心共乘平台。类似的问题在交通运输以外的研究领域也得到了广泛的研究。然而,随着移动交通系统的新挑战,它们被重新定义。最后一类是用户体验,如出行安全评估,这是移动交通平台的独特需求。

邀请嘉宾:

王征博士,滴滴AI实验室研究员,滴滴智能地图服务架构研究员。2011年获得清华大学博士学位,2011-2014年在亚利桑那州立大学担任研究员,2014-2016年在密歇根大学安娜堡分校担任研究员。他获得了多个奖项,包括KDD的最佳研究论文奖亚军和IEEE国际社会计算会议(SocialCom)的最佳论文奖。曾担任ICML、NIPS、SDM、IJCAI等重要会议PC委员,并在ICDM上做过辅导。他现在领导着研发团队,致力于设计和开发新的机器学习系统和服务,用于滴滴地图和滴滴能力预测平台。他设计了滴滴ETA和路线规划服务的新型机器学习和深度学习解决方案,每天服务超过200亿次请求。

秦志伟博士在滴滴AI实验室领导强化学习研究,致力于拼车市场优化的核心问题。他在哥伦比亚大学获得运筹学博士学位,在温哥华不列颠哥伦比亚大学获得计算机科学和统计学学士学位。对优化和机器学习交叉领域的研究课题非常感兴趣,最近的研究领域是强化学习及其在运营优化、数字营销、交通信号控制和教育中的应用。曾在ICML、KDD、IEEE ICDM、WWW、JMLR和MPC等顶级会议和机器学习与优化期刊上发表文章。

成为VIP会员查看完整内容
0
37

主题: Deep Reinforcement Learning with Applications in Transportation

简介: 交通运输,特别是移动乘车共享领域,存在许多传统上具有挑战性的动态决策问题,这些问题涉及研究文献,而且很容易从人工智能(AI)中受益匪浅。一些核心示例包括在线乘车指令调度,该系统将可用的驾驶员与乘车共享平台上的出行请求乘客实时匹配;路线规划,用于规划行程起点和终点之间的最佳路线;交通信号控制,可动态自适应地调整区域内的交通信号以实现低延迟。所有这些问题都有一个共同的特征,即在我们关注某个范围内的一些累积目标时,要做出一系列决定。强化学习(RL)是一种机器学习范例,可训练代理通过与之交互并获取反馈信号来学习在环境中采取最佳行动(以所获得的总累积奖励衡量)。因此,它是用于解决顺序决策问题的一类优化方法。得益于深度学习研究和计算能力的飞速发展,深度神经网络和RL的集成为解决复杂的大规模学习问题在RL中产生了爆炸性的进展,近年来引起了巨大的兴趣。深度学习和RL的结合甚至被认为是通往真正AI的道路。它具有巨大的潜力,以前所未有的方式解决运输中的一些难题。

目录简介:

  • Part I: 介绍:机器学习与强化学习
  • Part II: 强化学习基础
  • Part III:基于policy的强化学习
  • Part IV:强化学习框架
成为VIP会员查看完整内容
0
36
小贴士
相关资讯
计算机视觉中深度迁移学习,165页PPT
专知
14+阅读 · 2019年8月18日
【微软亚研130PPT教程】强化学习简介
专知
27+阅读 · 2018年10月26日
零基础小白,如何入门计算机视觉?
计算机视觉life
8+阅读 · 2018年3月8日
计算机视觉与深度学习实战
炼数成金订阅号
6+阅读 · 2018年2月9日
计算机视觉专题分享总结(附PPT)
机器学习读书会
24+阅读 · 2017年7月6日
相关VIP内容
一份循环神经网络RNNs简明教程,37页ppt
专知会员服务
99+阅读 · 2020年5月6日
专知会员服务
97+阅读 · 2020年2月1日
相关论文
Zongxin Yang,Linchao Zhu,Yu Wu,Yi Yang
3+阅读 · 2020年3月27日
Learning in the Frequency Domain
Kai Xu,Minghai Qin,Fei Sun,Yuhao Wang,Yen-Kuang Chen,Fengbo Ren
8+阅读 · 2020年3月12日
Wenwu Zhu,Xin Wang,Peng Cui
19+阅读 · 2020年1月2日
The Theory behind Controllable Expressive Speech Synthesis: a Cross-disciplinary Approach
Noé Tits,Kevin El Haddad,Thierry Dutoit
3+阅读 · 2019年10月14日
Fine-grained robust prosody transfer for single-speaker neural text-to-speech
Viacheslav Klimkov,Srikanth Ronanki,Jonas Rohnke,Thomas Drugman
5+阅读 · 2019年7月4日
Andreas Kamilaris,Francesc X. Prenafeta-Boldu
9+阅读 · 2018年7月31日
Benjamin Recht
5+阅读 · 2018年6月25日
Wenbin Li,Jing Huo,Yinghuan Shi,Yang Gao,Lei Wang,Jiebo Luo
8+阅读 · 2018年5月15日
Tom Young,Devamanyu Hazarika,Soujanya Poria,Erik Cambria
7+阅读 · 2018年2月20日
Tianfu Wu,Xilai Li,Xi Song,Wei Sun,Liang Dong,Bo Li
4+阅读 · 2017年11月14日
Top