直播预告 | 第六届深度强化学习理论与应用研讨会

2022 年 1 月 12 日 中国科学院自动化研究所




CASIA


解锁更多智能之美

序言 | 深度强化学习是典型的数据驱动的学习和优化方法,近来该领域持续在纵深方向快速发展:从批量数据到大型数据,从仿真数据到虚实融合,有数据伪造也需数据鉴别,从多个体到群体,从智能算法开发到博弈理论探讨,从游戏对抗到实体能源优化、自动驾驶、机器人等等。今年召开的“第六届深度强化学习理论与应用研讨会”特邀多位深度强化学习及相关领域的知名学者分享最新研究进展,共同探讨新的机遇和挑战



【深度强化学习理论与应用研讨会】

深度强化学习纵深发展

数据驱动优化挑战极限

主办单位 

中国自动化学会

中科院自动化所复杂系统管理与控制国家重点实验室 

承办单位

中科院自动化所-深度强化学习团队

中国自动化学会数据驱动控制、学习与优化专委会

时间地点

2021年1月14日-15日,中国北京 

线上直播

2021年1月15日为线上会议

将在「中科院自动化所」B站直播间全程直播

扫描下方二维码即可进入!



研讨会嘉宾




日程安排




9:00-9:10

开幕式致辞
赵冬斌研究员

9:10-9:50

面向绿色可靠数据中心的事件驱动的学习与优化方法
贾庆山 清华大学长聘教授

9:50-10:30

面向种群的多智能体强化学习算法
杨耀东 北京大学助理教授

10:30-11:10

数字孪生仿真技术在自动驾驶和智慧交通中的应用
孙驰天 腾讯自动驾驶仿真技术总监

11:10-11:50

人像深度伪造与鉴伪的AI前沿技术探讨
董晶 中科院自动化所副研究员

11:50-12:30

基于深度强化学习的端到端室内导航
刘麟汗 启元世界机器人项目负责人



报告简介


01

面向绿色可靠数据中心的事件驱动的学习与优化方法

报告人:贾庆山,清华大学长聘教授

主持人:赵冬斌研究员

报告摘要大型数据中心是当代社会基础设施之一,支撑着工业互联网、电子商务、社交媒体等丰富应用,承担了重要的算力任务,也消耗了大量的能源。Nature论文预测,到2030年全球数据中心的运行能耗将占全社会年运行能耗的8%。研究数据中心的绿色可靠运行具有重要的应用前景,也是具有重大挑战的关键科学问题。本报告分别从数据中心的可靠运行以及节能运行两个方面,介绍本领域的研究现状,并着重介绍事件驱动的学习与优化方法,围绕典型应用案例分析展示新一代人工智能技术在大型数据中心绿色可靠运行中的重大应用潜力。

报告人简介:贾庆山,清华大学长聘教授,国家杰青。主要研究信息物理融合能源系统的优化理论与方法。发表四十篇IEEE汇刊论文。获得2009年国家自然科学奖二等奖、2018年国家自然科学奖二等奖、2020年教育部自然科学奖二等奖,多次获得国际期刊、国际会议最佳论文奖。担任IEEE Internet of Things Activity Board委员、IEEE控制系统协会Board of Governors委员、IEEE控制系统协会北京分会主席、IEEE机器人与自动化协会智能建筑专业委员会副主席、IFAC智慧城市控制专业委员会主席。曾任IEEE控制系统协会离散事件系统专业委员会主席。担任中国自动化学会第十一届控制理论专业委员会委员兼副秘书长,中国自动化学会第一届工业控制系统信息安全专业委员会委员。


02

面向种群的多智能体强化学习算法

报告人:杨耀东,北京大学助理教授

主持人:朱圆恒副研究员

报告摘要训练多个强化学习智能体并使其进行博弈是具有挑战性的,主要原因是在求解博弈均衡、例如纳什均衡时不存在多项式解法。在本讲中,我将会介绍在合作博弈以及零和博弈上的最新进展。其中,在合作博弈上,我们研究了基于置信域方法的多智能体强化学习算法。该方法的原理是基于多智能体优势函数分解引理,该引理不需要借助任何假设,例如individual-global-max假设而在合作博弈中普遍成立。在零和博弈中,我会介绍基于policy space response oracle的最新进展。PSRO方法能有效解决零和博弈问题中的非传递性non-transitivity问题,并且为零和博弈的通用求解器提出了理论框架。

报告人简介:杨耀东,博士,现任北京大学人工智能研究院助理教授。在加入北京大学以前,他曾任英国伦敦国王大学计算机系助理教授。科研领域包括强化学习、博弈论和多智能体强化学习,相关的研究成果在国际会议和期刊上发表超过30篇学术论文。杨耀东长期担任ICML、NeurIPS、ICLR、AAAI等机器学习会议程序委员和JMLR、IEEE TNNLS, IEEE Cybernatics受邀审稿人。他的研究工作于2020年获国际机器人学习会议CoRL最佳系统论文奖,2021年获国际多智能体系统会议AAMAS最具前瞻论文奖(bestblue-sky paper)。杨耀东于中国科学技术大学获得学士学位,英国帝国理工大学获得硕士学位,英国伦敦大学学院获得博士学位。


03

数字孪生仿真技术在自动驾驶和智慧交通中的应用

报告人:孙驰天,腾讯自动驾驶仿真技术总监

主持人:张启超副研究员

报告摘要数字孪生仿真技术是工业互联网的重要核心技术,充分利用数字孪生仿真技术可以在自动驾驶和智慧交通领域创造巨大的价值。报告首先给出数字孪生仿真技术的重要组成内容。接着给出数字孪生仿真技术在自动驾驶方向上的应用方式和案例。最后给出数字孪生仿真技术在智慧交通领域里提升交通安全性、优化交通效率的应用方式和案例。

报告人简介:孙驰天,腾讯自动驾驶仿真技术总监。交通运输部重点领域创新团队负责人,交通运输部科技专家库专家,中国互联网协会车联网工委会秘书长。本科毕业于清华大学数理基础科学实验班,硕士毕业于美国卡内基梅隆大学。回国前在苹果总部自动驾驶团队(SPG)从事自动驾驶模拟仿真系统的开发,回国后在腾讯自动驾驶部门(TAD)负责模拟仿真和交通数字孪生技术的开发。在腾讯带领团队开发的腾讯自动驾驶模拟仿真系统TAD Sim获2020年世界新能源汽车大会创新技术奖,带领的团队也被交通运输部评选为2020年重点领域创新团队。


04

人像深度伪造与鉴伪的AI前沿技术探讨

报告人:董晶,中科院自动化所副研究员

主持人:陈亚冉副研究员

报告摘要在AI技术的加持下,当下多媒体内容深度合成技术已成为机器学习和计算机视觉等领域的逐渐热门的话题之一,近年来已获得广泛关注,随着其相关应用的纷纷落地并被广泛应用,已带来越来越多的个人隐私和数据安全的隐患。本报告重点关注数字人像伪造与鉴伪的AI研究,结合深度合成的实际应用需求,介绍多媒体“伪造”与“鉴别”、相互博弈和相互促进的独特机制,通过研究深度伪造与鉴伪的机理、机制和线索梳理,展开多媒体应用的相关前沿探讨,并介绍其相关研究的技术进展与发展趋势。

报告人简介:董晶,女,中国科学院自动化研究所副研究员,硕士生导师,IEEE/CSIG高级会员;中国科学院青年创新促进会会员;中国人工智能学会理事;中国图象图形学学会理事、副秘书长、女工委秘书长;北京图象图形学学会常务理事、青工委主任委员;中国图象图形学学会多媒体取证与安全专委会常务委员;中国自动化学会混合智能专委会委员;中国计算机学会计算机视觉专委会委员;IEEE 亚太区执委、人道主义科技活动委员会主席;国际模式识别联合会(IAPR)出版委员会委员、IAPR 《Newsletter》主编,曾获2016年度IBM学院奖、2018年度国际模式识别大会最佳科技论文奖、2019年度中国人工智能学会杰出贡献奖、2020年度CSIG石青云女科学家奖、2021年度CSIG科技奖二等奖(排名第一)。


05

基于深度强化学习的端到端室内导航

报告人:刘麟汗,启元世界机器人项目负责人

主持人:李浩然特别研究助理

报告摘要近年来,深度学习算法在室内视觉导航中发展迅速。然而,由于数据驱动需求和实体实验复杂,大部分工作都是在仿真中进行。算法在真实环境中的表现如何亟待评估。另外的契机是,仿真环境在渲染和物理引擎上都和真实世界越来越接近,这为虚实迁移算法的落地提供了数据基础。本报告主要介绍了启元世界室内视觉导航方面的强化学习虚实迁移工作,相关工作均以大幅度领先的成绩获得CVPR2020和CVPR2021相关比赛的冠军。

报告人简介:刘麟汗,清华大学学士、博士,现启元世界机器人项目负责人,主要研究兴趣为强化学习中的虚实迁移、多智能体等。



1月15日(周六)9:00

  直播间见!




欢迎后台留言、推荐您感兴趣的话题、内容或资讯!

如需转载或投稿,请后台私信。

登录查看更多
1

相关内容

清华大学:2021元宇宙研究报告!
专知会员服务
232+阅读 · 2021年11月2日
专知会员服务
36+阅读 · 2021年9月8日
专知会员服务
76+阅读 · 2021年7月31日
【如何做研究】How to research ,22页ppt
专知会员服务
108+阅读 · 2021年4月17日
面向健康的大数据与人工智能,103页ppt
专知会员服务
105+阅读 · 2020年12月29日
【清华大学龙明盛副教授】迁移学习理论与算法,59页ppt
专知会员服务
80+阅读 · 2020年11月27日
【康奈尔】最新《强化学习基础》CS 6789课程
专知会员服务
66+阅读 · 2020年9月27日
征稿进行中 | 重磅报告嘉宾介绍第二波!敬请关注2022 IEEE Conference on Games
【预告】可视化与可视分析国际学术报告系列第九期将于1月20日举办
中国图象图形学学会CSIG
0+阅读 · 2022年1月12日
【预告】第二届3D视觉创新应用竞赛总决赛将于12月29日-30日全程直播!
中国图象图形学学会CSIG
0+阅读 · 2021年12月29日
【预告】2021CSIG机器视觉与智能研讨会将于11月19-21日举办
中国图象图形学学会CSIG
0+阅读 · 2021年11月5日
魏哲巍:图神经网络的理论基础
图与推荐
0+阅读 · 2021年11月5日
讲座直播预告 | 乔宇研究员:复杂视频的深度表征和理解
中国科学院自动化研究所
0+阅读 · 2021年6月8日
2018广东省计算机视觉及应用研讨会成功举办
CSIG机器视觉专委会
0+阅读 · 2018年9月30日
Deeplearning4j的介绍与实例分享 | 公开课
AI研习社
14+阅读 · 2017年11月27日
国家自然科学基金
5+阅读 · 2017年6月30日
国家自然科学基金
7+阅读 · 2015年12月31日
国家自然科学基金
29+阅读 · 2014年12月31日
国家自然科学基金
1+阅读 · 2014年12月31日
国家自然科学基金
3+阅读 · 2014年12月31日
国家自然科学基金
1+阅读 · 2012年12月31日
国家自然科学基金
1+阅读 · 2012年12月31日
国家自然科学基金
0+阅读 · 2011年12月31日
国家自然科学基金
2+阅读 · 2011年12月31日
Arxiv
15+阅读 · 2021年12月22日
Arxiv
20+阅读 · 2020年6月8日
VIP会员
相关VIP内容
清华大学:2021元宇宙研究报告!
专知会员服务
232+阅读 · 2021年11月2日
专知会员服务
36+阅读 · 2021年9月8日
专知会员服务
76+阅读 · 2021年7月31日
【如何做研究】How to research ,22页ppt
专知会员服务
108+阅读 · 2021年4月17日
面向健康的大数据与人工智能,103页ppt
专知会员服务
105+阅读 · 2020年12月29日
【清华大学龙明盛副教授】迁移学习理论与算法,59页ppt
专知会员服务
80+阅读 · 2020年11月27日
【康奈尔】最新《强化学习基础》CS 6789课程
专知会员服务
66+阅读 · 2020年9月27日
相关资讯
征稿进行中 | 重磅报告嘉宾介绍第二波!敬请关注2022 IEEE Conference on Games
【预告】可视化与可视分析国际学术报告系列第九期将于1月20日举办
中国图象图形学学会CSIG
0+阅读 · 2022年1月12日
【预告】第二届3D视觉创新应用竞赛总决赛将于12月29日-30日全程直播!
中国图象图形学学会CSIG
0+阅读 · 2021年12月29日
【预告】2021CSIG机器视觉与智能研讨会将于11月19-21日举办
中国图象图形学学会CSIG
0+阅读 · 2021年11月5日
魏哲巍:图神经网络的理论基础
图与推荐
0+阅读 · 2021年11月5日
讲座直播预告 | 乔宇研究员:复杂视频的深度表征和理解
中国科学院自动化研究所
0+阅读 · 2021年6月8日
2018广东省计算机视觉及应用研讨会成功举办
CSIG机器视觉专委会
0+阅读 · 2018年9月30日
Deeplearning4j的介绍与实例分享 | 公开课
AI研习社
14+阅读 · 2017年11月27日
相关基金
国家自然科学基金
5+阅读 · 2017年6月30日
国家自然科学基金
7+阅读 · 2015年12月31日
国家自然科学基金
29+阅读 · 2014年12月31日
国家自然科学基金
1+阅读 · 2014年12月31日
国家自然科学基金
3+阅读 · 2014年12月31日
国家自然科学基金
1+阅读 · 2012年12月31日
国家自然科学基金
1+阅读 · 2012年12月31日
国家自然科学基金
0+阅读 · 2011年12月31日
国家自然科学基金
2+阅读 · 2011年12月31日
Top
微信扫码咨询专知VIP会员