ICML 2020线上分享 | Google AI:如何用ConQUR算法解决强化学习在应用落地上的难题?

2020 年 7 月 11 日 机器之心
ICM L(International Conference on Machine Learning)是国际机器学习学会(IMLS)主办的年度机器学习国际顶级会议,每年都会吸引大批 ML 研究者参加。

受到疫情影响,今年的 ICML 大会已经改为在 2020 年 7 月 13 日至 18 日线上举行。


据官方统计,ICML 2020 共收到 4990 篇论文投稿,最后接收论文 1088 篇,接收率为 21.8%。与往年相比,接收率逐年走低。

为向读者们分享更多 ICML 的优质内容,在大会开幕之前,机器之心将策划多期线上分享。

这是机器之心 ICML 2020 线上分享的第一期,我们邀请到了普林斯顿大学在读博士生 DiJia Su 为我们分享他们今年被接收的最新论文:《ConQUR: Mitigating Delusional Bias in Deep Q-learning》

Google AI 如何用 ConQUR 算法解决强化学习在应用落地上的难题


讲师简介: DiJia Su(苏迪加) ,本论文的第一作者,目前在普林斯顿大学攻读博士,研究方向是人工智能与强化学习。他本科毕业于 UBC 工程系,后在加州理工获得了硕士学位,曾在 Amazon AI,Uber AI Lab 与 Google AI Lab 担任过人工智能研究员。Dijia Su 平时也积极参与普林中国学生会,担任副主席的职位。

演讲概要: 众所周知,强化学习在应用落地和理论之间存在巨大的偏差,理想很美好,现实很骨感。作者与 Google AI 团队围绕这个复杂的问题上提出了 ConQUR 算法框架,有效地解决强化学习在部署落地中面临的各种问题。

在实际应用场景中,深度学习,神经网络与 Q-learning 的结合会导致其在某种状态 (state) 采取「非合理」 的动作。在这次演讲中,作者将讲解如何通过修改一行代码从而实现强化学习 (Q-learning 或相关算法) 性能上显著的提高。此论文为 NeurIPS 2018 Best Paper (Non delusional Q-Learning)的延续。作者也将分享他是如何与原版人马打造 ConQUR 算法并通过现实应用场景,结果强化学习落地的难题。

论文链接: https://arxiv.org/pdf/2002.12399.pdf

直播时间:7 月 14 日 20:00-21:00

ICML 2020 机器之心线上分享

在 ICML 2020 收录的大量优秀论文中,我们将选出数篇优质论文,邀请论文作者来做线上分享。整场分享包括两个部分:论文解读和互动答疑。

线上分享将在 「ICML 2020 交流群」 中进行,加群方式:添加机器之心小助手(syncedai6),备注「ICML」,邀请入群。入群后将会公布直播链接。
 

登录查看更多
0

相关内容

ICML 是 International Conference on Machine Learning的缩写,即国际机器学习大会。ICML如今已发展为由国际机器学习学会(IMLS)主办的年度机器学习国际顶级会议。
专知会员服务
18+阅读 · 2020年9月2日
[ICML-Google]先宽后窄:对深度薄网络的有效训练
专知会员服务
33+阅读 · 2020年7月5日
《强化学习—使用 Open AI、TensorFlow和Keras实现》174页pdf
专知会员服务
136+阅读 · 2020年3月1日
【综述】自动驾驶领域中的强化学习,附18页论文下载
专知会员服务
169+阅读 · 2020年2月8日
深度强化学习策略梯度教程,53页ppt
专知会员服务
176+阅读 · 2020年2月1日
专知会员服务
232+阅读 · 2020年1月23日
ICML 2019必看!87页超强干货博士笔记总结
新智元
35+阅读 · 2019年6月17日
ICML2019:Google和Facebook在推进哪些方向?
专知
5+阅读 · 2019年6月13日
大讲堂 | 深度强化学习在电商推荐中的应用
AI研习社
9+阅读 · 2018年11月8日
【干货】强化学习介绍
专知
11+阅读 · 2018年6月24日
Logically-Constrained Reinforcement Learning
Arxiv
3+阅读 · 2018年12月6日
Arxiv
6+阅读 · 2018年6月21日
Arxiv
11+阅读 · 2018年4月25日
VIP会员
相关VIP内容
专知会员服务
18+阅读 · 2020年9月2日
[ICML-Google]先宽后窄:对深度薄网络的有效训练
专知会员服务
33+阅读 · 2020年7月5日
《强化学习—使用 Open AI、TensorFlow和Keras实现》174页pdf
专知会员服务
136+阅读 · 2020年3月1日
【综述】自动驾驶领域中的强化学习,附18页论文下载
专知会员服务
169+阅读 · 2020年2月8日
深度强化学习策略梯度教程,53页ppt
专知会员服务
176+阅读 · 2020年2月1日
专知会员服务
232+阅读 · 2020年1月23日
Top
微信扫码咨询专知VIP会员