主题: Generalization in Reinforcement Learning with Selective Noise Injection

摘要: 强化学习是机器学习中唯一一种通常被允许在其测试集中进行训练的形式。特别是深度强化学习已被证明可以适应其所训练的环境。在本次演讲中,我将讨论我们最近两篇论文(1)显示域随机化在看不见的3D迷宫中导航的应用(在2019年IEEE游戏大会上发布); (2)建议通过变化信息瓶颈进行选择性噪声注入,以将通用性提高到2D平台开发工具CoinRun的未知测试水平(NeurIPS 2019)。

嘉宾介绍: Sam Devlin,Microsoft Research高级研究员,于2009年获得约克大学计算机系统和软件工程硕士学位,其中包括一年与BAE Systems的团队合作。完成该学位后,从事传统的商业游戏AI的研究,将行为树和导航网格生成集成到开放源代码游戏引擎CrystalSpace中,作为2009年Google Summer of Code计划的一部分,2013年,完成了博士学位,在约克大学(University of York)进行多智能体强化学习,并访问了由桑坦德国际连接奖(Santander International Connections Award)资助的俄勒冈州立大学。

成为VIP会员查看完整内容
7

相关内容

【ACL2020-伯克利】预训练Transformer提高分布外鲁棒性
专知会员服务
19+阅读 · 2020年4月14日
MIT新书《强化学习与最优控制》
专知会员服务
270+阅读 · 2019年10月9日
专知会员服务
198+阅读 · 2019年8月30日
RL解决'LunarLander-v2' (SOTA)
CreateAMind
62+阅读 · 2019年9月27日
【微软亚研130PPT教程】强化学习简介
专知
36+阅读 · 2018年10月26日
总览智能对话系统(3位微软与谷歌技术大牛联合出品)
Arxiv
13+阅读 · 2020年4月12日
Next Item Recommendation with Self-Attention
Arxiv
5+阅读 · 2018年8月25日
Arxiv
11+阅读 · 2018年4月25日
Arxiv
27+阅读 · 2018年4月12日
Arxiv
3+阅读 · 2018年3月21日
Arxiv
3+阅读 · 2017年11月21日
VIP会员
相关VIP内容
【ACL2020-伯克利】预训练Transformer提高分布外鲁棒性
专知会员服务
19+阅读 · 2020年4月14日
MIT新书《强化学习与最优控制》
专知会员服务
270+阅读 · 2019年10月9日
专知会员服务
198+阅读 · 2019年8月30日
微信扫码咨询专知VIP会员