主题: Generalization in Reinforcement Learning with Selective Noise Injection
摘要: 强化学习是机器学习中唯一一种通常被允许在其测试集中进行训练的形式。特别是深度强化学习已被证明可以适应其所训练的环境。在本次演讲中,我将讨论我们最近两篇论文(1)显示域随机化在看不见的3D迷宫中导航的应用(在2019年IEEE游戏大会上发布); (2)建议通过变化信息瓶颈进行选择性噪声注入,以将通用性提高到2D平台开发工具CoinRun的未知测试水平(NeurIPS 2019)。
嘉宾介绍: Sam Devlin,Microsoft Research高级研究员,于2009年获得约克大学计算机系统和软件工程硕士学位,其中包括一年与BAE Systems的团队合作。完成该学位后,从事传统的商业游戏AI的研究,将行为树和导航网格生成集成到开放源代码游戏引擎CrystalSpace中,作为2009年Google Summer of Code计划的一部分,2013年,完成了博士学位,在约克大学(University of York)进行多智能体强化学习,并访问了由桑坦德国际连接奖(Santander International Connections Award)资助的俄勒冈州立大学。