智能体与人类或机器人的无缝交互很困难,因为现实环境是动态变化的,并根据自智能体的行为更新策略,而自智能体必须预测这些变化以随机应变。受人类行为启发,我们认识到机器人不需要显式地为另一个智能体要进行的每一个低级动作建模;相反,我们可以通过高级表征来捕捉其他智能体的潜在策略。我们提出了一个基于强化学习的学习框架来学习一个智能体策略的潜在表示,其中自智能体识别其行为与另一个智能体的未来策略之间的关系。然后,自智能体利用这些潜在的动力来影响另一个智能体,有目的地引导他们走向共同适应的策略。在多个模拟领域和一个真实的空中曲棍球游戏中,本文的方法要优于其他方法,并学会了影响其他智能体。

成为VIP会员查看完整内容
27

相关内容

CoRL的全程为Conference on Robot Learning(机器人学习大会),CoRL是一个新的以机器人学和机器学习为主题的年度国际会议。大会的组织者包括来自UC Berkrley、Google、Microsoft、CMU、MIT、ETH、Deepmind等知名院校和知名企业的研究者和从业者,同时CoRL大会的举办还得到了机器人国际机构“三巨头”之一的国际机器人研究基金会(IFRR)和机器学习领域最好的期刊之一JMLR(Journal of Machine Learning Research)的支持。
【Cell 2020】神经网络中的持续学习
专知会员服务
59+阅读 · 2020年11月7日
【DeepMind-NeurIPS 2020】元训练代理实现Bayes-optimal代理
专知会员服务
10+阅读 · 2020年11月1日
【ICML2020】强化学习中基于模型的方法,279页ppt
专知会员服务
43+阅读 · 2020年10月26日
多智能体深度强化学习的若干关键科学问题
专知会员服务
172+阅读 · 2020年5月24日
学习如何学习的算法:简述元学习研究方向现状
深度学习世界
6+阅读 · 2018年4月9日
不对称多代理博弈中的博弈理论解读
AI前线
13+阅读 · 2018年3月8日
【学界】伯克利吴翼&FAIR田渊栋等人提出强化学习环境Hourse3D
GAN生成式对抗网络
5+阅读 · 2018年1月13日
Arxiv
21+阅读 · 2019年8月21日
Arxiv
27+阅读 · 2018年4月12日
VIP会员
微信扫码咨询专知VIP会员