第19届智能体及多智能体系统国际会议(International Joint Conference on Autonomous Agents and Multi-Agent Systems, AAMAS-2020)近日在线举行。智能体及多智能体系统国际会议(AAMAS) 是多智能体系统领域最具影响力的会议之一,由非营利组织IFAAMAS主办。今年,AAMAS-2020共收到808篇论文投稿,录用186篇。
我们回顾了在无模型和基于模型的强化学习设置中的残差算法。我们提出了双向目标网络技术来稳定残差算法,生成一个在DeepMind控制套件基准测试中显著优于普通DDPG的DDPG的残差版本。此外,我们发现残差算法是解决基于模型规划中分布不匹配问题的有效方法。与现有的TD(k)方法相比,我们基于残差的方法对模型的假设更弱,并产生了更大的性能提升。
https://arxiv.org/pdf/1905.01072.pdf
专知便捷查看
便捷下载,请关注专知公众号(点击上方蓝色专知关注)
后台回复“DRRL” 可以获取《《深度残差强化学习》牛津大学,Deep Residual RL》专知下载链接索引