AI领域顶会AAMAS2020最佳论文出炉!《深度残差强化学习》牛津大学,Deep Residual RL

2020 年 5 月 15 日 专知


第19届智能体及多智能体系统国际会议(International Joint Conference on Autonomous Agents and Multi-Agent Systems, AAMAS-2020)近日在线举行智能体及多智能体系统国际会议(AAMAS) 是多智能体系统领域最具影响力的会议之一,由非营利组织IFAAMAS主办。今年,AAMAS-2020共收到808篇论文投稿,录用186篇。




我们回顾了在无模型和基于模型的强化学习设置中的残差算法。我们提出了双向目标网络技术来稳定残差算法,生成一个在DeepMind控制套件基准测试中显著优于普通DDPG的DDPG的残差版本。此外,我们发现残差算法是解决基于模型规划中分布不匹配问题的有效方法。与现有的TD(k)方法相比,我们基于残差的方法对模型的假设更弱,并产生了更大的性能提升。

https://arxiv.org/pdf/1905.01072.pdf


专知便捷查看

便捷下载,请关注专知公众号(点击上方蓝色专知关注)

  • 后台回复“DRRL” 可以获取《深度残差强化学习》牛津大学,Deep Residual RL》专知下载链接索引

专知,专业可信的人工智能知识分发,让认知协作更快更好!欢迎注册登录专知www.zhuanzhi.ai,获取5000+AI主题干货知识资料!
欢迎微信扫一扫加入专知人工智能知识星球群,获取最新AI专业干货知识教程资料和与专家交流咨询
点击“ 阅读原文 ”,了解使用 专知 ,查看获取5000+AI主题知识资源
登录查看更多
2

相关内容

自治代理和多代理系统AAMAS(Autonomous Agents and Multi-Agent Systems)是国际自治代理和多代理系统基金会的官方杂志。它提供了一个领先的论坛,用于在自治代理和多代理系统的基础,理论,开发,分析和应用中传播重要的原始研究结果。 官网地址:http://dblp.uni-trier.de/db/journals/aamas/
[ICML-Google]先宽后窄:对深度薄网络的有效训练
专知会员服务
34+阅读 · 2020年7月5日
【快讯】CVPR2020结果出炉,1470篇上榜, 你的paper中了吗?
专知会员服务
53+阅读 · 2019年12月22日
深度学习算法与架构回顾
专知
7+阅读 · 2019年5月5日
【ICLR 2019录用结果出炉】24篇Oral, 918被拒
专知
7+阅读 · 2018年12月21日
【微软亚研130PPT教程】强化学习简介
专知
36+阅读 · 2018年10月26日
Arxiv
101+阅读 · 2020年3月4日
Arxiv
6+阅读 · 2019年7月11日
Arxiv
22+阅读 · 2018年8月30日
A Multi-Objective Deep Reinforcement Learning Framework
VIP会员
相关VIP内容
[ICML-Google]先宽后窄:对深度薄网络的有效训练
专知会员服务
34+阅读 · 2020年7月5日
【快讯】CVPR2020结果出炉,1470篇上榜, 你的paper中了吗?
专知会员服务
53+阅读 · 2019年12月22日
相关论文
Arxiv
101+阅读 · 2020年3月4日
Arxiv
6+阅读 · 2019年7月11日
Arxiv
22+阅读 · 2018年8月30日
A Multi-Objective Deep Reinforcement Learning Framework
Top
微信扫码咨询专知VIP会员