ICLR 2020 高质量强化学习论文汇总

2019 年 11 月 11 日 极市平台

加入极市专业CV交流群,与6000+来自腾讯,华为,百度,北大,清华,中科院等名企名校视觉开发者互动交流!更有机会与李开复老师等大牛群内互动!

同时提供每月大咖直播分享、真实项目需求对接、干货资讯汇总,行业技术交流。关注 极市平台 公众号 ,回复 加群,立刻申请入群~


作者:Chersophyte

来源:https://zhuanlan.zhihu.com/p/90393651

本文已经作者授权,转载请联系原作者


简单做个今年ICLR上我个人觉得质量比较高的RL方向的工作总结。


有很多疏漏,漏了没看到的工作后续再补吧。


质量比较高的意思不是说都是高分工作,有的分数差异比较大的我也放上来了。


加了一些tranfer reinforcement learning有关的工作。



Adaptation:


CM3: Cooperative Multi-goal Multi-stage Multi-agent Reinforcement Learning

  • 链接:

    https://openreview.net/forum?id=S1lEX04tPr&noteId=r1e0fqAaKr


Adapt-to-Learn: Policy Transfer in Reinforcement Learning

  • 链接:

    https://openreview.net/forum?id=ryeT10VKDH&noteId=S1lVR3-bqS


Evolutionary Population Curriculum for Scaling Multi-Agent Reinforcement Learning

  • 链接:

    https://openreview.net/forum?id=SJxbHkrKDH&noteId=ryxYvoLRYH


MULTIPOLAR: Multi-Source Policy Aggregation for Transfer Reinforcement Learning between Diverse Environmental Dynamics

  • 链接:https://openreview.net/forum?id=Byx9p2EtDH



Sparse-reward:


Intrinsic Motivation for Encouraging Synergistic Behavior

  • 链接:

    https://openreview.net/forum?id=SJleNCNtDH&noteId=SJxFBZDpYr



Two-player zero-sum extensive-games with imperfect information (TZIEG):


Posterior sampling for multi-agent reinforcement learning: solving extensive games with imperfect information

  • 链接:

    https://openreview.net/forum?id=Syg-ET4FPS&noteId=BkgacWb0cS



Human Interaction:


Simplified Action Decoder for Deep Multi-Agent Reinforcement Learning

  • 链接:

    https://openreview.net/forum?id=B1xm3RVtwB&noteId=Bkl2ONldFr



Communication:


Graph Convolutional Reinforcement Learning

  • 链接:

    https://openreview.net/forum?id=HkxdQkSYDB&noteId=SygTyGcOcr


Learning Nearly Decomposable Value Functions Via Communication Minimization

  • 链接:

    https://openreview.net/forum?id=HJx-3grYDB&noteId=SygnB7pe5S


Multi-agent Reinforcement Learning for Networked System Control

  • 链接:https://openreview.net/forum?id=Syx7A3NFvH


Learning Structured Communication for Multi-agent Reinforcement Learning

  • 链接:https://openreview.net/forum?id=BklWt24tvH



Interaction Modelling:


Promoting Coordination through Policy Regularization in Multi-Agent Deep Reinforcement Learning

  • 链接:https://openreview.net/forum?id=BkggGREKvS



Training, Exploration:


A Generalized Training Approach for Multiagent Learning

  • 链接:

    https://openreview.net/forum?id=Bkl5kxrKDr&noteId=r1xBh9CaYS


Influence-Based Multi-Agent Exploration

  • 链接:

    https://openreview.net/forum?id=BJgy96EYvr&noteId=HJlVKGuwdH


Learning Expensive Coordination: An Event-Based Deep RL Approach

  • 链接:https://openreview.net/forum?id=ryeG924twB



Imitation, Inverse:


Asynchronous Multi-Agent Generative Adversarial Imitation Learning

  • 链接:

    https://openreview.net/forum?id=Syx33erYwH&noteId=r1l9cYFddS


Multi-Agent Interactions Modeling with Correlated Policies

  • 链接:https://openreview.net/forum?id=B1gZV1HYvS



-End-


*延伸阅读





CV细分方向交流群


添加极市小助手微信(ID : cv-mart),备注:研究方向-姓名-学校/公司-城市(如:目标检测-小极-北大-深圳),即可申请加入目标检测、目标跟踪、人脸、工业检测、医学影像、三维&SLAM、图像分割等极市技术交流群(已经添加小助手的好友直接私信),更有每月大咖直播分享、真实项目需求对接、干货资讯汇总,行业技术交流一起来让思想之光照的更远吧~



△长按添加极市小助手


△长按关注极市平台


觉得有用麻烦给个在看啦~  

登录查看更多
12

相关内容

强化学习(RL)是机器学习的一个领域,与软件代理应如何在环境中采取行动以最大化累积奖励的概念有关。除了监督学习和非监督学习外,强化学习是三种基本的机器学习范式之一。 强化学习与监督学习的不同之处在于,不需要呈现带标签的输入/输出对,也不需要显式纠正次优动作。相反,重点是在探索(未知领域)和利用(当前知识)之间找到平衡。 该环境通常以马尔可夫决策过程(MDP)的形式陈述,因为针对这种情况的许多强化学习算法都使用动态编程技术。经典动态规划方法和强化学习算法之间的主要区别在于,后者不假设MDP的确切数学模型,并且针对无法采用精确方法的大型MDP。

知识荟萃

精品入门和进阶教程、论文和代码整理等

更多

查看相关VIP内容、论文、资讯等
专知会员服务
61+阅读 · 2020年3月19日
专知会员服务
110+阅读 · 2020年3月12日
强化学习和最优控制的《十个关键点》81页PPT汇总
专知会员服务
104+阅读 · 2020年3月2日
深度强化学习策略梯度教程,53页ppt
专知会员服务
181+阅读 · 2020年2月1日
【强化学习资源集合】Awesome Reinforcement Learning
专知会员服务
95+阅读 · 2019年12月23日
Stabilizing Transformers for Reinforcement Learning
专知会员服务
60+阅读 · 2019年10月17日
强化学习最新教程,17页pdf
专知会员服务
177+阅读 · 2019年10月11日
MIT新书《强化学习与最优控制》
专知会员服务
277+阅读 · 2019年10月9日
ICCV 2019 行为识别/视频理解论文汇总
极市平台
15+阅读 · 2019年9月26日
强化学习三篇论文 避免遗忘等
CreateAMind
19+阅读 · 2019年5月24日
先睹为快:神经网络顶会ICLR 2019论文热点分析
深度学习与NLP
43+阅读 · 2018年12月22日
强化学习族谱
CreateAMind
26+阅读 · 2017年8月2日
强化学习 cartpole_a3c
CreateAMind
9+阅读 · 2017年7月21日
Arxiv
45+阅读 · 2019年12月20日
Deep Reinforcement Learning: An Overview
Arxiv
17+阅读 · 2018年11月26日
Video-to-Video Synthesis
Arxiv
9+阅读 · 2018年8月20日
Arxiv
5+阅读 · 2018年4月22日
Arxiv
3+阅读 · 2018年4月11日
VIP会员
相关VIP内容
专知会员服务
61+阅读 · 2020年3月19日
专知会员服务
110+阅读 · 2020年3月12日
强化学习和最优控制的《十个关键点》81页PPT汇总
专知会员服务
104+阅读 · 2020年3月2日
深度强化学习策略梯度教程,53页ppt
专知会员服务
181+阅读 · 2020年2月1日
【强化学习资源集合】Awesome Reinforcement Learning
专知会员服务
95+阅读 · 2019年12月23日
Stabilizing Transformers for Reinforcement Learning
专知会员服务
60+阅读 · 2019年10月17日
强化学习最新教程,17页pdf
专知会员服务
177+阅读 · 2019年10月11日
MIT新书《强化学习与最优控制》
专知会员服务
277+阅读 · 2019年10月9日
相关资讯
ICCV 2019 行为识别/视频理解论文汇总
极市平台
15+阅读 · 2019年9月26日
强化学习三篇论文 避免遗忘等
CreateAMind
19+阅读 · 2019年5月24日
先睹为快:神经网络顶会ICLR 2019论文热点分析
深度学习与NLP
43+阅读 · 2018年12月22日
强化学习族谱
CreateAMind
26+阅读 · 2017年8月2日
强化学习 cartpole_a3c
CreateAMind
9+阅读 · 2017年7月21日
相关论文
Arxiv
45+阅读 · 2019年12月20日
Deep Reinforcement Learning: An Overview
Arxiv
17+阅读 · 2018年11月26日
Video-to-Video Synthesis
Arxiv
9+阅读 · 2018年8月20日
Arxiv
5+阅读 · 2018年4月22日
Arxiv
3+阅读 · 2018年4月11日
Top
微信扫码咨询专知VIP会员