ICML2019-深度强化学习文章汇总

2019 年 5 月 10 日 深度强化学习实验室
深度强化学习-Report

来源:icml2019 conference

编辑:DeepRL



强化学习是一种通用的学习、预测和决策范式。RL为顺序决策问题提供了解决方法,并将其转化为顺序决策问题。RL与优化、统计学、博弈论、因果推理、序贯实验等有着深刻的联系,与近似动态规划和最优控制有着很大的重叠,在科学、工程和艺术领域有着广泛的应用。

RL最近在学术界取得了稳定的进展,如Atari游戏、AlphaGo、VisuoMotor机器人政策。RL也被应用于现实场景,如推荐系统和神经架构搜索。请参阅有关RL应用程序的最新集合。希望RL系统能够在现实世界中工作,并具有实际的好处。然而,RL存在着许多问题,如泛化、样本效率、勘探与开发困境等。因此,RL远未被广泛部署。对于RL社区来说,常见的、关键的和紧迫的问题是:RL是否有广泛的部署?问题是什么?如何解决这些问题?

在国际会议上的机器学习(ICML)是一个国际学术会议上机器学习。它是机器学习和人工智能研究中高影响力的两个主要会议之一。每年的ICML中都有大量的关于强化学习的文章,其中2019总共接收强化学习论文46篇(已经是很高比例了,快接近10%),下面是本次会议文章的总结,文章pdf版本汇总下载链接见文章末尾


方法类文章

  • Efficient Off-Policy Meta-Reinforcement Learning via Probabilistic Context Variables

  • Bayesian Action Decoder for Deep Multi-Agent Reinforcement Learning

  • Quantifying Generalization in Reinforcement Learning

  • Policy Certificates: Towards Accountable Reinforcement Learning

  • Neural Logic Reinforcement Learning

  • Probability Functional Descent: A Unifying Perspective on GANs, Variational Inference, and Reinforcement Learning

  • Few-Shot Intent Inference via Meta-Inverse Reinforcement Learning

  • Calibrated Model-Based Deep Reinforcement Learning

  • Information-Theoretic Considerations in Batch Reinforcement Learning

  • Taming MAML: Control variates for unbiased meta-reinforcement learning gradient estimation

  • Option Discovery for Solving Sparse Reward Reinforcement Learning Problems

优化类文章

  • Fingerprint Policy Optimisation for Robust Reinforcement Learning

  • Collaborative Evolutionary Reinforcement Learning

  • Composing Value Functions in Reinforcement Learning

  • Task-Agnostic Dynamics Priors for Deep Reinforcement Learning

  • Policy Consolidation for Continual Reinforcement Learning

探索-利用及模型参数

  • Exploration Conscious Reinforcement Learning Revisited

  • Dynamic Weights in Multi-Objective Deep Reinforcement Learning

  • Control Regularization for Reduced Variance Reinforcement Learning

  • Dead-ends and Secure Exploration in Reinforcement Learning

  • Off-Policy Deep Reinforcement Learning without Exploration

  • Dimension-Wise Importance Sampling Weight Clipping for Sample-Efficient Reinforcement Learning

  • Extrapolating Beyond Suboptimal Demonstrations via Inverse Reinforcement Learning from Observations

  • On the Generalization Gap in Reparameterizable Reinforcement Learning

多智能体

  • Social Influence as Intrinsic Motivation for Multi-Agent Deep Reinforcement Learning

  • CURIOUS: Intrinsically Motivated Multi-Task, Multi-Goal Reinforcement Learning

  • Finite-Time Analysis of Distributed TD(0) with Linear Function Approximation on Multi-Agent Reinforcement Learning

  • Maximum Entropy-Regularized Multi-Goal Reinforcement Learning

  • Multi-Agent Adversarial Inverse Reinforcement Learning

  • Grid-Wise Control for Multi-Agent Reinforcement Learning in Video Game AI

  • QTRAN: Learning to Factorize with Transformation for Cooperative Multi-Agent Reinforcement Learning

  • Actor-Attention-Critic for Multi-Agent Reinforcement Learning

图模型强化学习

  • TibGM: A Transferable and Information-Based Graphical Model Approach for Reinforcement Learning

  • SOLAR: Deep Structured Representations for Model-Based Reinforcement Learning

分布式强化学习

  • Statistics and Samples in Distributional Reinforcement Learning

  • Distribution Reinforcement Learning for Efficient Exploration

应用类

  • Action Robust Reinforcement Learning and Applications in Continuous Control

  • Transfer Learning for Related Reinforcement Learning Tasks via Image-to-Image Translation

  • Learning Action Representations for Reinforcement Learning

  • The Value Function Polytope in Reinforcement Learning

  • Generative Adversarial User Model for Reinforcement Learning Based Recommendation System

其他

  • Kernel-Based Reinforcement Learning in Robust Markov Decision Processes

  • A Deep Reinforcement Learning Perspective on Internet Congestion Control

  • Reinforcement Learning in Configurable Continuous Environments

  • Tighter Problem-Dependent Regret Bounds in Reinforcement Learning without Domain Knowledge using Value Function Bounds


注:部分文章还没有在arxiv上,或者没有的请自行Google

paper-PDF版本(资源获取)

1、搜索“Deep-RL”或者扫描下面"二维码",关注本公众号


2、后台回复:ICML2019  获取ICML2019深度强化学习相关论文pdf版本。


深度强化学习算法

算法、框架、资料、前沿信息等

长按二维码关注我们吧



登录查看更多
2

相关内容

强化学习(RL)是机器学习的一个领域,与软件代理应如何在环境中采取行动以最大化累积奖励的概念有关。除了监督学习和非监督学习外,强化学习是三种基本的机器学习范式之一。 强化学习与监督学习的不同之处在于,不需要呈现带标签的输入/输出对,也不需要显式纠正次优动作。相反,重点是在探索(未知领域)和利用(当前知识)之间找到平衡。 该环境通常以马尔可夫决策过程(MDP)的形式陈述,因为针对这种情况的许多强化学习算法都使用动态编程技术。经典动态规划方法和强化学习算法之间的主要区别在于,后者不假设MDP的确切数学模型,并且针对无法采用精确方法的大型MDP。

知识荟萃

精品入门和进阶教程、论文和代码整理等

更多

查看相关VIP内容、论文、资讯等
多智能体深度强化学习的若干关键科学问题
专知会员服务
189+阅读 · 2020年5月24日
强化学习和最优控制的《十个关键点》81页PPT汇总
专知会员服务
103+阅读 · 2020年3月2日
【综述】自动驾驶领域中的强化学习,附18页论文下载
专知会员服务
172+阅读 · 2020年2月8日
深度强化学习策略梯度教程,53页ppt
专知会员服务
179+阅读 · 2020年2月1日
2019必读的十大深度强化学习论文
专知会员服务
58+阅读 · 2020年1月16日
【强化学习资源集合】Awesome Reinforcement Learning
专知会员服务
94+阅读 · 2019年12月23日
强化学习最新教程,17页pdf
专知会员服务
176+阅读 · 2019年10月11日
MIT新书《强化学习与最优控制》
专知会员服务
276+阅读 · 2019年10月9日
专知会员服务
208+阅读 · 2019年8月30日
ICLR 2020 高质量强化学习论文汇总
极市平台
12+阅读 · 2019年11月11日
19篇ICML2019论文摘录选读!
专知
28+阅读 · 2019年4月28日
RL 真经
CreateAMind
5+阅读 · 2018年12月28日
OpenAI丨深度强化学习关键论文列表
中国人工智能学会
17+阅读 · 2018年11月10日
【OpenAI】深度强化学习关键论文列表
专知
11+阅读 · 2018年11月10日
【ICML2018】63篇强化学习论文全解读
专知
7+阅读 · 2018年7月24日
【深度强化学习】深度强化学习揭秘
产业智能官
20+阅读 · 2017年11月13日
强化学习族谱
CreateAMind
26+阅读 · 2017年8月2日
Heterogeneous Deep Graph Infomax
Arxiv
12+阅读 · 2019年11月19日
Arxiv
9+阅读 · 2019年4月19日
Logically-Constrained Reinforcement Learning
Arxiv
3+阅读 · 2018年12月6日
Relational Deep Reinforcement Learning
Arxiv
10+阅读 · 2018年6月28日
Arxiv
11+阅读 · 2018年4月25日
Arxiv
3+阅读 · 2018年1月31日
VIP会员
相关VIP内容
多智能体深度强化学习的若干关键科学问题
专知会员服务
189+阅读 · 2020年5月24日
强化学习和最优控制的《十个关键点》81页PPT汇总
专知会员服务
103+阅读 · 2020年3月2日
【综述】自动驾驶领域中的强化学习,附18页论文下载
专知会员服务
172+阅读 · 2020年2月8日
深度强化学习策略梯度教程,53页ppt
专知会员服务
179+阅读 · 2020年2月1日
2019必读的十大深度强化学习论文
专知会员服务
58+阅读 · 2020年1月16日
【强化学习资源集合】Awesome Reinforcement Learning
专知会员服务
94+阅读 · 2019年12月23日
强化学习最新教程,17页pdf
专知会员服务
176+阅读 · 2019年10月11日
MIT新书《强化学习与最优控制》
专知会员服务
276+阅读 · 2019年10月9日
专知会员服务
208+阅读 · 2019年8月30日
相关资讯
ICLR 2020 高质量强化学习论文汇总
极市平台
12+阅读 · 2019年11月11日
19篇ICML2019论文摘录选读!
专知
28+阅读 · 2019年4月28日
RL 真经
CreateAMind
5+阅读 · 2018年12月28日
OpenAI丨深度强化学习关键论文列表
中国人工智能学会
17+阅读 · 2018年11月10日
【OpenAI】深度强化学习关键论文列表
专知
11+阅读 · 2018年11月10日
【ICML2018】63篇强化学习论文全解读
专知
7+阅读 · 2018年7月24日
【深度强化学习】深度强化学习揭秘
产业智能官
20+阅读 · 2017年11月13日
强化学习族谱
CreateAMind
26+阅读 · 2017年8月2日
相关论文
Heterogeneous Deep Graph Infomax
Arxiv
12+阅读 · 2019年11月19日
Arxiv
9+阅读 · 2019年4月19日
Logically-Constrained Reinforcement Learning
Arxiv
3+阅读 · 2018年12月6日
Relational Deep Reinforcement Learning
Arxiv
10+阅读 · 2018年6月28日
Arxiv
11+阅读 · 2018年4月25日
Arxiv
3+阅读 · 2018年1月31日
Top
微信扫码咨询专知VIP会员