【AAAI2021】Lipschitz终身强化学习 - 专知VIP

会员服务 ·

4

终身学习 · 强化学习 ·

2020 年 12 月 14 日

【AAAI2021】Lipschitz终身强化学习

专知会员服务

专知，提供专业可信的知识分发服务，让认知协作更快更好！

我们研究了智能体在面临一系列强化学习任务时的知识转移问题。在马尔可夫决策过程之间引入了一种新的度量方法，证明了封闭式多目标决策具有封闭式最优值函数。形式上，最优值函数是关于任务空间的Lipschitz连续函数。根据这些理论结果，我们提出了一种终身RL的值转移方法，并利用该方法建立了一种收敛速度较好的PAC-MDP算法。我们在终身RL实验中说明了该方法的好处。

成为VIP会员查看完整内容

31

相关内容

终身学习

强化学习算法与应用综述(中文版)， 13页pdf

专知会员服务

118+阅读 · 2020年12月17日

【布朗大学David Abel博士论文】强化学习抽象理论，297页pdf

【布朗大学David Abel博士论文】强化学习抽象理论，297页pdf

专知会员服务

89+阅读 · 2020年12月17日

【AAAI2021】自校正Q学习，Self-correcting Q-Learning

专知会员服务

17+阅读 · 2020年12月4日

【普林斯顿-Mengdi Wang】强化学习统计复杂度，35页ppt

【普林斯顿-Mengdi Wang】强化学习统计复杂度，35页ppt

专知会员服务

21+阅读 · 2020年11月15日

【ICML2020】强化学习中基于模型的方法，279页ppt

【ICML2020】强化学习中基于模型的方法，279页ppt

专知会员服务

48+阅读 · 2020年10月26日

【CMU博士论文Wen Sun】强化学习的泛化性与效率，206页pdf

【CMU博士论文Wen Sun】强化学习的泛化性与效率，206页pdf

专知会员服务

94+阅读 · 2020年9月28日

【斯坦福大学】矩阵对策的协调方法，89页pdf

【斯坦福大学】矩阵对策的协调方法，89页pdf

专知会员服务

27+阅读 · 2020年9月18日

【ICML2020Tutorial】机器学习信号处理，100页ppt

【ICML2020Tutorial】机器学习信号处理，100页ppt

专知会员服务

113+阅读 · 2020年8月15日

【开放新书】不确定性决策与强化学习，267页pdf，瑞典查尔姆斯理工大学

专知会员服务

234+阅读 · 2020年4月28日

【伯克利博士论文】如何让机器人多技能？通过最大熵强化学习(107页pdf)

【伯克利博士论文】如何让机器人多技能？通过最大熵强化学习(107页pdf)

专知会员服务

78+阅读 · 2019年10月27日

【开放新书】不确定性决策与强化学习，267页pdf，瑞典查尔姆斯理工大学

【开放新书】不确定性决策与强化学习，267页pdf，瑞典查尔姆斯理工大学

专知

31+阅读 · 2020年4月28日

解耦强化学习的值函数学习

解耦强化学习的值函数学习

CreateAMind

6+阅读 · 2019年9月5日

IJCAI 2019 | 有趣！这是一篇玩倩女幽魂的多智能体强化学习研究

IJCAI 2019 | 有趣！这是一篇玩倩女幽魂的多智能体强化学习研究

机器之心

6+阅读 · 2019年6月6日

腊月廿八 | 强化学习-TRPO和PPO背后的数学

腊月廿八 | 强化学习-TRPO和PPO背后的数学

AI研习社

18+阅读 · 2019年2月2日

【伯克利博士论文】如何让机器人多技能？通过最大熵强化学习(107页pdf)

【伯克利博士论文】如何让机器人多技能？通过最大熵强化学习(107页pdf)

专知

12+阅读 · 2018年12月22日

学界 | 伯克利、OpenAI等提出基于模型的元策略优化强化学习

学界 | 伯克利、OpenAI等提出基于模型的元策略优化强化学习

机器之心

15+阅读 · 2018年10月21日

CCAI2018演讲实录 | 刘兵：终身学习、连续学习与元学习

CCAI2018演讲实录 | 刘兵：终身学习、连续学习与元学习

人工智能前沿讲习班

13+阅读 · 2018年10月8日

一文学习基于蒙特卡罗的强化学习方法（送书）

一文学习基于蒙特卡罗的强化学习方法（送书）

人工智能头条

7+阅读 · 2018年3月13日

【强化学习】「ICML教程」深度强化学习，决策与控制（117 PPT）

【强化学习】「ICML教程」深度强化学习，决策与控制（117 PPT）

产业智能官

41+阅读 · 2017年8月11日

强化学习族谱

强化学习族谱

CreateAMind

26+阅读 · 2017年8月2日

Optimizing the Neural Architecture of Reinforcement Learning Agents

Arxiv

0+阅读 · 2021年2月15日

Disturbing Reinforcement Learning Agents with Corrupted Rewards

Disturbing Reinforcement Learning Agents with Corrupted Rewards

Arxiv

0+阅读 · 2021年2月12日

The Distributed Discrete Gaussian Mechanism for Federated Learning with Secure Aggregation

Arxiv

0+阅读 · 2021年2月12日

Modeling the Interaction between Agents in Cooperative Multi-Agent Reinforcement Learning

Arxiv

0+阅读 · 2021年2月10日

Lipschitz Lifelong Reinforcement Learning

Arxiv

4+阅读 · 2020年1月17日

Lipschitz Generative Adversarial Nets

Arxiv

8+阅读 · 2019年2月15日

GAN-QP: A Novel GAN Framework without Gradient Vanishing and Lipschitz Constraint

GAN-QP: A Novel GAN Framework without Gradient Vanishing and Lipschitz Constraint

Arxiv

5+阅读 · 2018年12月15日

IRLAS: Inverse Reinforcement Learning for Architecture Search

IRLAS: Inverse Reinforcement Learning for Architecture Search

Arxiv

4+阅读 · 2018年12月14日

Hierarchical Deep Multiagent Reinforcement Learning

Hierarchical Deep Multiagent Reinforcement Learning

Arxiv

8+阅读 · 2018年9月25日

Self-Consistent Trajectory Autoencoder: Hierarchical Reinforcement Learning with Trajectory Embeddings

Arxiv

6+阅读 · 2018年6月7日

VIP会员

相关主题

相关VIP内容

强化学习算法与应用综述(中文版)， 13页pdf

专知会员服务

118+阅读 · 2020年12月17日

【布朗大学David Abel博士论文】强化学习抽象理论，297页pdf

【布朗大学David Abel博士论文】强化学习抽象理论，297页pdf

专知会员服务

89+阅读 · 2020年12月17日

【AAAI2021】自校正Q学习，Self-correcting Q-Learning

专知会员服务

17+阅读 · 2020年12月4日

【普林斯顿-Mengdi Wang】强化学习统计复杂度，35页ppt

【普林斯顿-Mengdi Wang】强化学习统计复杂度，35页ppt

专知会员服务

21+阅读 · 2020年11月15日

【ICML2020】强化学习中基于模型的方法，279页ppt

【ICML2020】强化学习中基于模型的方法，279页ppt

专知会员服务

48+阅读 · 2020年10月26日

【CMU博士论文Wen Sun】强化学习的泛化性与效率，206页pdf

【CMU博士论文Wen Sun】强化学习的泛化性与效率，206页pdf

专知会员服务

94+阅读 · 2020年9月28日

【斯坦福大学】矩阵对策的协调方法，89页pdf

【斯坦福大学】矩阵对策的协调方法，89页pdf

专知会员服务

27+阅读 · 2020年9月18日

【ICML2020Tutorial】机器学习信号处理，100页ppt

【ICML2020Tutorial】机器学习信号处理，100页ppt

专知会员服务

113+阅读 · 2020年8月15日

【开放新书】不确定性决策与强化学习，267页pdf，瑞典查尔姆斯理工大学

专知会员服务

234+阅读 · 2020年4月28日

【伯克利博士论文】如何让机器人多技能？通过最大熵强化学习(107页pdf)

【伯克利博士论文】如何让机器人多技能？通过最大熵强化学习(107页pdf)

专知会员服务

78+阅读 · 2019年10月27日

热门VIP内容

开通专知VIP会员享更多权益服务

《代码、指挥与冲突：描绘军事人工智能的未来》报告

【斯坦福博士论文】面向地理空间数据的多模态与多尺度建模：时空生成式人工智能

美国启动“自有军事人工智能计划”：采用谷歌Gemini以推动全军人工智能应用

《创新与适应性作为军事成功的关键因素：来自俄乌战争的战略洞见》报告

相关资讯

【开放新书】不确定性决策与强化学习，267页pdf，瑞典查尔姆斯理工大学

【开放新书】不确定性决策与强化学习，267页pdf，瑞典查尔姆斯理工大学

专知

31+阅读 · 2020年4月28日

解耦强化学习的值函数学习

解耦强化学习的值函数学习

CreateAMind

6+阅读 · 2019年9月5日

IJCAI 2019 | 有趣！这是一篇玩倩女幽魂的多智能体强化学习研究

IJCAI 2019 | 有趣！这是一篇玩倩女幽魂的多智能体强化学习研究

机器之心

6+阅读 · 2019年6月6日

腊月廿八 | 强化学习-TRPO和PPO背后的数学

腊月廿八 | 强化学习-TRPO和PPO背后的数学

AI研习社

18+阅读 · 2019年2月2日

【伯克利博士论文】如何让机器人多技能？通过最大熵强化学习(107页pdf)

【伯克利博士论文】如何让机器人多技能？通过最大熵强化学习(107页pdf)

专知

12+阅读 · 2018年12月22日

学界 | 伯克利、OpenAI等提出基于模型的元策略优化强化学习

学界 | 伯克利、OpenAI等提出基于模型的元策略优化强化学习

机器之心

15+阅读 · 2018年10月21日

CCAI2018演讲实录 | 刘兵：终身学习、连续学习与元学习

CCAI2018演讲实录 | 刘兵：终身学习、连续学习与元学习

人工智能前沿讲习班

13+阅读 · 2018年10月8日

一文学习基于蒙特卡罗的强化学习方法（送书）

一文学习基于蒙特卡罗的强化学习方法（送书）

人工智能头条

7+阅读 · 2018年3月13日

【强化学习】「ICML教程」深度强化学习，决策与控制（117 PPT）

【强化学习】「ICML教程」深度强化学习，决策与控制（117 PPT）

产业智能官

41+阅读 · 2017年8月11日

强化学习族谱

强化学习族谱

CreateAMind

26+阅读 · 2017年8月2日

相关论文

Optimizing the Neural Architecture of Reinforcement Learning Agents

Arxiv

0+阅读 · 2021年2月15日

Disturbing Reinforcement Learning Agents with Corrupted Rewards

Disturbing Reinforcement Learning Agents with Corrupted Rewards

Arxiv

0+阅读 · 2021年2月12日

The Distributed Discrete Gaussian Mechanism for Federated Learning with Secure Aggregation

Arxiv

0+阅读 · 2021年2月12日

Modeling the Interaction between Agents in Cooperative Multi-Agent Reinforcement Learning

Arxiv

0+阅读 · 2021年2月10日

Lipschitz Lifelong Reinforcement Learning

Arxiv

4+阅读 · 2020年1月17日

Lipschitz Generative Adversarial Nets

Arxiv

8+阅读 · 2019年2月15日

GAN-QP: A Novel GAN Framework without Gradient Vanishing and Lipschitz Constraint

GAN-QP: A Novel GAN Framework without Gradient Vanishing and Lipschitz Constraint

Arxiv

5+阅读 · 2018年12月15日

IRLAS: Inverse Reinforcement Learning for Architecture Search

IRLAS: Inverse Reinforcement Learning for Architecture Search

Arxiv

4+阅读 · 2018年12月14日

Hierarchical Deep Multiagent Reinforcement Learning

Hierarchical Deep Multiagent Reinforcement Learning

Arxiv

8+阅读 · 2018年9月25日

Self-Consistent Trajectory Autoencoder: Hierarchical Reinforcement Learning with Trajectory Embeddings

Arxiv

6+阅读 · 2018年6月7日

微信扫码咨询专知VIP会员