基于模型的强化学习综述 - 专知VIP

会员服务 ·

34

基于模型的强化学习 · 综述论文 ·

2023 年 1 月 9 日

基于模型的强化学习综述

专知会员服务

专知，提供专业可信的知识分发服务，让认知协作更快更好！

序列决策，通常形式化为马尔可夫决策过程(MDP)优化，是人工智能的一个重要挑战。解决这个问题的两种关键方法是强化学习(RL)和规划。这项综述是这两个领域的集成，更广为人知的是基于模型的强化学习。基于模型的RL有两个主要步骤。首先，我们系统地介绍了动力学模型学习的方法，包括处理随机性、不确定性、部分可观察性和时间抽象等挑战。其次，我们提出了规划-学习集成的系统分类，包括:从哪里开始规划，为规划和实际数据收集分配哪些预算，如何规划，以及如何在学习和行动循环中集成规划。在这两个部分之后，我们还讨论了隐式基于模型的RL作为模型学习和规划的端到端替代方案，并讨论了基于模型的RL的潜在好处。在此过程中，调研还与几个相关的RL领域建立了联系，如分层RL和传输。

成为VIP会员查看完整内容

48

相关内容

基于模型的强化学习

基于模型的强化学习

基于课程学习的深度强化学习研究综述

基于课程学习的深度强化学习研究综述

专知会员服务

58+阅读 · 2022年11月28日

博弈论视角下的多智能体强化学习综述,129页pdf与76页Slides

博弈论视角下的多智能体强化学习综述,129页pdf与76页Slides

专知会员服务

140+阅读 · 2022年11月26日

「博弈论视角下多智能体强化学习」研究综述

「博弈论视角下多智能体强化学习」研究综述

专知会员服务

184+阅读 · 2022年4月30日

【DeepMind】基于模型的强化学习，174页ppt，Model-Based Reinforcement Learning

【DeepMind】基于模型的强化学习，174页ppt，Model-Based Reinforcement Learning

专知会员服务

89+阅读 · 2021年1月12日

最新《深度强化学习中的迁移学习》综述论文

最新《深度强化学习中的迁移学习》综述论文

专知会员服务

157+阅读 · 2020年9月20日

【ICML2020】基于模型的强化学习方法教程，279页ppt

【ICML2020】基于模型的强化学习方法教程，279页ppt

专知会员服务

129+阅读 · 2020年7月20日

最新《深度多任务学习》综述论文，22页pdf109篇文献概述MTL最新进展

最新《深度多任务学习》综述论文，22页pdf109篇文献概述MTL最新进展

专知会员服务

118+阅读 · 2020年6月13日

最新《经济学中的强化学习》2020大综述，42页pdf128篇文献

最新《经济学中的强化学习》2020大综述，42页pdf128篇文献

专知会员服务

120+阅读 · 2020年4月6日

【综述】自动驾驶领域中的强化学习，附18页论文下载

【综述】自动驾驶领域中的强化学习，附18页论文下载

专知会员服务

176+阅读 · 2020年2月8日

【综述】多智能体深度强化学习综述，附49页PDF

专知会员服务

213+阅读 · 2019年8月30日

「基于课程学习的深度强化学习」研究综述

「基于课程学习的深度强化学习」研究综述

专知

9+阅读 · 2022年11月28日

博弈论视角下的多智能体强化学习综述,129页pdf与76页Slides

博弈论视角下的多智能体强化学习综述,129页pdf与76页Slides

专知

10+阅读 · 2022年11月26日

推荐！《基于多智能体学习的任务分配动态邻域优化》2022最新41页综述论文，伦敦国王学院

推荐！《基于多智能体学习的任务分配动态邻域优化》2022最新41页综述论文，伦敦国王学院

专知

17+阅读 · 2022年11月15日

「基于通信的多智能体强化学习」进展综述

「基于通信的多智能体强化学习」进展综述

专知

30+阅读 · 2022年11月12日

南大最新综述论文：基于模型的强化学习

南大最新综述论文：基于模型的强化学习

新智元

8+阅读 · 2022年8月1日

综述| 当图神经网络遇上强化学习

综述| 当图神经网络遇上强化学习

图与推荐

34+阅读 · 2022年7月1日

「博弈论视角下多智能体强化学习」研究综述

「博弈论视角下多智能体强化学习」研究综述

专知

57+阅读 · 2022年4月30日

【综述】交通流量预测，附15页论文下载

【综述】交通流量预测，附15页论文下载

专知

22+阅读 · 2020年4月23日

关于强化学习（附代码，练习和解答）

关于强化学习（附代码，练习和解答）

深度学习

37+阅读 · 2018年1月30日

【DRL教程学习笔记01】AlphaGo Zero核心技术- 深度强化学习简介

【DRL教程学习笔记01】AlphaGo Zero核心技术- 深度强化学习简介

专知

17+阅读 · 2017年10月20日

基于重要性采样的并行离策略强化学习方法研究

国家自然科学基金

23+阅读 · 2015年12月31日

复杂多智能体系统分布式输出调节问题的研究

国家自然科学基金

1+阅读 · 2014年12月31日

预测状态表示中状态空间划分机制及应用研究

国家自然科学基金

0+阅读 · 2012年12月31日

一般线性多智能体系统的协调控制及其在多机器人系统中的应用

国家自然科学基金

2+阅读 · 2012年12月31日

随机极值搜索及其应用问题研究

国家自然科学基金

0+阅读 · 2011年12月31日

多智能体系统的分布式动态覆盖控制

国家自然科学基金

5+阅读 · 2011年12月31日

概率并发理论

国家自然科学基金

1+阅读 · 2011年12月31日

基于多智能体强化学习的多机器人系统研究

国家自然科学基金

48+阅读 · 2009年12月31日

基于实时交互规约的分布嵌入式软件可确定调度方法研究

国家自然科学基金

0+阅读 · 2008年12月31日

CPS标准下AGC的最优松驰控制及其马尔可夫决策过程

国家自然科学基金

1+阅读 · 2008年12月31日

On the Audio-visual Synchronization for Lip-to-Speech Synthesis

Arxiv

0+阅读 · 2023年3月1日

Reinforcement Learning on Graph: A Survey

Arxiv

67+阅读 · 2022年4月13日

Scene Graph Generation: A Comprehensive Survey

Arxiv

26+阅读 · 2022年1月3日

Deep Long-Tailed Learning: A Survey

Arxiv

13+阅读 · 2021年10月9日

A Survey of Deep Reinforcement Learning in Recommender Systems: A Systematic Review and Future Directions

Arxiv

14+阅读 · 2021年9月8日

Recent Advances in Deep Learning-based Dialogue Systems

Arxiv

18+阅读 · 2021年5月10日

A Survey on Multi-Task Learning

Arxiv

31+阅读 · 2021年3月29日

Transfer Learning in Deep Reinforcement Learning: A Survey

Transfer Learning in Deep Reinforcement Learning: A Survey

Arxiv

23+阅读 · 2020年9月16日

A Review on Generative Adversarial Networks: Algorithms, Theory, and Applications

A Review on Generative Adversarial Networks: Algorithms, Theory, and Applications

Arxiv

59+阅读 · 2020年1月20日

Deep Learning on Graphs: A Survey

Arxiv

53+阅读 · 2018年12月11日

VIP会员

相关主题

基于模型的强化学习

相关VIP内容

基于课程学习的深度强化学习研究综述

基于课程学习的深度强化学习研究综述

专知会员服务

58+阅读 · 2022年11月28日

博弈论视角下的多智能体强化学习综述,129页pdf与76页Slides

博弈论视角下的多智能体强化学习综述,129页pdf与76页Slides

专知会员服务

140+阅读 · 2022年11月26日

「博弈论视角下多智能体强化学习」研究综述

「博弈论视角下多智能体强化学习」研究综述

专知会员服务

184+阅读 · 2022年4月30日

【DeepMind】基于模型的强化学习，174页ppt，Model-Based Reinforcement Learning

【DeepMind】基于模型的强化学习，174页ppt，Model-Based Reinforcement Learning

专知会员服务

89+阅读 · 2021年1月12日

最新《深度强化学习中的迁移学习》综述论文

最新《深度强化学习中的迁移学习》综述论文

专知会员服务

157+阅读 · 2020年9月20日

【ICML2020】基于模型的强化学习方法教程，279页ppt

【ICML2020】基于模型的强化学习方法教程，279页ppt

专知会员服务

129+阅读 · 2020年7月20日

最新《深度多任务学习》综述论文，22页pdf109篇文献概述MTL最新进展

最新《深度多任务学习》综述论文，22页pdf109篇文献概述MTL最新进展

专知会员服务

118+阅读 · 2020年6月13日

最新《经济学中的强化学习》2020大综述，42页pdf128篇文献

最新《经济学中的强化学习》2020大综述，42页pdf128篇文献

专知会员服务

120+阅读 · 2020年4月6日

【综述】自动驾驶领域中的强化学习，附18页论文下载

【综述】自动驾驶领域中的强化学习，附18页论文下载

专知会员服务

176+阅读 · 2020年2月8日

【综述】多智能体深度强化学习综述，附49页PDF

专知会员服务

213+阅读 · 2019年8月30日

热门VIP内容

开通专知VIP会员享更多权益服务

【CMU博士论文】以人为中心的强化学习

任务规划与地形分析：现代复杂环境作战导航体系

认知优势：人工智能在国家安全决策中的核心作用

大模型赋能的具身智能：决策与具身学习综述

相关资讯

「基于课程学习的深度强化学习」研究综述

「基于课程学习的深度强化学习」研究综述

专知

9+阅读 · 2022年11月28日

博弈论视角下的多智能体强化学习综述,129页pdf与76页Slides

博弈论视角下的多智能体强化学习综述,129页pdf与76页Slides

专知

10+阅读 · 2022年11月26日

推荐！《基于多智能体学习的任务分配动态邻域优化》2022最新41页综述论文，伦敦国王学院

推荐！《基于多智能体学习的任务分配动态邻域优化》2022最新41页综述论文，伦敦国王学院

专知

17+阅读 · 2022年11月15日

「基于通信的多智能体强化学习」进展综述

「基于通信的多智能体强化学习」进展综述

专知

30+阅读 · 2022年11月12日

南大最新综述论文：基于模型的强化学习

南大最新综述论文：基于模型的强化学习

新智元

8+阅读 · 2022年8月1日

综述| 当图神经网络遇上强化学习

综述| 当图神经网络遇上强化学习

图与推荐

34+阅读 · 2022年7月1日

「博弈论视角下多智能体强化学习」研究综述

「博弈论视角下多智能体强化学习」研究综述

专知

57+阅读 · 2022年4月30日

【综述】交通流量预测，附15页论文下载

【综述】交通流量预测，附15页论文下载

专知

22+阅读 · 2020年4月23日

关于强化学习（附代码，练习和解答）

关于强化学习（附代码，练习和解答）

深度学习

37+阅读 · 2018年1月30日

【DRL教程学习笔记01】AlphaGo Zero核心技术- 深度强化学习简介

【DRL教程学习笔记01】AlphaGo Zero核心技术- 深度强化学习简介

专知

17+阅读 · 2017年10月20日

相关基金

基于重要性采样的并行离策略强化学习方法研究

国家自然科学基金

23+阅读 · 2015年12月31日

复杂多智能体系统分布式输出调节问题的研究

国家自然科学基金

1+阅读 · 2014年12月31日

预测状态表示中状态空间划分机制及应用研究

国家自然科学基金

0+阅读 · 2012年12月31日

一般线性多智能体系统的协调控制及其在多机器人系统中的应用

国家自然科学基金

2+阅读 · 2012年12月31日

随机极值搜索及其应用问题研究

国家自然科学基金

0+阅读 · 2011年12月31日

多智能体系统的分布式动态覆盖控制

国家自然科学基金

5+阅读 · 2011年12月31日

概率并发理论

国家自然科学基金

1+阅读 · 2011年12月31日

基于多智能体强化学习的多机器人系统研究

国家自然科学基金

48+阅读 · 2009年12月31日

基于实时交互规约的分布嵌入式软件可确定调度方法研究

国家自然科学基金

0+阅读 · 2008年12月31日

CPS标准下AGC的最优松驰控制及其马尔可夫决策过程

国家自然科学基金

1+阅读 · 2008年12月31日

相关论文

On the Audio-visual Synchronization for Lip-to-Speech Synthesis

Arxiv

0+阅读 · 2023年3月1日

Reinforcement Learning on Graph: A Survey

Arxiv

67+阅读 · 2022年4月13日

Scene Graph Generation: A Comprehensive Survey

Arxiv

26+阅读 · 2022年1月3日

Deep Long-Tailed Learning: A Survey

Arxiv

13+阅读 · 2021年10月9日

A Survey of Deep Reinforcement Learning in Recommender Systems: A Systematic Review and Future Directions

Arxiv

14+阅读 · 2021年9月8日

Recent Advances in Deep Learning-based Dialogue Systems

Arxiv

18+阅读 · 2021年5月10日

A Survey on Multi-Task Learning

Arxiv

31+阅读 · 2021年3月29日

Transfer Learning in Deep Reinforcement Learning: A Survey

Transfer Learning in Deep Reinforcement Learning: A Survey

Arxiv

23+阅读 · 2020年9月16日

A Review on Generative Adversarial Networks: Algorithms, Theory, and Applications

A Review on Generative Adversarial Networks: Algorithms, Theory, and Applications

Arxiv

59+阅读 · 2020年1月20日

Deep Learning on Graphs: A Survey

Arxiv

53+阅读 · 2018年12月11日

微信扫码咨询专知VIP会员