序列决策,通常形式化为马尔可夫决策过程(MDP)优化,是人工智能的一个重要挑战。解决这个问题的两种关键方法是强化学习(RL)和规划。这项综述是这两个领域的集成,更广为人知的是基于模型的强化学习。基于模型的RL有两个主要步骤。首先,我们系统地介绍了动力学模型学习的方法,包括处理随机性、不确定性、部分可观察性和时间抽象等挑战。其次,我们提出了规划-学习集成的系统分类,包括:从哪里开始规划,为规划和实际数据收集分配哪些预算,如何规划,以及如何在学习和行动循环中集成规划。在这两个部分之后,我们还讨论了隐式基于模型的RL作为模型学习和规划的端到端替代方案,并讨论了基于模型的RL的潜在好处。在此过程中,调研还与几个相关的RL领域建立了联系,如分层RL和传输。

成为VIP会员查看完整内容
46

相关内容

基于课程学习的深度强化学习研究综述
专知会员服务
57+阅读 · 2022年11月28日
博弈论视角下的多智能体强化学习综述,129页pdf与76页Slides
专知会员服务
135+阅读 · 2022年11月26日
「博弈论视角下多智能体强化学习」研究综述
专知会员服务
180+阅读 · 2022年4月30日
最新《深度强化学习中的迁移学习》综述论文
专知会员服务
153+阅读 · 2020年9月20日
【ICML2020】基于模型的强化学习方法教程,279页ppt
专知会员服务
126+阅读 · 2020年7月20日
最新《经济学中的强化学习》2020大综述,42页pdf128篇文献
【综述】自动驾驶领域中的强化学习,附18页论文下载
专知会员服务
172+阅读 · 2020年2月8日
专知会员服务
206+阅读 · 2019年8月30日
「基于课程学习的深度强化学习」研究综述
「基于通信的多智能体强化学习」 进展综述
南大最新综述论文:基于模型的强化学习
新智元
8+阅读 · 2022年8月1日
综述| 当图神经网络遇上强化学习
图与推荐
29+阅读 · 2022年7月1日
【综述】交通流量预测,附15页论文下载
专知
22+阅读 · 2020年4月23日
关于强化学习(附代码,练习和解答)
深度学习
36+阅读 · 2018年1月30日
国家自然科学基金
20+阅读 · 2015年12月31日
国家自然科学基金
1+阅读 · 2014年12月31日
国家自然科学基金
0+阅读 · 2012年12月31日
国家自然科学基金
0+阅读 · 2011年12月31日
国家自然科学基金
5+阅读 · 2011年12月31日
国家自然科学基金
1+阅读 · 2011年12月31日
国家自然科学基金
45+阅读 · 2009年12月31日
国家自然科学基金
0+阅读 · 2008年12月31日
国家自然科学基金
1+阅读 · 2008年12月31日
Arxiv
66+阅读 · 2022年4月13日
Arxiv
25+阅读 · 2022年1月3日
Arxiv
13+阅读 · 2021年10月9日
Arxiv
31+阅读 · 2021年3月29日
Arxiv
53+阅读 · 2018年12月11日
VIP会员
相关VIP内容
基于课程学习的深度强化学习研究综述
专知会员服务
57+阅读 · 2022年11月28日
博弈论视角下的多智能体强化学习综述,129页pdf与76页Slides
专知会员服务
135+阅读 · 2022年11月26日
「博弈论视角下多智能体强化学习」研究综述
专知会员服务
180+阅读 · 2022年4月30日
最新《深度强化学习中的迁移学习》综述论文
专知会员服务
153+阅读 · 2020年9月20日
【ICML2020】基于模型的强化学习方法教程,279页ppt
专知会员服务
126+阅读 · 2020年7月20日
最新《经济学中的强化学习》2020大综述,42页pdf128篇文献
【综述】自动驾驶领域中的强化学习,附18页论文下载
专知会员服务
172+阅读 · 2020年2月8日
专知会员服务
206+阅读 · 2019年8月30日
相关基金
国家自然科学基金
20+阅读 · 2015年12月31日
国家自然科学基金
1+阅读 · 2014年12月31日
国家自然科学基金
0+阅读 · 2012年12月31日
国家自然科学基金
0+阅读 · 2011年12月31日
国家自然科学基金
5+阅读 · 2011年12月31日
国家自然科学基金
1+阅读 · 2011年12月31日
国家自然科学基金
45+阅读 · 2009年12月31日
国家自然科学基金
0+阅读 · 2008年12月31日
国家自然科学基金
1+阅读 · 2008年12月31日
相关论文
Arxiv
66+阅读 · 2022年4月13日
Arxiv
25+阅读 · 2022年1月3日
Arxiv
13+阅读 · 2021年10月9日
Arxiv
31+阅读 · 2021年3月29日
Arxiv
53+阅读 · 2018年12月11日
微信扫码咨询专知VIP会员