这本手稿涵盖了强化学习的所有重要的基本方面。第二章采用马尔可夫决策过程对主体与环境之间的相互作用进行建模。第三章介绍了基于给定环境模型解决MDP问题的核心技术——动态规划。一般来说,解决MDP问题涉及到政策评估和政策改进的迭代。在第四章中,我们讨论了无模型方法:蒙特卡洛,TD学习,SARSA和q学习。第五章对强化学习中的值函数逼近进行了一般讨论。作为一个重要的例子,深度Q-learning将在第6章中详细介绍。第7章介绍了策略梯度方法,重点介绍了策略梯度定理、REINFORCE算法、Advantage Actor-Critic算法等基本概念。

成为VIP会员查看完整内容
92

相关内容

书籍在狭义上的理解是带有文字和图像的纸张的集合。广义的书则是一切传播信息的媒体。
强化学习的简要总结,18页pdf
专知会员服务
57+阅读 · 2023年1月7日
【硬核书】博弈论,592页pdf
专知会员服务
153+阅读 · 2022年12月7日
【2022新书】深度强化学习基础: Python的理论与实践
专知会员服务
136+阅读 · 2022年11月18日
【硬核书】多智能体协调:强化学习方法,315页pdf
专知会员服务
156+阅读 · 2022年9月17日
【CMU博士论文】通过记忆的元强化学习,118页pdf
专知会员服务
46+阅读 · 2022年6月23日
【2022新书】强化学习工业应用,408页pdf
专知会员服务
227+阅读 · 2022年2月3日
【新书】分布式强化学习,280页pdf
专知会员服务
152+阅读 · 2021年12月19日
专知会员服务
212+阅读 · 2021年8月2日
【2021新书】分布式优化,博弈和学习算法,227页pdf
专知会员服务
227+阅读 · 2021年5月25日
【硬核书】信号处理基础,677页pdf
专知
7+阅读 · 2022年9月6日
【2022新书】强化学习工业应用
专知
17+阅读 · 2022年2月3日
【新书】分布式强化学习,280页pdf
专知
21+阅读 · 2021年12月19日
从入门到精通-Tensorflow深度强化学习课程
深度学习与NLP
23+阅读 · 2019年3月7日
强化学习精品书籍
平均机器
25+阅读 · 2019年1月2日
深度强化学习入门,这一篇就够了!
机器学习算法与Python学习
27+阅读 · 2018年8月17日
入门 | 从Q学习到DDPG,一文简述多种强化学习算法
国家自然科学基金
0+阅读 · 2015年12月31日
国家自然科学基金
20+阅读 · 2015年12月31日
国家自然科学基金
2+阅读 · 2013年12月31日
国家自然科学基金
2+阅读 · 2012年12月31日
国家自然科学基金
1+阅读 · 2011年12月31日
国家自然科学基金
3+阅读 · 2011年12月31日
国家自然科学基金
21+阅读 · 2009年12月31日
国家自然科学基金
45+阅读 · 2009年12月31日
国家自然科学基金
11+阅读 · 2008年12月31日
Arxiv
31+阅读 · 2023年1月8日
Arxiv
15+阅读 · 2022年6月14日
Arxiv
57+阅读 · 2021年5月3日
Arxiv
31+阅读 · 2021年3月29日
Arxiv
32+阅读 · 2021年3月8日
Arxiv
24+阅读 · 2021年1月25日
Few-shot Learning: A Survey
Arxiv
362+阅读 · 2019年4月10日
VIP会员
相关VIP内容
强化学习的简要总结,18页pdf
专知会员服务
57+阅读 · 2023年1月7日
【硬核书】博弈论,592页pdf
专知会员服务
153+阅读 · 2022年12月7日
【2022新书】深度强化学习基础: Python的理论与实践
专知会员服务
136+阅读 · 2022年11月18日
【硬核书】多智能体协调:强化学习方法,315页pdf
专知会员服务
156+阅读 · 2022年9月17日
【CMU博士论文】通过记忆的元强化学习,118页pdf
专知会员服务
46+阅读 · 2022年6月23日
【2022新书】强化学习工业应用,408页pdf
专知会员服务
227+阅读 · 2022年2月3日
【新书】分布式强化学习,280页pdf
专知会员服务
152+阅读 · 2021年12月19日
专知会员服务
212+阅读 · 2021年8月2日
【2021新书】分布式优化,博弈和学习算法,227页pdf
专知会员服务
227+阅读 · 2021年5月25日
相关资讯
【硬核书】信号处理基础,677页pdf
专知
7+阅读 · 2022年9月6日
【2022新书】强化学习工业应用
专知
17+阅读 · 2022年2月3日
【新书】分布式强化学习,280页pdf
专知
21+阅读 · 2021年12月19日
从入门到精通-Tensorflow深度强化学习课程
深度学习与NLP
23+阅读 · 2019年3月7日
强化学习精品书籍
平均机器
25+阅读 · 2019年1月2日
深度强化学习入门,这一篇就够了!
机器学习算法与Python学习
27+阅读 · 2018年8月17日
入门 | 从Q学习到DDPG,一文简述多种强化学习算法
相关基金
国家自然科学基金
0+阅读 · 2015年12月31日
国家自然科学基金
20+阅读 · 2015年12月31日
国家自然科学基金
2+阅读 · 2013年12月31日
国家自然科学基金
2+阅读 · 2012年12月31日
国家自然科学基金
1+阅读 · 2011年12月31日
国家自然科学基金
3+阅读 · 2011年12月31日
国家自然科学基金
21+阅读 · 2009年12月31日
国家自然科学基金
45+阅读 · 2009年12月31日
国家自然科学基金
11+阅读 · 2008年12月31日
相关论文
Arxiv
31+阅读 · 2023年1月8日
Arxiv
15+阅读 · 2022年6月14日
Arxiv
57+阅读 · 2021年5月3日
Arxiv
31+阅读 · 2021年3月29日
Arxiv
32+阅读 · 2021年3月8日
Arxiv
24+阅读 · 2021年1月25日
Few-shot Learning: A Survey
Arxiv
362+阅读 · 2019年4月10日
微信扫码咨询专知VIP会员