【简明书】强化学习的基础,111页pdf

2022 年 11 月 16 日 专知

这本手稿涵盖了强化学习的所有重要的基本方面。第二章采用马尔可夫决策过程对主体与环境之间的相互作用进行建模。第三章介绍了基于给定环境模型解决MDP问题的核心技术——动态规划。一般来说,解决MDP问题涉及到政策评估和政策改进的迭代。在第四章中,我们讨论了无模型方法:蒙特卡洛,TD学习,SARSA和q学习。第五章对强化学习中的值函数逼近进行了一般讨论。作为一个重要的例子,深度Q-learning将在第6章中详细介绍。第7章介绍了策略梯度方法,重点介绍了策略梯度定理、REINFORCE算法、Advantage Actor-Critic算法等基本概念。



专知便捷查看

便捷下载,请关注专知公众号(点击上方蓝色专知关注)

  • 后台回复“R111” 就可以获取【简明书】强化学习的基础,111页pdf》专知下载链接

                       
专知,专业可信的人工智能知识分发 ,让认知协作更快更好!欢迎注册登录专知www.zhuanzhi.ai,获取100000+AI(AI与军事、医药、公安等)主题干货知识资料!
欢迎微信扫一扫加入专知人工智能知识星球群,获取最新AI专业干货知识教程资料和与专家交流咨询
点击“ 阅读原文 ”,了解使用 专知 ,查看获取100000+AI主题知识资料

登录查看更多
1

相关内容

强化学习(RL)是机器学习的一个领域,与软件代理应如何在环境中采取行动以最大化累积奖励的概念有关。除了监督学习和非监督学习外,强化学习是三种基本的机器学习范式之一。 强化学习与监督学习的不同之处在于,不需要呈现带标签的输入/输出对,也不需要显式纠正次优动作。相反,重点是在探索(未知领域)和利用(当前知识)之间找到平衡。 该环境通常以马尔可夫决策过程(MDP)的形式陈述,因为针对这种情况的许多强化学习算法都使用动态编程技术。经典动态规划方法和强化学习算法之间的主要区别在于,后者不假设MDP的确切数学模型,并且针对无法采用精确方法的大型MDP。

知识荟萃

精品入门和进阶教程、论文和代码整理等

更多

查看相关VIP内容、论文、资讯等
强化学习的简要总结,18页pdf
专知会员服务
57+阅读 · 2023年1月7日
【硬核书】博弈论,592页pdf
专知会员服务
151+阅读 · 2022年12月7日
【2022新书】深度强化学习基础: Python的理论与实践
专知会员服务
136+阅读 · 2022年11月18日
【硬核书】多智能体协调:强化学习方法,315页pdf
专知会员服务
156+阅读 · 2022年9月17日
现代自适应控制与强化学习,166页pdf
专知会员服务
109+阅读 · 2022年8月30日
【2022新书】强化学习工业应用,408页pdf
专知会员服务
226+阅读 · 2022年2月3日
【斯坦福经典书】强化学习在金融应用,414页pdf
专知会员服务
122+阅读 · 2021年3月30日
【实用书】强化学习实战:Python,110页pdf
【新书】多元统计与机器学习,185页pdf
专知
6+阅读 · 2022年6月5日
【2022新书】强化学习工业应用
专知
17+阅读 · 2022年2月3日
【新书】分布式强化学习,280页pdf
专知
20+阅读 · 2021年12月19日
【经典书】贝叶斯强化学习概述,147页pdf
专知
4+阅读 · 2021年11月21日
国家自然科学基金
0+阅读 · 2015年12月31日
国家自然科学基金
8+阅读 · 2014年12月31日
国家自然科学基金
0+阅读 · 2013年12月31日
国家自然科学基金
2+阅读 · 2012年12月31日
国家自然科学基金
2+阅读 · 2009年12月31日
国家自然科学基金
21+阅读 · 2009年12月31日
国家自然科学基金
0+阅读 · 2008年12月31日
国家自然科学基金
11+阅读 · 2008年12月31日
Arxiv
31+阅读 · 2023年1月8日
Arxiv
22+阅读 · 2021年12月19日
Arxiv
13+阅读 · 2021年10月9日
Arxiv
32+阅读 · 2021年3月8日
Few-shot Learning: A Survey
Arxiv
362+阅读 · 2019年4月10日
VIP会员
相关VIP内容
强化学习的简要总结,18页pdf
专知会员服务
57+阅读 · 2023年1月7日
【硬核书】博弈论,592页pdf
专知会员服务
151+阅读 · 2022年12月7日
【2022新书】深度强化学习基础: Python的理论与实践
专知会员服务
136+阅读 · 2022年11月18日
【硬核书】多智能体协调:强化学习方法,315页pdf
专知会员服务
156+阅读 · 2022年9月17日
现代自适应控制与强化学习,166页pdf
专知会员服务
109+阅读 · 2022年8月30日
【2022新书】强化学习工业应用,408页pdf
专知会员服务
226+阅读 · 2022年2月3日
【斯坦福经典书】强化学习在金融应用,414页pdf
专知会员服务
122+阅读 · 2021年3月30日
相关基金
国家自然科学基金
0+阅读 · 2015年12月31日
国家自然科学基金
8+阅读 · 2014年12月31日
国家自然科学基金
0+阅读 · 2013年12月31日
国家自然科学基金
2+阅读 · 2012年12月31日
国家自然科学基金
2+阅读 · 2009年12月31日
国家自然科学基金
21+阅读 · 2009年12月31日
国家自然科学基金
0+阅读 · 2008年12月31日
国家自然科学基金
11+阅读 · 2008年12月31日
Top
微信扫码咨询专知VIP会员