这本书的一个关键结构特点是其模块化的组织方式,旨在提供灵活性,以便根据课程内容的变化进行调整和修改。具体来说,全书分为两个部分: (1)基础平台:包括第1章。该章节对近似动态规划(DP)/强化学习(RL)领域进行了有选择性的概述,为课堂中其他RL主题的更深入讲解提供了起点,而这些主题的选择可以由授课教师灵活决定。 (2)深入探讨部分:包括第2章和第3章,主要聚焦于具体方法的详细介绍。第2章主要讲解确定性与随机性 rollout 技术,以及一些相关的价值函数近似方法;第3章则讨论了在离线训练中使用神经网络及其他近似结构的技术。 这种模块化结构允许教师根据课程重点进行个性化定制。例如,教师可以利用第1章的基础平台来构建更偏数学理论或更偏实用导向的课程,以满足不同学生的需求。 此外,还需指出的是,本书所包含的内容超出了一个学期课堂教学所能覆盖的范围,这为授课教师在教学内容选择上提供了更多灵活性。

成为VIP会员查看完整内容
38

相关内容

强化学习(RL)是机器学习的一个领域,与软件代理应如何在环境中采取行动以最大化累积奖励的概念有关。除了监督学习和非监督学习外,强化学习是三种基本的机器学习范式之一。 强化学习与监督学习的不同之处在于,不需要呈现带标签的输入/输出对,也不需要显式纠正次优动作。相反,重点是在探索(未知领域)和利用(当前知识)之间找到平衡。 该环境通常以马尔可夫决策过程(MDP)的形式陈述,因为针对这种情况的许多强化学习算法都使用动态编程技术。经典动态规划方法和强化学习算法之间的主要区别在于,后者不假设MDP的确切数学模型,并且针对无法采用精确方法的大型MDP。

知识荟萃

精品入门和进阶教程、论文和代码整理等

更多

查看相关VIP内容、论文、资讯等
【新书】《强化学习概述》手册,177页pdf
专知会员服务
92+阅读 · 2024年12月10日
【新书】算法基础,694页pdf
专知会员服务
75+阅读 · 2024年4月13日
【干货书】深度强化学习导论,140页pdf
专知会员服务
82+阅读 · 2023年10月21日
【干货书】概率与统计学,266页pdf
专知会员服务
74+阅读 · 2023年9月3日
【干货书】《信息论: 从编码到学习(2022第三版)》
专知会员服务
78+阅读 · 2023年3月19日
【干货书】机器学习理论与实践,299页pdf
专知会员服务
97+阅读 · 2022年12月5日
【简明书】强化学习的基础,111页pdf
专知会员服务
94+阅读 · 2022年11月16日
【经典书】统计学习导论,434页pdf,斯坦福大学
专知会员服务
237+阅读 · 2020年4月29日
【干货书】统计基础、推理与推断,361页pdf
【干货书】深度学习全面指南,307页pdf
专知
31+阅读 · 2022年1月6日
【新书】分布式强化学习,280页pdf
专知
21+阅读 · 2021年12月19日
【干货书】高维统计学,572页pdf
专知
18+阅读 · 2021年12月3日
【干货书】概率,统计与数据,513页pdf
专知
35+阅读 · 2021年11月27日
【干货书】数据科学手册,456页pdf
专知
14+阅读 · 2021年4月28日
下载 | 954页《数据可视化》手册
机器学习算法与Python学习
22+阅读 · 2019年1月3日
548页MIT强化学习教程,收藏备用【PDF下载】
机器学习算法与Python学习
17+阅读 · 2018年10月11日
国家自然科学基金
15+阅读 · 2016年12月31日
国家自然科学基金
27+阅读 · 2015年12月31日
国家自然科学基金
1+阅读 · 2015年12月31日
国家自然科学基金
7+阅读 · 2015年12月31日
国家自然科学基金
22+阅读 · 2015年12月31日
国家自然科学基金
9+阅读 · 2015年12月31日
国家自然科学基金
2+阅读 · 2015年12月31日
国家自然科学基金
2+阅读 · 2015年12月31日
国家自然科学基金
2+阅读 · 2014年12月31日
国家自然科学基金
4+阅读 · 2014年12月31日
Arxiv
166+阅读 · 2023年4月20日
A Survey of Large Language Models
Arxiv
452+阅读 · 2023年3月31日
Arxiv
76+阅读 · 2023年3月26日
Arxiv
166+阅读 · 2023年3月24日
Arxiv
24+阅读 · 2023年3月17日
VIP会员
相关VIP内容
【新书】《强化学习概述》手册,177页pdf
专知会员服务
92+阅读 · 2024年12月10日
【新书】算法基础,694页pdf
专知会员服务
75+阅读 · 2024年4月13日
【干货书】深度强化学习导论,140页pdf
专知会员服务
82+阅读 · 2023年10月21日
【干货书】概率与统计学,266页pdf
专知会员服务
74+阅读 · 2023年9月3日
【干货书】《信息论: 从编码到学习(2022第三版)》
专知会员服务
78+阅读 · 2023年3月19日
【干货书】机器学习理论与实践,299页pdf
专知会员服务
97+阅读 · 2022年12月5日
【简明书】强化学习的基础,111页pdf
专知会员服务
94+阅读 · 2022年11月16日
【经典书】统计学习导论,434页pdf,斯坦福大学
专知会员服务
237+阅读 · 2020年4月29日
相关资讯
【干货书】统计基础、推理与推断,361页pdf
【干货书】深度学习全面指南,307页pdf
专知
31+阅读 · 2022年1月6日
【新书】分布式强化学习,280页pdf
专知
21+阅读 · 2021年12月19日
【干货书】高维统计学,572页pdf
专知
18+阅读 · 2021年12月3日
【干货书】概率,统计与数据,513页pdf
专知
35+阅读 · 2021年11月27日
【干货书】数据科学手册,456页pdf
专知
14+阅读 · 2021年4月28日
下载 | 954页《数据可视化》手册
机器学习算法与Python学习
22+阅读 · 2019年1月3日
548页MIT强化学习教程,收藏备用【PDF下载】
机器学习算法与Python学习
17+阅读 · 2018年10月11日
相关基金
国家自然科学基金
15+阅读 · 2016年12月31日
国家自然科学基金
27+阅读 · 2015年12月31日
国家自然科学基金
1+阅读 · 2015年12月31日
国家自然科学基金
7+阅读 · 2015年12月31日
国家自然科学基金
22+阅读 · 2015年12月31日
国家自然科学基金
9+阅读 · 2015年12月31日
国家自然科学基金
2+阅读 · 2015年12月31日
国家自然科学基金
2+阅读 · 2015年12月31日
国家自然科学基金
2+阅读 · 2014年12月31日
国家自然科学基金
4+阅读 · 2014年12月31日
微信扫码咨询专知VIP会员