【2023新书】强化学习导论(自适应计算与机器学习) - 专知VIP

会员服务 ·

51

强化学习 · 书籍 ·

2023 年 7 月 13 日

【2023新书】强化学习导论(自适应计算与机器学习)

专知会员服务

专知，提供专业可信的知识分发服务，让认知协作更快更好！

李察·萨顿和安德鲁·巴托以清晰简明的方式阐述了强化学习的关键思想和算法。他们的讨论范围从该领域的知识基础历史到最近的发展和应用。

强化学习是人工智能中最活跃的研究领域之一，是一种计算学习方法，其中一个代理试图在与复杂、不确定的环境交互时最大化其获得的总奖励。在《强化学习》这本书中，李察·萨顿和安德鲁·巴托以清晰简明的方式阐述了强化学习的关键思想和算法。他们的讨论范围从该领域的知识基础历史到最近的发展和应用。所需的数学背景仅是对基本概率概念的熟悉。

该书分为三部分。第一部分用马尔可夫决策过程来定义强化学习问题。第二部分提供基本解决方法：动态规划，蒙特卡洛方法，和时差学习。第三部分提供了一个关于解决方法的统一视角，并融入了人工神经网络，资格痕迹和规划；最后两章提供了案例研究，并考虑了强化学习的未来。

成为VIP会员查看完整内容

82

相关内容

强化学习

强化学习（RL）是机器学习的一个领域，与软件代理应如何在环境中采取行动以最大化累积奖励的概念有关。除了监督学习和非监督学习外，强化学习是三种基本的机器学习范式之一。强化学习与监督学习的不同之处在于，不需要呈现带标签的输入/输出对，也不需要显式纠正次优动作。相反，重点是在探索（未知领域）和利用（当前知识）之间找到平衡。该环境通常以马尔可夫决策过程（MDP）的形式陈述，因为针对这种情况的许多强化学习算法都使用动态编程技术。经典动态规划方法和强化学习算法之间的主要区别在于，后者不假设MDP的确切数学模型，并且针对无法采用精确方法的大型MDP。

知识荟萃

精品入门和进阶教程、论文和代码整理等

更多

查看相关VIP内容、论文、资讯等

重磅！新书《多智能体强化学习：基础与现代方法》最新版，爱丁堡Stefano博士编著，320页pdf

重磅！新书《多智能体强化学习：基础与现代方法》最新版，爱丁堡Stefano博士编著，320页pdf

专知会员服务

175+阅读 · 2023年5月30日

【2023新书】生成深度学习：教机器绘画、写作、作曲和游戏第二版

【2023新书】生成深度学习：教机器绘画、写作、作曲和游戏第二版

专知会员服务

153+阅读 · 2023年5月14日

【2022新书】深度强化学习基础: Python的理论与实践

【2022新书】深度强化学习基础: Python的理论与实践

专知会员服务

140+阅读 · 2022年11月18日

【干货书】强化学习Python真实数据与实例应用，110页pdf

【干货书】强化学习Python真实数据与实例应用，110页pdf

专知会员服务

114+阅读 · 2022年10月13日

【斯坦福】基于模型的深度学习:论深度学习与优化的交集

【斯坦福】基于模型的深度学习:论深度学习与优化的交集

专知会员服务

45+阅读 · 2022年5月10日

【斯坦福大牛Chelsea Finn2021新课】深度多任务与元学习，附课程PPT下载

专知会员服务

29+阅读 · 2021年10月6日

【YannLecun最新报告】自监督学习与能量模型，附99页ppt与视频

【YannLecun最新报告】自监督学习与能量模型，附99页ppt与视频

专知会员服务

56+阅读 · 2021年6月19日

【NeurIPS 2020 Tutorial】离线强化学习:从算法到挑战，80页ppt

【NeurIPS 2020 Tutorial】离线强化学习:从算法到挑战，80页ppt

专知会员服务

59+阅读 · 2020年12月9日

【2020新书】简明机器学习导论，电子书与500页PPT

【2020新书】简明机器学习导论，电子书与500页PPT

专知会员服务

204+阅读 · 2020年2月7日

【新书】贝叶斯网络进展与新应用，附全书下载

【新书】贝叶斯网络进展与新应用，附全书下载

专知会员服务

122+阅读 · 2019年12月9日

【干货书】强化学习Python真实数据与实例应用，110页pdf

【干货书】强化学习Python真实数据与实例应用，110页pdf

专知

9+阅读 · 2022年10月13日

不可错过！CMU陈天奇等硬核课《深度学习系统：算法与实现》，附Slides与视频

不可错过！CMU陈天奇等硬核课《深度学习系统：算法与实现》，附Slides与视频

专知

1+阅读 · 2022年10月6日

【干货书】深度学习目标检测：原理与应用，276页pdf

【干货书】深度学习目标检测：原理与应用，276页pdf

专知

23+阅读 · 2022年9月24日

【干货书】金融大数据的随机建模，305页pdf

【干货书】金融大数据的随机建模，305页pdf

专知

1+阅读 · 2022年9月15日

不可错过！华盛顿大学最新《可解释人工智能》课程，系统讲述XAI最新进展

不可错过！华盛顿大学最新《可解释人工智能》课程，系统讲述XAI最新进展

专知

5+阅读 · 2022年9月14日

【2022新书】机器学习中的概率数值计算，412页pdf

【2022新书】机器学习中的概率数值计算，412页pdf

专知

31+阅读 · 2022年7月7日

综述| 当图神经网络遇上强化学习

综述| 当图神经网络遇上强化学习

图与推荐

34+阅读 · 2022年7月1日

【2022新书】元学习(Meta Learning ): 自动机器学习与数据挖掘

【2022新书】元学习(Meta Learning ): 自动机器学习与数据挖掘

专知

20+阅读 · 2022年3月7日

【新书】机器学习算法，模型与应用，154页pdf

【新书】机器学习算法，模型与应用，154页pdf

专知

24+阅读 · 2022年1月20日

【NeurIPS 2020 Tutorial】离线强化学习:从算法到挑战，80页ppt

【NeurIPS 2020 Tutorial】离线强化学习:从算法到挑战，80页ppt

专知

16+阅读 · 2020年12月9日

核心化算法中的新技术研究

国家自然科学基金

8+阅读 · 2017年12月31日

语义Web知识库补全关键技术研究

国家自然科学基金

14+阅读 · 2017年12月31日

基于深度学习的复杂退化模糊图像恢复

国家自然科学基金

5+阅读 · 2015年12月31日

面向大数据的安全迁移学习方法

国家自然科学基金

28+阅读 · 2015年12月31日

基于安全需求分析的内核保护方法研究

国家自然科学基金

2+阅读 · 2015年12月31日

基于低维连续表示的启发式智能规划技术研究

国家自然科学基金

4+阅读 · 2015年12月31日

数据驱动的人体图像语义分割研究

国家自然科学基金

4+阅读 · 2014年12月31日

海量Web用户生成内容物化关键技术

国家自然科学基金

2+阅读 · 2014年12月31日

非线性混合效应模型的最优与稳健设计

国家自然科学基金

0+阅读 · 2014年12月31日

强化学习关键技术及其在机器人行为学习中的应用

国家自然科学基金

21+阅读 · 2009年12月31日

Implicit regularization of deep residual networks towards neural ODEs

Arxiv

0+阅读 · 2023年9月3日

SGD learning on neural networks: leap complexity and saddle-to-saddle dynamics

Arxiv

0+阅读 · 2023年8月31日

A Comprehensive Survey on Deep Graph Representation Learning

Arxiv

103+阅读 · 2023年4月11日

On Efficient Training of Large-Scale Deep Learning Models: A Literature Review

Arxiv

215+阅读 · 2023年4月7日

A Survey of Large Language Models

A Survey of Large Language Models

Arxiv

473+阅读 · 2023年3月31日

Deep learning: a statistical viewpoint

Arxiv

18+阅读 · 2021年3月16日

Meta-learning in natural and artificial intelligence

Arxiv

10+阅读 · 2020年11月26日

How to train your MAML

Arxiv

26+阅读 · 2019年3月5日

Interpretable machine learning: definitions, methods, and applications

Interpretable machine learning: definitions, methods, and applications

Arxiv

19+阅读 · 2019年1月14日

Deep learning in agriculture: A survey

Arxiv

11+阅读 · 2018年7月31日

VIP会员

相关主题

相关VIP内容

重磅！新书《多智能体强化学习：基础与现代方法》最新版，爱丁堡Stefano博士编著，320页pdf

重磅！新书《多智能体强化学习：基础与现代方法》最新版，爱丁堡Stefano博士编著，320页pdf

专知会员服务

175+阅读 · 2023年5月30日

【2023新书】生成深度学习：教机器绘画、写作、作曲和游戏第二版

【2023新书】生成深度学习：教机器绘画、写作、作曲和游戏第二版

专知会员服务

153+阅读 · 2023年5月14日

【2022新书】深度强化学习基础: Python的理论与实践

【2022新书】深度强化学习基础: Python的理论与实践

专知会员服务

140+阅读 · 2022年11月18日

【干货书】强化学习Python真实数据与实例应用，110页pdf

【干货书】强化学习Python真实数据与实例应用，110页pdf

专知会员服务

114+阅读 · 2022年10月13日

【斯坦福】基于模型的深度学习:论深度学习与优化的交集

【斯坦福】基于模型的深度学习:论深度学习与优化的交集

专知会员服务

45+阅读 · 2022年5月10日

【斯坦福大牛Chelsea Finn2021新课】深度多任务与元学习，附课程PPT下载

专知会员服务

29+阅读 · 2021年10月6日

【YannLecun最新报告】自监督学习与能量模型，附99页ppt与视频

【YannLecun最新报告】自监督学习与能量模型，附99页ppt与视频

专知会员服务

56+阅读 · 2021年6月19日

【NeurIPS 2020 Tutorial】离线强化学习:从算法到挑战，80页ppt

【NeurIPS 2020 Tutorial】离线强化学习:从算法到挑战，80页ppt

专知会员服务

59+阅读 · 2020年12月9日

【2020新书】简明机器学习导论，电子书与500页PPT

【2020新书】简明机器学习导论，电子书与500页PPT

专知会员服务

204+阅读 · 2020年2月7日

【新书】贝叶斯网络进展与新应用，附全书下载

【新书】贝叶斯网络进展与新应用，附全书下载

专知会员服务

122+阅读 · 2019年12月9日

热门VIP内容

开通专知VIP会员享更多权益服务

【伯克利博士论文】通过真实世界实践赋能机器人自主性

军用无人机集群技术尚未成熟——但潜力可期

人工智能安全治理白皮书（2025）

AgentOps综述：分类、挑战与未来方向

相关资讯

【干货书】强化学习Python真实数据与实例应用，110页pdf

【干货书】强化学习Python真实数据与实例应用，110页pdf

专知

9+阅读 · 2022年10月13日

不可错过！CMU陈天奇等硬核课《深度学习系统：算法与实现》，附Slides与视频

不可错过！CMU陈天奇等硬核课《深度学习系统：算法与实现》，附Slides与视频

专知

1+阅读 · 2022年10月6日

【干货书】深度学习目标检测：原理与应用，276页pdf

【干货书】深度学习目标检测：原理与应用，276页pdf

专知

23+阅读 · 2022年9月24日

【干货书】金融大数据的随机建模，305页pdf

【干货书】金融大数据的随机建模，305页pdf

专知

1+阅读 · 2022年9月15日

不可错过！华盛顿大学最新《可解释人工智能》课程，系统讲述XAI最新进展

不可错过！华盛顿大学最新《可解释人工智能》课程，系统讲述XAI最新进展

专知

5+阅读 · 2022年9月14日

【2022新书】机器学习中的概率数值计算，412页pdf

【2022新书】机器学习中的概率数值计算，412页pdf

专知

31+阅读 · 2022年7月7日

综述| 当图神经网络遇上强化学习

综述| 当图神经网络遇上强化学习

图与推荐

34+阅读 · 2022年7月1日

【2022新书】元学习(Meta Learning ): 自动机器学习与数据挖掘

【2022新书】元学习(Meta Learning ): 自动机器学习与数据挖掘

专知

20+阅读 · 2022年3月7日

【新书】机器学习算法，模型与应用，154页pdf

【新书】机器学习算法，模型与应用，154页pdf

专知

24+阅读 · 2022年1月20日

【NeurIPS 2020 Tutorial】离线强化学习:从算法到挑战，80页ppt

【NeurIPS 2020 Tutorial】离线强化学习:从算法到挑战，80页ppt

专知

16+阅读 · 2020年12月9日

相关基金

核心化算法中的新技术研究

国家自然科学基金

8+阅读 · 2017年12月31日

语义Web知识库补全关键技术研究

国家自然科学基金

14+阅读 · 2017年12月31日

基于深度学习的复杂退化模糊图像恢复

国家自然科学基金

5+阅读 · 2015年12月31日

面向大数据的安全迁移学习方法

国家自然科学基金

28+阅读 · 2015年12月31日

基于安全需求分析的内核保护方法研究

国家自然科学基金

2+阅读 · 2015年12月31日

基于低维连续表示的启发式智能规划技术研究

国家自然科学基金

4+阅读 · 2015年12月31日

数据驱动的人体图像语义分割研究

国家自然科学基金

4+阅读 · 2014年12月31日

海量Web用户生成内容物化关键技术

国家自然科学基金

2+阅读 · 2014年12月31日

非线性混合效应模型的最优与稳健设计

国家自然科学基金

0+阅读 · 2014年12月31日

强化学习关键技术及其在机器人行为学习中的应用

国家自然科学基金

21+阅读 · 2009年12月31日

相关论文

Implicit regularization of deep residual networks towards neural ODEs

Arxiv

0+阅读 · 2023年9月3日

SGD learning on neural networks: leap complexity and saddle-to-saddle dynamics

Arxiv

0+阅读 · 2023年8月31日

A Comprehensive Survey on Deep Graph Representation Learning

Arxiv

103+阅读 · 2023年4月11日

On Efficient Training of Large-Scale Deep Learning Models: A Literature Review

Arxiv

215+阅读 · 2023年4月7日

A Survey of Large Language Models

A Survey of Large Language Models

Arxiv

473+阅读 · 2023年3月31日

Deep learning: a statistical viewpoint

Arxiv

18+阅读 · 2021年3月16日

Meta-learning in natural and artificial intelligence

Arxiv

10+阅读 · 2020年11月26日

How to train your MAML

Arxiv

26+阅读 · 2019年3月5日

Interpretable machine learning: definitions, methods, and applications

Interpretable machine learning: definitions, methods, and applications

Arxiv

19+阅读 · 2019年1月14日

Deep learning in agriculture: A survey

Arxiv

11+阅读 · 2018年7月31日

微信扫码咨询专知VIP会员