【2022新书】深度强化学习基础: Python的理论与实践, 413页pdf - 专知

会员服务 ·

0

【2022新书】深度强化学习基础: Python的理论与实践, 413页pdf

2022 年 11 月 18 日 专知

深度强化学习(Deep Reinforcement Learning, Deep RL)结合了深度学习和强化学习，人工智能体通过学习来解决顺序决策问题。在过去的十年中，深度RL在一系列问题上取得了显著的成果，从单人和多人游戏(如围棋、Atari游戏和DotA 2)到机器人。

《深度强化学习基础》是对深度学习的介绍，独特地结合了理论和实现。它从直觉开始，然后仔细地解释了深度RL算法的理论，讨论了其伴生软件库SLM Lab中的实现，最后介绍了使深度RL工作的实际细节。

本指南对于熟悉基本机器学习概念并对Python有实际理解的计算机科学学生和软件工程师都是理想的。

理解深度RL问题的每个关键方面
探索基于策略和价值的算法，包括REINFORCE、SARSA、DQN、Double DQN和优先体验重放(PER)
深入研究组合算法，包括actor - critical和近端策略优化(PPO)
理解如何同步和异步并行算法
在SLM Lab中运行算法，学习深入RL工作的实际实现细节
探索调优超参数的算法基准测试结果
理解深度RL环境是如何设计的

专知便捷查看

便捷下载，请关注专知公众号（点击上方蓝色专知关注）

后台回复“R413” 就可以获取《【2022新书】深度强化学习基础: Python的理论与实践, 413页pdf》专知下载链接

专知，专业可信的人工智能知识分发 ，让认知协作更快更好！欢迎注册登录专知www.zhuanzhi.ai，获取100000+AI(AI与军事、医药、公安等)主题干货知识资料！

欢迎微信扫一扫加入专知人工智能知识星球群，获取最新AI专业干货知识教程资料和与专家交流咨询！

点击“ 阅读原文 ”，了解使用专知 ，查看获取100000+AI主题知识资料

登录查看更多

15

相关内容

深度强化学习

深度强化学习

深度强化学习 (DRL) 是一种使用深度学习技术扩展传统强化学习方法的一种机器学习方法。传统强化学习方法的主要任务是使得主体根据从环境中获得的奖赏能够学习到最大化奖赏的行为。然而，传统无模型强化学习方法需要使用函数逼近技术使得主体能够学习出值函数或者策略。在这种情况下，深度学习强大的函数逼近能力自然成为了替代人工指定特征的最好手段并为性能更好的端到端学习的实现提供了可能。

【2022新书】深度强化学习基础: Python的理论与实践

【2022新书】深度强化学习基础: Python的理论与实践

专知会员服务

140+阅读 · 2022年11月18日

【简明书】强化学习的基础，111页pdf

【简明书】强化学习的基础，111页pdf

专知会员服务

95+阅读 · 2022年11月16日

【2022新书】强化学习基础及其在金融中的应用，522页pdf

【2022新书】强化学习基础及其在金融中的应用，522页pdf

专知会员服务

125+阅读 · 2022年11月5日

【干货书】强化学习Python真实数据与实例应用，110页pdf

【干货书】强化学习Python真实数据与实例应用，110页pdf

专知会员服务

114+阅读 · 2022年10月13日

【干货书】深度强化学习Python实战:算法的简洁实现，简化数学，以及TensorFlow和PyTorch的使用，447页pdf

【干货书】深度强化学习Python实战:算法的简洁实现，简化数学，以及TensorFlow和PyTorch的使用，447页pdf

专知会员服务

85+阅读 · 2022年8月2日

【实用书】强化学习实战：Python，110页pdf

【实用书】强化学习实战：Python，110页pdf

专知会员服务

148+阅读 · 2022年6月9日

【2022新书】强化学习工业应用，408页pdf

【2022新书】强化学习工业应用，408页pdf

专知会员服务

231+阅读 · 2022年2月3日

【2020新书】《金融机器学习：从理论到实践》，附565页pdf与随书代码

专知会员服务

239+阅读 · 2020年12月15日

【Manning2020新书】深度强化学习实战，351页pdf，Deep Reinforcement Learning

【Manning2020新书】深度强化学习实战，351页pdf，Deep Reinforcement Learning

专知会员服务

289+阅读 · 2020年3月10日

为机器学习应用实践Scikit-Learn，数据科学基础与Python，247页pdf

为机器学习应用实践Scikit-Learn，数据科学基础与Python，247页pdf

专知会员服务

143+阅读 · 2019年12月1日

【简明书】强化学习的基础，111页pdf

【简明书】强化学习的基础，111页pdf

专知

1+阅读 · 2022年11月16日

【2022新书】强化学习基础及其在金融中的应用，522页pdf

【2022新书】强化学习基础及其在金融中的应用，522页pdf

专知

10+阅读 · 2022年11月6日

【2022新书】应用Python进行时间序列分析与预测，377页pdf

【2022新书】应用Python进行时间序列分析与预测，377页pdf

专知

24+阅读 · 2022年11月3日

【2022新书】数据科学的实用线性代数，328页pdf

【2022新书】数据科学的实用线性代数，328页pdf

专知

21+阅读 · 2022年9月18日

【干货书】深度强化学习Python实战:算法的简洁实现，简化数学，以及TensorFlow和PyTorch的使用，447页pdf

【干货书】深度强化学习Python实战:算法的简洁实现，简化数学，以及TensorFlow和PyTorch的使用，447页pdf

专知

7+阅读 · 2022年8月2日

【2022新书】Python DevOps，245页pdf

【2022新书】Python DevOps，245页pdf

专知

6+阅读 · 2022年7月11日

【实用书】强化学习实战：Python，110页pdf

【实用书】强化学习实战：Python，110页pdf

专知

9+阅读 · 2022年6月9日

【2022新书】强化学习工业应用

【2022新书】强化学习工业应用

专知

18+阅读 · 2022年2月3日

【2020新书】《金融机器学习：从理论到实践》，附565页pdf与随书代码

【2020新书】《金融机器学习：从理论到实践》，附565页pdf与随书代码

专知

39+阅读 · 2020年12月15日

【Manning2020新书】深度强化学习实战，351页pdf，Deep Reinforcement Learning

【Manning2020新书】深度强化学习实战，351页pdf，Deep Reinforcement Learning

专知

42+阅读 · 2020年3月10日

有限理性下的最优停止理论及应用

国家自然科学基金

1+阅读 · 2015年12月31日

学习与记忆的神经动力学研究

国家自然科学基金

1+阅读 · 2014年12月31日

凸可分半定规划的数值算法

国家自然科学基金

0+阅读 · 2013年12月31日

基于图的半监督学习关键问题研究及其在图像理解中的应用

国家自然科学基金

4+阅读 · 2012年12月31日

基于TLT的多开关脉冲电源技术原理和应用基础研究

国家自然科学基金

0+阅读 · 2012年12月31日

量子点敏化半导体多孔微球的构筑及其在太阳电池光阳极中的应用研究

国家自然科学基金

0+阅读 · 2012年12月31日

基于事件的强化学习及其在群机器人优化控制中的应用

国家自然科学基金

3+阅读 · 2012年12月31日

基于贝叶斯推理的视觉注意计算模型及应用研究

国家自然科学基金

0+阅读 · 2011年12月31日

输电网中长期状态的精细化模拟与概率评估的基础理论研究

国家自然科学基金

0+阅读 · 2011年12月31日

模糊推理的机制及其逻辑基础

国家自然科学基金

1+阅读 · 2008年12月31日

Distinct Elements in Streams: An Algorithm for the (Text) Book

Arxiv

0+阅读 · 2023年1月24日

Minimal Value-Equivalent Partial Models for Scalable and Robust Planning in Lifelong Reinforcement Learning

Arxiv

0+阅读 · 2023年1月24日

Efficient Planning in a Compact Latent Action Space

Arxiv

0+阅读 · 2023年1月24日

AI-Based Framework for Understanding Car Following Behaviors of Drivers in A Naturalistic Driving Environment

Arxiv

0+阅读 · 2023年1月23日

On Retrospective $k$-space Subsampling schemes For Deep MRI Reconstruction

Arxiv

0+阅读 · 2023年1月20日

From Robots to Books: An Introduction to Smart Applications of AI in Education (AIEd)

Arxiv

0+阅读 · 2023年1月11日

Emergent Bartering Behaviour in Multi-Agent Reinforcement Learning

Emergent Bartering Behaviour in Multi-Agent Reinforcement Learning

Arxiv

19+阅读 · 2022年5月13日

A Survey on Reinforcement Learning for Recommender Systems

Arxiv

22+阅读 · 2021年9月22日

The Principles of Deep Learning Theory

Arxiv

65+阅读 · 2021年6月18日

Deep Reinforcement Learning: An Overview

Deep Reinforcement Learning: An Overview

Arxiv

17+阅读 · 2018年11月26日

VIP会员

相关主题

深度强化学习

相关VIP内容

【2022新书】深度强化学习基础: Python的理论与实践

【2022新书】深度强化学习基础: Python的理论与实践

专知会员服务

140+阅读 · 2022年11月18日

【简明书】强化学习的基础，111页pdf

【简明书】强化学习的基础，111页pdf

专知会员服务

95+阅读 · 2022年11月16日

【2022新书】强化学习基础及其在金融中的应用，522页pdf

【2022新书】强化学习基础及其在金融中的应用，522页pdf

专知会员服务

125+阅读 · 2022年11月5日

【干货书】强化学习Python真实数据与实例应用，110页pdf

【干货书】强化学习Python真实数据与实例应用，110页pdf

专知会员服务

114+阅读 · 2022年10月13日

【干货书】深度强化学习Python实战:算法的简洁实现，简化数学，以及TensorFlow和PyTorch的使用，447页pdf

【干货书】深度强化学习Python实战:算法的简洁实现，简化数学，以及TensorFlow和PyTorch的使用，447页pdf

专知会员服务

85+阅读 · 2022年8月2日

【实用书】强化学习实战：Python，110页pdf

【实用书】强化学习实战：Python，110页pdf

专知会员服务

148+阅读 · 2022年6月9日

【2022新书】强化学习工业应用，408页pdf

【2022新书】强化学习工业应用，408页pdf

专知会员服务

231+阅读 · 2022年2月3日

【2020新书】《金融机器学习：从理论到实践》，附565页pdf与随书代码

专知会员服务

239+阅读 · 2020年12月15日

【Manning2020新书】深度强化学习实战，351页pdf，Deep Reinforcement Learning

【Manning2020新书】深度强化学习实战，351页pdf，Deep Reinforcement Learning

专知会员服务

289+阅读 · 2020年3月10日

为机器学习应用实践Scikit-Learn，数据科学基础与Python，247页pdf

为机器学习应用实践Scikit-Learn，数据科学基础与Python，247页pdf

专知会员服务

143+阅读 · 2019年12月1日

热门VIP内容

开通专知VIP会员享更多权益服务

《美陆军徒步机动作战条令手册》最新168页

【博士论文】基于不确定性的可靠性：现代机器学习中的选择性预测与可信部署

军事后勤数字化未来展望

《美海军后勤体系整合与创新挑战》最新报告

相关资讯

【简明书】强化学习的基础，111页pdf

【简明书】强化学习的基础，111页pdf

专知

1+阅读 · 2022年11月16日

【2022新书】强化学习基础及其在金融中的应用，522页pdf

【2022新书】强化学习基础及其在金融中的应用，522页pdf

专知

10+阅读 · 2022年11月6日

【2022新书】应用Python进行时间序列分析与预测，377页pdf

【2022新书】应用Python进行时间序列分析与预测，377页pdf

专知

24+阅读 · 2022年11月3日

【2022新书】数据科学的实用线性代数，328页pdf

【2022新书】数据科学的实用线性代数，328页pdf

专知

21+阅读 · 2022年9月18日

【干货书】深度强化学习Python实战:算法的简洁实现，简化数学，以及TensorFlow和PyTorch的使用，447页pdf

【干货书】深度强化学习Python实战:算法的简洁实现，简化数学，以及TensorFlow和PyTorch的使用，447页pdf

专知

7+阅读 · 2022年8月2日

【2022新书】Python DevOps，245页pdf

【2022新书】Python DevOps，245页pdf

专知

6+阅读 · 2022年7月11日

【实用书】强化学习实战：Python，110页pdf

【实用书】强化学习实战：Python，110页pdf

专知

9+阅读 · 2022年6月9日

【2022新书】强化学习工业应用

【2022新书】强化学习工业应用

专知

18+阅读 · 2022年2月3日

【2020新书】《金融机器学习：从理论到实践》，附565页pdf与随书代码

【2020新书】《金融机器学习：从理论到实践》，附565页pdf与随书代码

专知

39+阅读 · 2020年12月15日

【Manning2020新书】深度强化学习实战，351页pdf，Deep Reinforcement Learning

【Manning2020新书】深度强化学习实战，351页pdf，Deep Reinforcement Learning

专知

42+阅读 · 2020年3月10日

相关基金

有限理性下的最优停止理论及应用

国家自然科学基金

1+阅读 · 2015年12月31日

学习与记忆的神经动力学研究

国家自然科学基金

1+阅读 · 2014年12月31日

凸可分半定规划的数值算法

国家自然科学基金

0+阅读 · 2013年12月31日

基于图的半监督学习关键问题研究及其在图像理解中的应用

国家自然科学基金

4+阅读 · 2012年12月31日

基于TLT的多开关脉冲电源技术原理和应用基础研究

国家自然科学基金

0+阅读 · 2012年12月31日

量子点敏化半导体多孔微球的构筑及其在太阳电池光阳极中的应用研究

国家自然科学基金

0+阅读 · 2012年12月31日

基于事件的强化学习及其在群机器人优化控制中的应用

国家自然科学基金

3+阅读 · 2012年12月31日

基于贝叶斯推理的视觉注意计算模型及应用研究

国家自然科学基金

0+阅读 · 2011年12月31日

输电网中长期状态的精细化模拟与概率评估的基础理论研究

国家自然科学基金

0+阅读 · 2011年12月31日

模糊推理的机制及其逻辑基础

国家自然科学基金

1+阅读 · 2008年12月31日

相关论文

Distinct Elements in Streams: An Algorithm for the (Text) Book

Arxiv

0+阅读 · 2023年1月24日

Minimal Value-Equivalent Partial Models for Scalable and Robust Planning in Lifelong Reinforcement Learning

Arxiv

0+阅读 · 2023年1月24日

Efficient Planning in a Compact Latent Action Space

Arxiv

0+阅读 · 2023年1月24日

AI-Based Framework for Understanding Car Following Behaviors of Drivers in A Naturalistic Driving Environment

Arxiv

0+阅读 · 2023年1月23日

On Retrospective $k$-space Subsampling schemes For Deep MRI Reconstruction

Arxiv

0+阅读 · 2023年1月20日

From Robots to Books: An Introduction to Smart Applications of AI in Education (AIEd)

Arxiv

0+阅读 · 2023年1月11日

Emergent Bartering Behaviour in Multi-Agent Reinforcement Learning

Emergent Bartering Behaviour in Multi-Agent Reinforcement Learning

Arxiv

19+阅读 · 2022年5月13日

A Survey on Reinforcement Learning for Recommender Systems

Arxiv

22+阅读 · 2021年9月22日

The Principles of Deep Learning Theory

Arxiv

65+阅读 · 2021年6月18日

Deep Reinforcement Learning: An Overview

Deep Reinforcement Learning: An Overview

Arxiv

17+阅读 · 2018年11月26日

大家都在搜

国防科技创新

无人机集群

软件无线电

久别重逢话双塔

无人机航拍交通事故现场勘查处置系统——行业第一的警用事故处理软件

微信扫码咨询专知VIP会员