【2022新书】深度强化学习基础: Python的理论与实践 - 专知VIP

会员服务 ·

78

深度强化学习 · 书籍 ·

2022 年 11 月 18 日

【2022新书】深度强化学习基础: Python的理论与实践

专知会员服务

专知，提供专业可信的知识分发服务，让认知协作更快更好！

深度强化学习(Deep Reinforcement Learning, Deep RL)结合了深度学习和强化学习，人工智能体通过学习来解决顺序决策问题。在过去的十年中，深度RL在一系列问题上取得了显著的成果，从单人和多人游戏(如围棋、Atari游戏和DotA 2)到机器人。

《深度强化学习基础》是对深度学习的介绍，独特地结合了理论和实现。它从直觉开始，然后仔细地解释了深度RL算法的理论，讨论了其伴生软件库SLM Lab中的实现，最后介绍了使深度RL工作的实际细节。本指南对于熟悉基本机器学习概念并对Python有实际理解的计算机科学学生和软件工程师都是理想的。

理解深度RL问题的每个关键方面 * 探索基于策略和价值的算法，包括REINFORCE、SARSA、DQN、Double DQN和优先体验重放(PER) * 深入研究组合算法，包括actor - critical和近端策略优化(PPO) * 理解如何同步和异步并行算法 * 在SLM Lab中运行算法，学习深入RL工作的实际实现细节 * 探索调优超参数的算法基准测试结果 * 理解深度RL环境是如何设计的

成为VIP会员查看完整内容

相关内容

深度强化学习

深度强化学习

深度强化学习 (DRL) 是一种使用深度学习技术扩展传统强化学习方法的一种机器学习方法。传统强化学习方法的主要任务是使得主体根据从环境中获得的奖赏能够学习到最大化奖赏的行为。然而，传统无模型强化学习方法需要使用函数逼近技术使得主体能够学习出值函数或者策略。在这种情况下，深度学习强大的函数逼近能力自然成为了替代人工指定特征的最好手段并为性能更好的端到端学习的实现提供了可能。

【简明书】强化学习的基础，111页pdf

【简明书】强化学习的基础，111页pdf

专知会员服务

95+阅读 · 2022年11月16日

【2022新书】自动驾驶理论与实践，346页pdf

【2022新书】自动驾驶理论与实践，346页pdf

专知会员服务

155+阅读 · 2022年8月9日

【干货书】深度强化学习Python实战:算法的简洁实现，简化数学，以及TensorFlow和PyTorch的使用，447页pdf

【干货书】深度强化学习Python实战:算法的简洁实现，简化数学，以及TensorFlow和PyTorch的使用，447页pdf

专知会员服务

85+阅读 · 2022年8月2日

【实用书】强化学习实战：Python，110页pdf

【实用书】强化学习实战：Python，110页pdf

专知会员服务

148+阅读 · 2022年6月9日

【2022新书】强化学习工业应用，408页pdf

【2022新书】强化学习工业应用，408页pdf

专知会员服务

231+阅读 · 2022年2月3日

【2021新书】基于Python的实用深度学习概述，464页pdf

【2021新书】基于Python的实用深度学习概述，464页pdf

专知会员服务

87+阅读 · 2021年10月25日

【斯坦福干货书】强化学习基金融领域应用，312页pdf

【斯坦福干货书】强化学习基金融领域应用，312页pdf

专知会员服务

134+阅读 · 2020年12月22日

【圣经书】《强化学习导论(2nd)》电子书与代码，548页pdf

【圣经书】《强化学习导论(2nd)》电子书与代码，548页pdf

专知会员服务

208+阅读 · 2020年5月22日

【Manning2020新书】深度强化学习实战，351页pdf，Deep Reinforcement Learning

【Manning2020新书】深度强化学习实战，351页pdf，Deep Reinforcement Learning

专知会员服务

289+阅读 · 2020年3月10日

【新书】Python强化学习-基于Tensorflow与Keras和OpenAI Gym实战, 177页pdf

【新书】Python强化学习-基于Tensorflow与Keras和OpenAI Gym实战, 177页pdf

专知会员服务

184+阅读 · 2020年1月17日

【2022新书】深度强化学习基础: Python的理论与实践, 413页pdf

【2022新书】深度强化学习基础: Python的理论与实践, 413页pdf

专知

15+阅读 · 2022年11月18日

【2022新书】自动驾驶理论与实践，346页pdf

【2022新书】自动驾驶理论与实践，346页pdf

专知

3+阅读 · 2022年8月9日

【干货书】深度强化学习Python实战:算法的简洁实现，简化数学，以及TensorFlow和PyTorch的使用，447页pdf

【干货书】深度强化学习Python实战:算法的简洁实现，简化数学，以及TensorFlow和PyTorch的使用，447页pdf

专知

7+阅读 · 2022年8月2日

【2022新书】强化学习工业应用

【2022新书】强化学习工业应用

专知

18+阅读 · 2022年2月3日

要上手RL？406页《深度强化学习》2022新书，Leiden大学Aske Plaat教授主讲

要上手RL？406页《深度强化学习》2022新书，Leiden大学Aske Plaat教授主讲

专知

3+阅读 · 2022年1月11日

【2020新书】《金融机器学习：从理论到实践》，附565页pdf与随书代码

【2020新书】《金融机器学习：从理论到实践》，附565页pdf与随书代码

专知

39+阅读 · 2020年12月15日

【新书】Python机器学习实战，545页pdf，Practical Machine Learning with Python

【新书】Python机器学习实战，545页pdf，Practical Machine Learning with Python

专知

22+阅读 · 2020年2月26日

深度强化学习入门，这一篇就够了！

深度强化学习入门，这一篇就够了！

机器学习算法与Python学习

28+阅读 · 2018年8月17日

【下载】深度强化学习实战书籍和代码《Deep Reinforcement Learning in Action》

【下载】深度强化学习实战书籍和代码《Deep Reinforcement Learning in Action》

专知

77+阅读 · 2018年8月7日

【深度强化学习】深度强化学习揭秘

【深度强化学习】深度强化学习揭秘

产业智能官

21+阅读 · 2017年11月13日

基于重要性采样的并行离策略强化学习方法研究

国家自然科学基金

23+阅读 · 2015年12月31日

面向高维多示例数据的潜在语义分类模型及其实现

国家自然科学基金

1+阅读 · 2013年12月31日

基于多视角学习的情感分析理论与方法研究

国家自然科学基金

2+阅读 · 2013年12月31日

部分监督学习问题的支持向量机及其应用

国家自然科学基金

3+阅读 · 2012年12月31日

量子算法及其在量子信息处理中的应用研究

国家自然科学基金

0+阅读 · 2011年12月31日

基于模糊定性强化学习的复杂不确定系统的模糊协调控制机理研究

国家自然科学基金

3+阅读 · 2009年12月31日

基于进化多目标优化的无监督机器学习研究

国家自然科学基金

2+阅读 · 2009年12月31日

基于损失函数的统计机器学习算法及其应用研究

国家自然科学基金

7+阅读 · 2009年12月31日

基于多智能体强化学习的多机器人系统研究

国家自然科学基金

48+阅读 · 2009年12月31日

基于支持向量机的复杂连续系统强化学习控制研究

国家自然科学基金

11+阅读 · 2008年12月31日

DQNAS: Neural Architecture Search using Reinforcement Learning

Arxiv

0+阅读 · 2023年1月17日

Statistical Inference and A/B Testing for First-Price Pacing Equilibria

Arxiv

0+阅读 · 2023年1月16日

The Role of Baselines in Policy Gradient Optimization

Arxiv

0+阅读 · 2023年1月16日

Universal Difference-in-Differences

Arxiv

0+阅读 · 2023年1月13日

A Survey on Transformers in Reinforcement Learning

Arxiv

31+阅读 · 2023年1月8日

Transformers are Meta-Reinforcement Learners

Arxiv

15+阅读 · 2022年6月14日

Lifelong Learning Metrics

Lifelong Learning Metrics

Arxiv

48+阅读 · 2022年1月20日

Deep Reinforcement Learning: An Overview

Deep Reinforcement Learning: An Overview

Arxiv

17+阅读 · 2018年11月26日

Notes on Deep Learning for NLP

Arxiv

22+阅读 · 2018年8月30日

Demystifying MMD GANs

Arxiv

12+阅读 · 2018年1月12日

VIP会员

相关主题

深度强化学习

相关VIP内容

【简明书】强化学习的基础，111页pdf

【简明书】强化学习的基础，111页pdf

专知会员服务

95+阅读 · 2022年11月16日

【2022新书】自动驾驶理论与实践，346页pdf

【2022新书】自动驾驶理论与实践，346页pdf

专知会员服务

155+阅读 · 2022年8月9日

【干货书】深度强化学习Python实战:算法的简洁实现，简化数学，以及TensorFlow和PyTorch的使用，447页pdf

【干货书】深度强化学习Python实战:算法的简洁实现，简化数学，以及TensorFlow和PyTorch的使用，447页pdf

专知会员服务

85+阅读 · 2022年8月2日

【实用书】强化学习实战：Python，110页pdf

【实用书】强化学习实战：Python，110页pdf

专知会员服务

148+阅读 · 2022年6月9日

【2022新书】强化学习工业应用，408页pdf

【2022新书】强化学习工业应用，408页pdf

专知会员服务

231+阅读 · 2022年2月3日

【2021新书】基于Python的实用深度学习概述，464页pdf

【2021新书】基于Python的实用深度学习概述，464页pdf

专知会员服务

87+阅读 · 2021年10月25日

【斯坦福干货书】强化学习基金融领域应用，312页pdf

【斯坦福干货书】强化学习基金融领域应用，312页pdf

专知会员服务

134+阅读 · 2020年12月22日

【圣经书】《强化学习导论(2nd)》电子书与代码，548页pdf

【圣经书】《强化学习导论(2nd)》电子书与代码，548页pdf

专知会员服务

208+阅读 · 2020年5月22日

【Manning2020新书】深度强化学习实战，351页pdf，Deep Reinforcement Learning

【Manning2020新书】深度强化学习实战，351页pdf，Deep Reinforcement Learning

专知会员服务

289+阅读 · 2020年3月10日

【新书】Python强化学习-基于Tensorflow与Keras和OpenAI Gym实战, 177页pdf

【新书】Python强化学习-基于Tensorflow与Keras和OpenAI Gym实战, 177页pdf

专知会员服务

184+阅读 · 2020年1月17日

热门VIP内容

开通专知VIP会员享更多权益服务

【CMU博士论文】数据驱动决策中的激励、信息与不确定性

DGP双粒度提示框架：图增强大模型助力欺诈检测

【ICCV2025】ESSENTIAL：用于视频类增量学习的情景记忆与语义记忆整合

唯快不破：大型语言模型高效架构综述

相关资讯

【2022新书】深度强化学习基础: Python的理论与实践, 413页pdf

【2022新书】深度强化学习基础: Python的理论与实践, 413页pdf

专知

15+阅读 · 2022年11月18日

【2022新书】自动驾驶理论与实践，346页pdf

【2022新书】自动驾驶理论与实践，346页pdf

专知

3+阅读 · 2022年8月9日

【干货书】深度强化学习Python实战:算法的简洁实现，简化数学，以及TensorFlow和PyTorch的使用，447页pdf

【干货书】深度强化学习Python实战:算法的简洁实现，简化数学，以及TensorFlow和PyTorch的使用，447页pdf

专知

7+阅读 · 2022年8月2日

【2022新书】强化学习工业应用

【2022新书】强化学习工业应用

专知

18+阅读 · 2022年2月3日

要上手RL？406页《深度强化学习》2022新书，Leiden大学Aske Plaat教授主讲

要上手RL？406页《深度强化学习》2022新书，Leiden大学Aske Plaat教授主讲

专知

3+阅读 · 2022年1月11日

【2020新书】《金融机器学习：从理论到实践》，附565页pdf与随书代码

【2020新书】《金融机器学习：从理论到实践》，附565页pdf与随书代码

专知

39+阅读 · 2020年12月15日

【新书】Python机器学习实战，545页pdf，Practical Machine Learning with Python

【新书】Python机器学习实战，545页pdf，Practical Machine Learning with Python

专知

22+阅读 · 2020年2月26日

深度强化学习入门，这一篇就够了！

深度强化学习入门，这一篇就够了！

机器学习算法与Python学习

28+阅读 · 2018年8月17日

【下载】深度强化学习实战书籍和代码《Deep Reinforcement Learning in Action》

【下载】深度强化学习实战书籍和代码《Deep Reinforcement Learning in Action》

专知

77+阅读 · 2018年8月7日

【深度强化学习】深度强化学习揭秘

【深度强化学习】深度强化学习揭秘

产业智能官

21+阅读 · 2017年11月13日

相关基金

基于重要性采样的并行离策略强化学习方法研究

国家自然科学基金

23+阅读 · 2015年12月31日

面向高维多示例数据的潜在语义分类模型及其实现

国家自然科学基金

1+阅读 · 2013年12月31日

基于多视角学习的情感分析理论与方法研究

国家自然科学基金

2+阅读 · 2013年12月31日

部分监督学习问题的支持向量机及其应用

国家自然科学基金

3+阅读 · 2012年12月31日

量子算法及其在量子信息处理中的应用研究

国家自然科学基金

0+阅读 · 2011年12月31日

基于模糊定性强化学习的复杂不确定系统的模糊协调控制机理研究

国家自然科学基金

3+阅读 · 2009年12月31日

基于进化多目标优化的无监督机器学习研究

国家自然科学基金

2+阅读 · 2009年12月31日

基于损失函数的统计机器学习算法及其应用研究

国家自然科学基金

7+阅读 · 2009年12月31日

基于多智能体强化学习的多机器人系统研究

国家自然科学基金

48+阅读 · 2009年12月31日

基于支持向量机的复杂连续系统强化学习控制研究

国家自然科学基金

11+阅读 · 2008年12月31日

相关论文

DQNAS: Neural Architecture Search using Reinforcement Learning

Arxiv

0+阅读 · 2023年1月17日

Statistical Inference and A/B Testing for First-Price Pacing Equilibria

Arxiv

0+阅读 · 2023年1月16日

The Role of Baselines in Policy Gradient Optimization

Arxiv

0+阅读 · 2023年1月16日

Universal Difference-in-Differences

Arxiv

0+阅读 · 2023年1月13日

A Survey on Transformers in Reinforcement Learning

Arxiv

31+阅读 · 2023年1月8日

Transformers are Meta-Reinforcement Learners

Arxiv

15+阅读 · 2022年6月14日

Lifelong Learning Metrics

Lifelong Learning Metrics

Arxiv

48+阅读 · 2022年1月20日

Deep Reinforcement Learning: An Overview

Deep Reinforcement Learning: An Overview

Arxiv

17+阅读 · 2018年11月26日

Notes on Deep Learning for NLP

Arxiv

22+阅读 · 2018年8月30日

Demystifying MMD GANs

Arxiv

12+阅读 · 2018年1月12日

微信扫码咨询专知VIP会员