【硬核书】深度强化学习实践手册：应用现代RL方法，包括深度Q网络、值迭代、策略梯度、TRPO、AlphaGo等，547页pdf - 专知VIP

会员服务 ·

57

深度强化学习 · 书籍 ·

2022 年 12 月 11 日

【硬核书】深度强化学习实践手册：应用现代RL方法，包括深度Q网络、值迭代、策略梯度、TRPO、AlphaGo等，547页pdf

专知会员服务

专知，提供专业可信的知识分发服务，让认知协作更快更好！

最近强化学习(RL)与深度学习(DL)相结合，在训练智能体以类似人类的方式解决复杂问题方面取得了前所未有的进展。谷歌使用算法来玩并击败著名的雅达利街机游戏，使该领域变得突出，研究人员正在以快速的速度产生新的想法。 Deep Reinforcement Learning hands是一本关于最新深度学习工具及其局限性的全面指南。在将交叉熵和策略梯度等方法应用于现实环境之前，您将对它们进行评估。比如雅达利(Atari)的虚拟游戏和家庭最喜欢的Connect4。本书介绍了RL的基础知识，为你提供了编写智能学习智能体的诀窍，以承担一系列艰巨的实际任务。了解如何在grid world环境中实现Q-learning，教您的智能体购买和交易股票，并了解自然语言模型如何推动聊天机器人的繁荣。 目录内容：

Chapter 2: OpenAI Gym * Chapter 3: Deep Learning with PyTorch * Chapter 4: Cross Entropy method * Chapter 5: Tabular learning and the Bellman equation * Chapter 6: Deep Q-Networks * Chapter 7: DQN extensions * Chapter 8: Stocks trading using RL * Chapter 9: Policy Gradients: an alternative * Chapter 10: Actor-Critic method * Chapter 11: Asynchronous Advantage Actor-Critic * Chapter 12: Chatbots traning with RL * Chapter 13: Web navigation * Chapter 14: Continuous action space * Chapter 15: Trust regions: TRPO, PPO and ACKTR * Chapter 16: Black-box optimisation in RL * Chapter 17: Beyond model-free: imagination * Chapter 18: AlphaGo Zero

成为VIP会员查看完整内容

79

相关内容

深度强化学习

深度强化学习

深度强化学习 (DRL) 是一种使用深度学习技术扩展传统强化学习方法的一种机器学习方法。传统强化学习方法的主要任务是使得主体根据从环境中获得的奖赏能够学习到最大化奖赏的行为。然而，传统无模型强化学习方法需要使用函数逼近技术使得主体能够学习出值函数或者策略。在这种情况下，深度学习强大的函数逼近能力自然成为了替代人工指定特征的最好手段并为性能更好的端到端学习的实现提供了可能。

【2023新书】Julia数据分析，474页pdf

【2023新书】Julia数据分析，474页pdf

专知会员服务

58+阅读 · 2023年2月5日

【干货书】Python强化学习算法:学习、理解和开发智能算法以应对人工智能挑战，356页pdf，附代码

【干货书】Python强化学习算法:学习、理解和开发智能算法以应对人工智能挑战，356页pdf，附代码

专知会员服务

58+阅读 · 2022年12月10日

【2022新书】深度强化学习基础: Python的理论与实践

【2022新书】深度强化学习基础: Python的理论与实践

专知会员服务

140+阅读 · 2022年11月18日

【2022新书】强化学习工业应用，408页pdf

【2022新书】强化学习工业应用，408页pdf

专知会员服务

231+阅读 · 2022年2月3日

【普林斯顿干货书】强化学习与随机优化，728页pdf阐述序列决策统一框架

【普林斯顿干货书】强化学习与随机优化，728页pdf阐述序列决策统一框架

专知会员服务

129+阅读 · 2021年4月25日

【2020新书】概率机器学习，附212页pdf与slides

【2020新书】概率机器学习，附212页pdf与slides

专知会员服务

111+阅读 · 2020年11月12日

深度强化学习策略梯度教程，53页ppt

深度强化学习策略梯度教程，53页ppt

专知会员服务

184+阅读 · 2020年2月1日

2019必读的十大深度强化学习论文

2019必读的十大深度强化学习论文

专知会员服务

59+阅读 · 2020年1月16日

强化学习最新教程，17页pdf

强化学习最新教程，17页pdf

专知会员服务

182+阅读 · 2019年10月11日

【综述】多智能体深度强化学习综述，附49页PDF

专知会员服务

213+阅读 · 2019年8月30日

【2022新书】深度强化学习基础: Python的理论与实践, 413页pdf

【2022新书】深度强化学习基础: Python的理论与实践, 413页pdf

专知

15+阅读 · 2022年11月18日

【2022新书】强化学习工业应用

【2022新书】强化学习工业应用

专知

18+阅读 · 2022年2月3日

【NeurIPS 2020 Tutorial】离线强化学习:从算法到挑战，80页ppt

【NeurIPS 2020 Tutorial】离线强化学习:从算法到挑战，80页ppt

专知

16+阅读 · 2020年12月9日

手把手教你入门深度强化学习（附链接&代码）

手把手教你入门深度强化学习（附链接&代码）

THU数据派

76+阅读 · 2019年7月16日

从入门到精通-Tensorflow深度强化学习课程

从入门到精通-Tensorflow深度强化学习课程

深度学习与NLP

23+阅读 · 2019年3月7日

OpenAI官方发布：强化学习中的关键论文

OpenAI官方发布：强化学习中的关键论文

专知

14+阅读 · 2018年12月12日

OpenAI丨深度强化学习关键论文列表

OpenAI丨深度强化学习关键论文列表

中国人工智能学会

17+阅读 · 2018年11月10日

【OpenAI】深度强化学习关键论文列表

【OpenAI】深度强化学习关键论文列表

专知

11+阅读 · 2018年11月10日

【下载】深度强化学习实战书籍和代码《Deep Reinforcement Learning in Action》

【下载】深度强化学习实战书籍和代码《Deep Reinforcement Learning in Action》

专知

77+阅读 · 2018年8月7日

强化学习族谱

强化学习族谱

CreateAMind

26+阅读 · 2017年8月2日

基于重要性采样的并行离策略强化学习方法研究

国家自然科学基金

23+阅读 · 2015年12月31日

无尾飞翼布局飞行器的操纵面故障强化学习最优自适应补偿控制研究

国家自然科学基金

1+阅读 · 2014年12月31日

基于Groebner基方法的布尔多项式方程组求解算法的研究与实现

国家自然科学基金

0+阅读 · 2013年12月31日

电磁场涡流问题中结构化线性方程组的预处理方法

国家自然科学基金

0+阅读 · 2013年12月31日

电磁场特征值问题的间断 Galerkin 算法研究

国家自然科学基金

0+阅读 · 2013年12月31日

凸可行问题的松弛投影算法及其应用研究

国家自然科学基金

0+阅读 · 2012年12月31日

求解随机半正定变分不等式问题的数值方法

国家自然科学基金

0+阅读 · 2011年12月31日

基于行为决策理论的决策分析方法及其应用研究

国家自然科学基金

4+阅读 · 2009年12月31日

基于多智能体强化学习的多机器人系统研究

国家自然科学基金

48+阅读 · 2009年12月31日

基于支持向量机的复杂连续系统强化学习控制研究

国家自然科学基金

11+阅读 · 2008年12月31日

Revisiting Estimation Bias in Policy Gradients for Deep Reinforcement Learning

Arxiv

0+阅读 · 2023年2月10日

Improving Zero-Shot Coordination Performance Based on Policy Similarity

Arxiv

0+阅读 · 2023年2月10日

Algorithmic Collective Action in Machine Learning

Arxiv

0+阅读 · 2023年2月8日

Revisiting the Linear-Programming Framework for Offline RL with General Function Approximation

Arxiv

0+阅读 · 2023年2月8日

Policy Learning with the polle package

Arxiv

0+阅读 · 2023年2月8日

Modified Policy Iteration for Exponential Cost Risk Sensitive MDPs

Arxiv

0+阅读 · 2023年2月8日

A Survey on Deep Reinforcement Learning for Data Processing and Analytics

Arxiv

24+阅读 · 2022年2月4日

Curriculum Learning: A Survey

Arxiv

24+阅读 · 2021年1月25日

Deep Reinforcement Learning: An Overview

Deep Reinforcement Learning: An Overview

Arxiv

17+阅读 · 2018年11月26日

Multiagent Soft Q-Learning

Arxiv

11+阅读 · 2018年4月25日

VIP会员

相关主题

深度强化学习

相关VIP内容

【2023新书】Julia数据分析，474页pdf

【2023新书】Julia数据分析，474页pdf

专知会员服务

58+阅读 · 2023年2月5日

【干货书】Python强化学习算法:学习、理解和开发智能算法以应对人工智能挑战，356页pdf，附代码

【干货书】Python强化学习算法:学习、理解和开发智能算法以应对人工智能挑战，356页pdf，附代码

专知会员服务

58+阅读 · 2022年12月10日

【2022新书】深度强化学习基础: Python的理论与实践

【2022新书】深度强化学习基础: Python的理论与实践

专知会员服务

140+阅读 · 2022年11月18日

【2022新书】强化学习工业应用，408页pdf

【2022新书】强化学习工业应用，408页pdf

专知会员服务

231+阅读 · 2022年2月3日

【普林斯顿干货书】强化学习与随机优化，728页pdf阐述序列决策统一框架

【普林斯顿干货书】强化学习与随机优化，728页pdf阐述序列决策统一框架

专知会员服务

129+阅读 · 2021年4月25日

【2020新书】概率机器学习，附212页pdf与slides

【2020新书】概率机器学习，附212页pdf与slides

专知会员服务

111+阅读 · 2020年11月12日

深度强化学习策略梯度教程，53页ppt

深度强化学习策略梯度教程，53页ppt

专知会员服务

184+阅读 · 2020年2月1日

2019必读的十大深度强化学习论文

2019必读的十大深度强化学习论文

专知会员服务

59+阅读 · 2020年1月16日

强化学习最新教程，17页pdf

强化学习最新教程，17页pdf

专知会员服务

182+阅读 · 2019年10月11日

【综述】多智能体深度强化学习综述，附49页PDF

专知会员服务

213+阅读 · 2019年8月30日

热门VIP内容

开通专知VIP会员享更多权益服务

《物联网（IoT）中的无人机通信高效控制》135页

《在GNSS信号降级环境中利用共识实现无人机集群稳健协调》

中程单向攻击无人机的战略意义：俄乌战争启示

《面向无人机集群的避障动态传感器覆盖算法》最新38页

相关资讯

【2022新书】深度强化学习基础: Python的理论与实践, 413页pdf

【2022新书】深度强化学习基础: Python的理论与实践, 413页pdf

专知

15+阅读 · 2022年11月18日

【2022新书】强化学习工业应用

【2022新书】强化学习工业应用

专知

18+阅读 · 2022年2月3日

【NeurIPS 2020 Tutorial】离线强化学习:从算法到挑战，80页ppt

【NeurIPS 2020 Tutorial】离线强化学习:从算法到挑战，80页ppt

专知

16+阅读 · 2020年12月9日

手把手教你入门深度强化学习（附链接&代码）

手把手教你入门深度强化学习（附链接&代码）

THU数据派

76+阅读 · 2019年7月16日

从入门到精通-Tensorflow深度强化学习课程

从入门到精通-Tensorflow深度强化学习课程

深度学习与NLP

23+阅读 · 2019年3月7日

OpenAI官方发布：强化学习中的关键论文

OpenAI官方发布：强化学习中的关键论文

专知

14+阅读 · 2018年12月12日

OpenAI丨深度强化学习关键论文列表

OpenAI丨深度强化学习关键论文列表

中国人工智能学会

17+阅读 · 2018年11月10日

【OpenAI】深度强化学习关键论文列表

【OpenAI】深度强化学习关键论文列表

专知

11+阅读 · 2018年11月10日

【下载】深度强化学习实战书籍和代码《Deep Reinforcement Learning in Action》

【下载】深度强化学习实战书籍和代码《Deep Reinforcement Learning in Action》

专知

77+阅读 · 2018年8月7日

强化学习族谱

强化学习族谱

CreateAMind

26+阅读 · 2017年8月2日

相关基金

基于重要性采样的并行离策略强化学习方法研究

国家自然科学基金

23+阅读 · 2015年12月31日

无尾飞翼布局飞行器的操纵面故障强化学习最优自适应补偿控制研究

国家自然科学基金

1+阅读 · 2014年12月31日

基于Groebner基方法的布尔多项式方程组求解算法的研究与实现

国家自然科学基金

0+阅读 · 2013年12月31日

电磁场涡流问题中结构化线性方程组的预处理方法

国家自然科学基金

0+阅读 · 2013年12月31日

电磁场特征值问题的间断 Galerkin 算法研究

国家自然科学基金

0+阅读 · 2013年12月31日

凸可行问题的松弛投影算法及其应用研究

国家自然科学基金

0+阅读 · 2012年12月31日

求解随机半正定变分不等式问题的数值方法

国家自然科学基金

0+阅读 · 2011年12月31日

基于行为决策理论的决策分析方法及其应用研究

国家自然科学基金

4+阅读 · 2009年12月31日

基于多智能体强化学习的多机器人系统研究

国家自然科学基金

48+阅读 · 2009年12月31日

基于支持向量机的复杂连续系统强化学习控制研究

国家自然科学基金

11+阅读 · 2008年12月31日

相关论文

Revisiting Estimation Bias in Policy Gradients for Deep Reinforcement Learning

Arxiv

0+阅读 · 2023年2月10日

Improving Zero-Shot Coordination Performance Based on Policy Similarity

Arxiv

0+阅读 · 2023年2月10日

Algorithmic Collective Action in Machine Learning

Arxiv

0+阅读 · 2023年2月8日

Revisiting the Linear-Programming Framework for Offline RL with General Function Approximation

Arxiv

0+阅读 · 2023年2月8日

Policy Learning with the polle package

Arxiv

0+阅读 · 2023年2月8日

Modified Policy Iteration for Exponential Cost Risk Sensitive MDPs

Arxiv

0+阅读 · 2023年2月8日

A Survey on Deep Reinforcement Learning for Data Processing and Analytics

Arxiv

24+阅读 · 2022年2月4日

Curriculum Learning: A Survey

Arxiv

24+阅读 · 2021年1月25日

Deep Reinforcement Learning: An Overview

Deep Reinforcement Learning: An Overview

Arxiv

17+阅读 · 2018年11月26日

Multiagent Soft Q-Learning

Arxiv

11+阅读 · 2018年4月25日

微信扫码咨询专知VIP会员