【下载】深度强化学习实战书籍和代码《Deep Reinforcement Learning in Action》

2018 年 8 月 7 日 专知
【下载】深度强化学习实战书籍和代码《Deep Reinforcement Learning in Action》

【导读】亚马逊人工智能部门机器学习专家AlexanderZai最新撰写的深度强化学习实战书籍(预计2018年秋季出版)《Deep Reinforcement Learning in Action》介绍使用流行的PyTorch深度学习框架来构建网络,以探索从深度Q网络到策略梯度方法,再到进化算法的一系列强化学习算法。手把手教你构建深度强化学习项目,比如控制模拟机器人,自动化股票市场交易,甚至建造一个可以玩围棋的机器人。随书同时提供代码,可以让你动手测试改进。


请关注专知公众号(扫一扫最下面专知二维码,或者点击上方蓝色专知),

  • 后台回复“DRLA” 就可以获取深度强化学习实战 第一章 pdf下载~

  • 后台回复“DRLA” 就可以获取深度强化学习实战 代下载~



图书介绍




人类从反馈中不断学习得最优——对于积极的结果我们会被鼓励去采取行动,但是对于消极结果我们被阻止采取行动。这种强化过程可以应用于计算机程序,使它们能够解决经典编程无法解决的更复杂的问题。《Deep Reinforcement Learning in Action》这本书会向您介绍深度强化学习的基本概念和术语,以及将其实施到您自己的项目中所需的实用技能和技巧。


关于该技术

深度强化学习是机器学习的一种形式,其中人工智能体从自身的原始感官输入中学习最优行为。系统感知环境,解释其过去决策的结果,并利用这些信息来优化其行为,以获得最大的长期回报。深度强化学习这一技术为AlphaGo的成功做出了杰出贡献,但它所能做的并不仅仅局限于这些!更多令人兴奋的应用程序等待被发现。让我们开始吧。


关于该书

《Deep Reinforcement Learning in Action》将会教你如何根据环境的直接反馈对智能体进行编程和学习。您将使用流行的PyTorch深度学习框架来构建网络,以探索从深度Q网络到策略梯度方法,再到进化算法的一系列强化学习算法。当您完成学习的时候,您就可以把你所学的知识应用到实际的项目中,比如控制模拟机器人,自动化股票市场交易,甚至构建一个可以玩围棋的机器人。


书中介绍了什么

  • 将问题结构化为马尔可夫决策过程

  • 常用的算法,如深度Q网络,策略梯度方法

  • 进化算法和驱动它们的直觉知识

  • 将强化学习算法应用于实际问题


关于读者

读者将需要具备中级Python的技能和对深度学习有基本的理解。


关于作者

亚历山大•扎伊(Alexander Zai)是亚马逊人工智能公司(Amazon AI)的一名机器学习工程师,致力于MXNet,为一系列AWS机器学习产品提供支持。他还是Codesmith的联合创始人,Codesmith是一家软件工程训练营,在洛杉矶和纽约设有分部。布兰登•布朗(Brandon Brown)是一名UCSF医学院学生,同时也是加州大学洛杉矶分校的数据科学家。过去三年来,他在outlace.com上发表了大量有关机器学习的博文。


参考:

https://www.manning.com/books/deep-reinforcement-learning-in-action

https://github.com/DeepReinforcementLearning/DeepReinforcementLearningInAction


▌详细目录




▌第一部分 基础


▌第二部分 延伸




▌附录




▌第一章详细内容





-END-

专 · 知


人工智能领域主题知识资料查看与加入专知人工智能服务群

专知AI知识技术服务会员群加入人工智能领域26个主题知识资料全集获取欢迎微信扫一扫加入专知人工智能知识星球群,获取专业知识教程视频资料和与专家交流咨询


请PC登录www.zhuanzhi.ai或者点击阅读原文,注册登录专知,获取更多AI知识资料

请加专知小助手微信(扫一扫如下二维码添加),加入专知主题群(请备注主题类型:AI、NLP、CV、 KG等)交流~


 AI 项目技术 & 商务合作:bd@zhuanzhi.ai, 或扫描上面二维码联系!


关注专知公众号,获取人工智能的专业知识!

点击“阅读原文”,使用专知

登录查看更多
52

相关内容

深度强化学习 (DRL) 是一种使用深度学习技术扩展传统强化学习方法的一种机器学习方法。 传统强化学习方法的主要任务是使得主体根据从环境中获得的奖赏能够学习到最大化奖赏的行为。然而,传统无模型强化学习方法需要使用函数逼近技术使得主体能够学习出值函数或者策略。在这种情况下,深度学习强大的函数逼近能力自然成为了替代人工指定特征的最好手段并为性能更好的端到端学习的实现提供了可能。

人类从反馈中学习得最好——我们被鼓励采取导致积极结果的行动,而被具有消极后果的决定所阻碍。这种强化过程可以应用到计算机程序中,使它们能够解决经典编程所不能解决的更复杂的问题。深度强化学习实战教你基本概念和术语的深度强化学习,以及实践技能和技术,你将需要把它落实到你自己的项目。

对这项技术

深度强化学习是一种机器学习的形式,人工智能智能体从自己的原始感官输入中学习最优行为。系统感知环境,解释其过去决策的结果,并使用这些信息优化其行为以获得最大的长期回报。众所周知,深度强化学习对AlphaGo的成功做出了贡献,但这并不是它所能做的全部!更令人兴奋的应用程序等待被发现。让我们开始吧。

关于这本书

深度强化学习实战中教你如何编程的代理人,学习和改善的直接反馈,从他们的环境。您将使用流行的PyTorch深度学习框架构建网络,以探索从深度Q-Networks到策略梯度方法再到进化算法的强化学习算法。在你进行的过程中,你会将你所知道的应用到实际操作项目中,比如控制模拟机器人、自动化股票市场交易,甚至构建一个可以下围棋的机器人。

里面有什么

  • 将问题组织成马尔可夫决策过程
  • 深度Q网络、策略梯度法、进化算法等流行算法及其驱动算法的直觉
  • 将强化学习算法应用于实际问题
成为VIP会员查看完整内容
0
205

题目:Applied Reinforcement Learning with Python With OpenAI Gym, Tensorflow, and Keras

深入研究强化学习算法,并通过Python将它们应用到不同的用例中。这本书涵盖了重要的主题,如策略梯度和Q学习,并利用框架,如Tensorflow, Keras,和OpenAI Gym。

Python中的应用增强学习向您介绍了强化学习(RL)算法背后的理论和用于实现它们的代码。您将在指导下了解OpenAI Gym的特性,从使用标准库到创建自己的环境,然后了解如何构建强化学习问题,以便研究、开发和部署基于rl的解决方案。

你将学习:

  • 用Python实现强化学习
  • 使用AI框架,如OpenAI Gym、Tensorflow和Keras
  • 通过云资源部署和培训基于增强学习的解决方案
  • 应用强化学习的实际应用

这本书是给谁看的: 数据科学家、机器学习工程师和软件工程师熟悉机器学习和深度学习的概念。

地址:

https://www.springerprofessional.de/en/applied-reinforcement-learning-with-python/17098944

目录:

第1章 强化学习导论

在过去的一年里,深度学习技术的不断扩散和发展给各个行业带来了革命性的变化。毫无疑问,这个领域最令人兴奋的部分之一是强化学习(RL)。这本身往往是许多通用人工智能应用程序的基础,例如学习玩视频游戏或下棋的软件。强化学习的好处是,假设可以将问题建模为包含操作、环境和代理的框架,那么代理就可以熟悉大量的任务。假设,解决问题的范围可以从简单的游戏,更复杂的3d游戏,自动驾驶汽车教学如何挑选和减少乘客在各种不同的地方以及教一个机械手臂如何把握对象和地点在厨房柜台上。

第二章 强化学习算法

读者应该知道,我们将利用各种深度学习和强化学习的方法在这本书。然而,由于我们的重点将转移到讨论实现和这些算法如何在生产环境中工作,我们必须花一些时间来更详细地介绍算法本身。因此,本章的重点将是引导读者通过几个强化学习算法的例子,通常应用和展示他们在使用Open AI gym 不同的问题。

第三章 强化学习算法:Q学习及其变体

随着策略梯度和Actor-Critic模型的初步讨论的结束,我们现在可以讨论读者可能会发现有用的替代深度学习算法。具体来说,我们将讨论Q学习、深度Q学习以及深度确定性策略梯度。一旦我们了解了这些,我们就可以开始处理更抽象的问题,更具体的领域,这将教会用户如何处理不同任务的强化学习。

第四章 通过强化学习做市场

除了在许多书中发现的强化学习中的一些标准问题之外,最好看看那些答案既不客观也不完全解决的领域。在金融领域,尤其是强化学习领域,最好的例子之一就是做市。我们将讨论学科本身,提出一些不基于机器学习的基线方法,然后测试几种基于强化学习的方法。

第五章 自定义OpenAI强化学习环境

在我们的最后一章,我们将专注于Open AI Gym,但更重要的是尝试理解我们如何创建我们自己的自定义环境,这样我们可以处理更多的典型用例。本章的大部分内容将集中在我对开放人工智能的编程实践的建议,以及我如何编写这个软件的建议。最后,在我们完成创建环境之后,我们将继续集中精力解决问题。对于这个例子,我们将集中精力尝试创建和解决一个新的视频游戏。

成为VIP会员查看完整内容
0
103
小贴士
相关VIP内容
相关论文
Playing Text-Adventure Games with Graph-Based Deep Reinforcement Learning
Prithviraj Ammanabrolu,Mark O. Riedl
4+阅读 · 2019年3月25日
Tuomas Haarnoja,Aurick Zhou,Sehoon Ha,Jie Tan,George Tucker,Sergey Levine
6+阅读 · 2018年12月26日
Hierarchical Deep Multiagent Reinforcement Learning
Hongyao Tang,Jianye Hao,Tangjie Lv,Yingfeng Chen,Zongzhang Zhang,Hangtian Jia,Chunxu Ren,Yan Zheng,Changjie Fan,Li Wang
6+阅读 · 2018年9月25日
Image Captioning based on Deep Reinforcement Learning
Haichao Shi,Peng Li,Bo Wang,Zhenyu Wang
7+阅读 · 2018年9月13日
Antoine J. -P. Tixier
10+阅读 · 2018年8月30日
Andreas Kamilaris,Francesc X. Prenafeta-Boldu
10+阅读 · 2018年7月31日
Vinicius Zambaldi,David Raposo,Adam Santoro,Victor Bapst,Yujia Li,Igor Babuschkin,Karl Tuyls,David Reichert,Timothy Lillicrap,Edward Lockhart,Murray Shanahan,Victoria Langston,Razvan Pascanu,Matthew Botvinick,Oriol Vinyals,Peter Battaglia
4+阅读 · 2018年6月5日
Ermo Wei,Drew Wicke,David Freelan,Sean Luke
10+阅读 · 2018年4月25日
Ignasi Clavera,Anusha Nagabandi,Ronald S. Fearing,Pieter Abbeel,Sergey Levine,Chelsea Finn
7+阅读 · 2018年3月30日
Zhiyuan Xu,Jian Tang,Jingsong Meng,Weiyi Zhang,Yanzhi Wang,Chi Harold Liu,Dejun Yang
8+阅读 · 2018年1月17日
Top
微信扫码咨询专知VIP会员