【导读】亚马逊人工智能部门机器学习专家AlexanderZai最新撰写的深度强化学习实战书籍(预计2018年秋季出版)《Deep Reinforcement Learning in Action》介绍使用流行的PyTorch深度学习框架来构建网络,以探索从深度Q网络到策略梯度方法,再到进化算法的一系列强化学习算法。手把手教你构建深度强化学习项目,比如控制模拟机器人,自动化股票市场交易,甚至建造一个可以玩围棋的机器人。随书同时提供代码,可以让你动手测试改进。
请关注专知公众号(扫一扫最下面专知二维码,或者点击上方蓝色专知),
后台回复“DRLA” 就可以获取深度强化学习实战 第一章 pdf下载~
后台回复“DRLA” 就可以获取深度强化学习实战 代码下载~
▌图书介绍
人类从反馈中不断学习得最优——对于积极的结果我们会被鼓励去采取行动,但是对于消极结果我们被阻止采取行动。这种强化过程可以应用于计算机程序,使它们能够解决经典编程无法解决的更复杂的问题。《Deep Reinforcement Learning in Action》这本书会向您介绍深度强化学习的基本概念和术语,以及将其实施到您自己的项目中所需的实用技能和技巧。
关于该技术
深度强化学习是机器学习的一种形式,其中人工智能体从自身的原始感官输入中学习最优行为。系统感知环境,解释其过去决策的结果,并利用这些信息来优化其行为,以获得最大的长期回报。深度强化学习这一技术为AlphaGo的成功做出了杰出贡献,但它所能做的并不仅仅局限于这些!更多令人兴奋的应用程序等待被发现。让我们开始吧。
关于该书
《Deep Reinforcement Learning in Action》将会教你如何根据环境的直接反馈对智能体进行编程和学习。您将使用流行的PyTorch深度学习框架来构建网络,以探索从深度Q网络到策略梯度方法,再到进化算法的一系列强化学习算法。当您完成学习的时候,您就可以把你所学的知识应用到实际的项目中,比如控制模拟机器人,自动化股票市场交易,甚至构建一个可以玩围棋的机器人。
书中介绍了什么
将问题结构化为马尔可夫决策过程
常用的算法,如深度Q网络,策略梯度方法
进化算法和驱动它们的直觉知识
将强化学习算法应用于实际问题
关于读者
读者将需要具备中级Python的技能和对深度学习有基本的理解。
关于作者
亚历山大•扎伊(Alexander Zai)是亚马逊人工智能公司(Amazon AI)的一名机器学习工程师,致力于MXNet,为一系列AWS机器学习产品提供支持。他还是Codesmith的联合创始人,Codesmith是一家软件工程训练营,在洛杉矶和纽约设有分部。布兰登•布朗(Brandon Brown)是一名UCSF医学院学生,同时也是加州大学洛杉矶分校的数据科学家。过去三年来,他在outlace.com上发表了大量有关机器学习的博文。
参考:
https://www.manning.com/books/deep-reinforcement-learning-in-action
https://github.com/DeepReinforcementLearning/DeepReinforcementLearningInAction
▌详细目录
▌第一部分 基础
▌第二部分 延伸
▌附录
▌第一章详细内容
-END-
专 · 知
人工智能领域主题知识资料查看与加入专知人工智能服务群:
专知AI知识技术服务会员群加入与人工智能领域26个主题知识资料全集获取。欢迎微信扫一扫加入专知人工智能知识星球群,获取专业知识教程视频资料和与专家交流咨询!
请PC登录www.zhuanzhi.ai或者点击阅读原文,注册登录专知,获取更多AI知识资料!
请加专知小助手微信(扫一扫如下二维码添加),加入专知主题群(请备注主题类型:AI、NLP、CV、 KG等)交流~
AI 项目技术 & 商务合作:bd@zhuanzhi.ai, 或扫描上面二维码联系!
请关注专知公众号,获取人工智能的专业知识!
点击“阅读原文”,使用专知