《强化学习—使用 Open AI、TensorFlow和Keras实现》174页pdf

2020 年 3 月 1 日 专知

地址:

https://www.apress.com/gp/book/9781484232842


强化学习是机器学习的一个热门领域,从基础开始: 发现代理和环境如何演变,然后获得它们之间如何相互关联的清晰联系。然后你将学习与强化学习相关的理论,并了解建立强化学习过程的概念。


这本书讨论了对强化学习很重要的算法实现,包括马尔可夫决策过程和半马尔可夫决策过程。下一节将向您展示如何在查看Open AI Gym之前开始使用Open AI。然后您将学习Python中关于增强学习方面的群体智能。


本书的最后一部分从TensorFlow环境开始,并给出了如何将强化学习应用于TensorFlow的概述。还有Keras,一个可以用于强化学习的框架。最后,您将深入研究谷歌的深层思想,并看到可以使用强化学习的场景。


你将学习

吸收强化学习过程的核心概念

使用深度学习和人工智能的高级主题

与Open AI Gym、Open AI和Python一起工作

利用TensorFlow和Keras使用Python进行强化学习


这本书是给谁看的

数据科学家、机器学习和深度学习专业人员、希望适应和学习强化学习的开发人员。



便捷下载,请关注专知公众号(点击上方蓝色专知关注)

  • 后台回复“RL新书” 就可以获取强化学习—使用 Open AI、TensorFlow和Keras实现》专知下载链接


专知,专业可信的人工智能知识分发,让认知协作更快更好!欢迎注册登录专知www.zhuanzhi.ai,获取5000+AI主题干货知识资料!
欢迎微信扫一扫加入专知人工智能知识星球群,获取最新AI专业干货知识教程资料和与专家交流咨询
点击“ 阅读原文 ”,了解使用 专知 ,查看获取5000+AI主题知识资源
登录查看更多
0

相关内容

强化学习(RL)是机器学习的一个领域,与软件代理应如何在环境中采取行动以最大化累积奖励的概念有关。除了监督学习和非监督学习外,强化学习是三种基本的机器学习范式之一。 强化学习与监督学习的不同之处在于,不需要呈现带标签的输入/输出对,也不需要显式纠正次优动作。相反,重点是在探索(未知领域)和利用(当前知识)之间找到平衡。 该环境通常以马尔可夫决策过程(MDP)的形式陈述,因为针对这种情况的许多强化学习算法都使用动态编程技术。经典动态规划方法和强化学习算法之间的主要区别在于,后者不假设MDP的确切数学模型,并且针对无法采用精确方法的大型MDP。

知识荟萃

精品入门和进阶教程、论文和代码整理等

更多

查看相关VIP内容、论文、资讯等
【干货书】高级应用深度学习,294页pdf
专知会员服务
149+阅读 · 2020年6月20日
【干货书】机器学习Python实战教程,366页pdf
专知会员服务
332+阅读 · 2020年3月17日
【新书】Pro 机器学习算法Python实现,379页pdf
专知会员服务
197+阅读 · 2020年2月11日
PyTorch实现多种深度强化学习算法
专知
36+阅读 · 2019年1月15日
深度学习TensorFlow实现集合
专知
10+阅读 · 2018年9月8日
【下载】TensorFlow机器学习教程手把手书谱
专知
38+阅读 · 2017年12月22日
Arxiv
3+阅读 · 2019年3月1日
Multi-task Deep Reinforcement Learning with PopArt
Arxiv
4+阅读 · 2018年9月12日
Arxiv
19+阅读 · 2018年3月28日
VIP会员
Top
微信扫码咨询专知VIP会员