【实用书】强化学习实战:Python,110页pdf

2022 年 6 月 9 日 专知


强化学习是人工智能中一个强大的工具,其中虚拟或物理代理学习优化他们的决策,以实现长期目标。在某些情况下,这种机器学习方法可以节省程序员的时间,超越现有的控制器,达到超人的性能,并不断适应不断变化的条件。这本书认为,这些成功表明强化学习可以成功地应用于许多不同的情况,包括机器人控制、股票交易、供应链优化和工厂控制。


然而,强化学习传统上仅限于虚拟环境或模拟环境中的应用,在这些环境中已经提供了设置。此外,实验可以完成几乎无限次的尝试无风险。在许多现实生活任务中,使用强化学习并不像(1)数据没有正确的形式;(2)数据稀缺,(3)自动化在现实世界中有局限性。


因此,这本书是写来帮助学者,领域专家,和数据爱好者一样理解的基本原则,应用强化学习到现实世界的问题。这是通过将重点放在使用实际示例和将标准数据建模为所需的正确形式,然后应用基本智能体的过程来实现的。为了进一步帮助读者获得对这些方法的深入和接地气的理解,本书展示了完整的手工计算示例,以及如何用代码以更自动化的方式实现这一点。


对于对强化学习作为解决方案感兴趣但不精通的决策者,本书在介绍和案例研究部分包括简单的、非技术的例子。这些提供了强化学习的背景,以及在实践中应用它的挑战和风险。具体来说,这些部分阐述了强化学习和其他机器学习方法的区别,以及知名公司如何成功地使用这种方法解决他们的问题。


https://www.morganclaypool.com/doi/abs/10.2200/S01170ED1V01Y202202AIM052



专知便捷查看

便捷下载,请关注专知公众号(点击上方蓝色专知关注)

  • 后台回复“P110” 就可以获取【实用书】强化学习实战:Python,110页pdf》专知下载链接

                       
专知,专业可信的人工智能知识分发 ,让认知协作更快更好!欢迎注册登录专知www.zhuanzhi.ai,获取100000+AI(AI与军事、医药、公安等)主题干货知识资料!
欢迎微信扫一扫加入专知人工智能知识星球群,获取最新AI专业干货知识教程资料和与专家交流咨询
点击“ 阅读原文 ”,了解使用 专知 ,查看获取100000+AI主题知识资料
登录查看更多
9

相关内容

强化学习(RL)是机器学习的一个领域,与软件代理应如何在环境中采取行动以最大化累积奖励的概念有关。除了监督学习和非监督学习外,强化学习是三种基本的机器学习范式之一。 强化学习与监督学习的不同之处在于,不需要呈现带标签的输入/输出对,也不需要显式纠正次优动作。相反,重点是在探索(未知领域)和利用(当前知识)之间找到平衡。 该环境通常以马尔可夫决策过程(MDP)的形式陈述,因为针对这种情况的许多强化学习算法都使用动态编程技术。经典动态规划方法和强化学习算法之间的主要区别在于,后者不假设MDP的确切数学模型,并且针对无法采用精确方法的大型MDP。

知识荟萃

精品入门和进阶教程、论文和代码整理等

更多

查看相关VIP内容、论文、资讯等
【2022新书】Python手册,275页pdf
专知会员服务
179+阅读 · 2022年3月18日
专知会员服务
55+阅读 · 2021年7月6日
【干货书】Python机器学习,361页pdf
专知会员服务
264+阅读 · 2021年2月25日
专知会员服务
98+阅读 · 2020年12月19日
【干货书】Python 编程,480页pdf
专知会员服务
235+阅读 · 2020年8月14日
【圣经书】《强化学习导论(2nd)》电子书与代码,548页pdf
专知会员服务
201+阅读 · 2020年5月22日
算法与数据结构Python,369页pdf
专知会员服务
161+阅读 · 2020年3月4日
《强化学习—使用 Open AI、TensorFlow和Keras实现》174页pdf
专知会员服务
136+阅读 · 2020年3月1日
【2022新书】Python DevOps,245页pdf
专知
6+阅读 · 2022年7月11日
【2022新书】强化学习工业应用
专知
17+阅读 · 2022年2月3日
【经典书】贝叶斯强化学习概述,147页pdf
专知
4+阅读 · 2021年11月21日
国家自然科学基金
2+阅读 · 2015年12月31日
国家自然科学基金
0+阅读 · 2014年12月31日
国家自然科学基金
5+阅读 · 2013年12月31日
国家自然科学基金
0+阅读 · 2013年12月31日
国家自然科学基金
0+阅读 · 2013年12月31日
国家自然科学基金
1+阅读 · 2012年12月31日
国家自然科学基金
3+阅读 · 2011年12月31日
国家自然科学基金
0+阅读 · 2011年12月31日
Arxiv
57+阅读 · 2022年1月5日
Arxiv
92+阅读 · 2021年5月17日
Arxiv
11+阅读 · 2021年2月17日
Optimization for deep learning: theory and algorithms
Arxiv
104+阅读 · 2019年12月19日
VIP会员
相关VIP内容
【2022新书】Python手册,275页pdf
专知会员服务
179+阅读 · 2022年3月18日
专知会员服务
55+阅读 · 2021年7月6日
【干货书】Python机器学习,361页pdf
专知会员服务
264+阅读 · 2021年2月25日
专知会员服务
98+阅读 · 2020年12月19日
【干货书】Python 编程,480页pdf
专知会员服务
235+阅读 · 2020年8月14日
【圣经书】《强化学习导论(2nd)》电子书与代码,548页pdf
专知会员服务
201+阅读 · 2020年5月22日
算法与数据结构Python,369页pdf
专知会员服务
161+阅读 · 2020年3月4日
《强化学习—使用 Open AI、TensorFlow和Keras实现》174页pdf
专知会员服务
136+阅读 · 2020年3月1日
相关基金
国家自然科学基金
2+阅读 · 2015年12月31日
国家自然科学基金
0+阅读 · 2014年12月31日
国家自然科学基金
5+阅读 · 2013年12月31日
国家自然科学基金
0+阅读 · 2013年12月31日
国家自然科学基金
0+阅读 · 2013年12月31日
国家自然科学基金
1+阅读 · 2012年12月31日
国家自然科学基金
3+阅读 · 2011年12月31日
国家自然科学基金
0+阅读 · 2011年12月31日
Top
微信扫码咨询专知VIP会员