【实用书】强化学习实战：Python，110页pdf - 专知VIP

会员服务 ·

84

强化学习 · Python ·

2022 年 6 月 9 日

【实用书】强化学习实战：Python，110页pdf

专知会员服务

专知，提供专业可信的知识分发服务，让认知协作更快更好！

强化学习是人工智能中一个强大的工具，其中虚拟或物理代理学习优化他们的决策，以实现长期目标。在某些情况下，这种机器学习方法可以节省程序员的时间，超越现有的控制器，达到超人的性能，并不断适应不断变化的条件。这本书认为，这些成功表明强化学习可以成功地应用于许多不同的情况，包括机器人控制、股票交易、供应链优化和工厂控制。

然而，强化学习传统上仅限于虚拟环境或模拟环境中的应用，在这些环境中已经提供了设置。此外，实验可以完成几乎无限次的尝试无风险。在许多现实生活任务中，使用强化学习并不像(1)数据没有正确的形式;(2)数据稀缺，(3)自动化在现实世界中有局限性。

因此，这本书是写来帮助学者，领域专家，和数据爱好者一样理解的基本原则，应用强化学习到现实世界的问题。这是通过将重点放在使用实际示例和将标准数据建模为所需的正确形式，然后应用基本智能体的过程来实现的。为了进一步帮助读者获得对这些方法的深入和接地气的理解，本书展示了完整的手工计算示例，以及如何用代码以更自动化的方式实现这一点。

对于对强化学习作为解决方案感兴趣但不精通的决策者，本书在介绍和案例研究部分包括简单的、非技术的例子。这些提供了强化学习的背景，以及在实践中应用它的挑战和风险。具体来说，这些部分阐述了强化学习和其他机器学习方法的区别，以及知名公司如何成功地使用这种方法解决他们的问题。

https://www.morganclaypool.com/doi/abs/10.2200/S01170ED1V01Y202202AIM052

成为VIP会员查看完整内容

相关内容

强化学习

强化学习（RL）是机器学习的一个领域，与软件代理应如何在环境中采取行动以最大化累积奖励的概念有关。除了监督学习和非监督学习外，强化学习是三种基本的机器学习范式之一。强化学习与监督学习的不同之处在于，不需要呈现带标签的输入/输出对，也不需要显式纠正次优动作。相反，重点是在探索（未知领域）和利用（当前知识）之间找到平衡。该环境通常以马尔可夫决策过程（MDP）的形式陈述，因为针对这种情况的许多强化学习算法都使用动态编程技术。经典动态规划方法和强化学习算法之间的主要区别在于，后者不假设MDP的确切数学模型，并且针对无法采用精确方法的大型MDP。

知识荟萃

精品入门和进阶教程、论文和代码整理等

更多

查看相关VIP内容、论文、资讯等

强化学习实战：机遇与挑战，56页pdf

强化学习实战：机遇与挑战，56页pdf

专知会员服务

81+阅读 · 2022年5月7日

【经典书】机器学习统计学，476页pdf

【经典书】机器学习统计学，476页pdf

专知会员服务

122+阅读 · 2021年7月19日

【干货书】Python编程实战导论，263页pdf

专知会员服务

71+阅读 · 2021年7月10日

【2021干货书】Python可解释人工智能，207页pdf，Explainable AI with Python

【2021干货书】Python可解释人工智能，207页pdf，Explainable AI with Python

专知会员服务

186+阅读 · 2021年5月17日

【经典书】《数据科学家统计学实战》，409页pdf

【经典书】《数据科学家统计学实战》，409页pdf

专知会员服务

108+阅读 · 2020年12月31日

【斯坦福干货书】强化学习基金融领域应用，312页pdf

【斯坦福干货书】强化学习基金融领域应用，312页pdf

专知会员服务

134+阅读 · 2020年12月22日

【实用书】Python编程，140页pdf

【实用书】Python编程，140页pdf

专知会员服务

43+阅读 · 2020年8月20日

【干货书】Python 编程，480页pdf

【干货书】Python 编程，480页pdf

专知会员服务

242+阅读 · 2020年8月14日

【2020新书】高级Python编程，620页pdf

【2020新书】高级Python编程，620页pdf

专知会员服务

239+阅读 · 2020年7月31日

【新书】Python强化学习-基于Tensorflow与Keras和OpenAI Gym实战, 177页pdf

【新书】Python强化学习-基于Tensorflow与Keras和OpenAI Gym实战, 177页pdf

专知会员服务

184+阅读 · 2020年1月17日

【实用书】数据科学和机器学习:数学和统计方法，533页pdf，Python手把手带你掌握机器学习

【实用书】数据科学和机器学习:数学和统计方法，533页pdf，Python手把手带你掌握机器学习

专知

20+阅读 · 2022年5月28日

搞强化学习还不了解AutoRL，牛津大学、谷歌等十余位学者撰文综述

搞强化学习还不了解AutoRL，牛津大学、谷歌等十余位学者撰文综述

机器之心

2+阅读 · 2022年2月10日

如何实操机器学习？这本2022《简明机器学习》新书：109页pdf带您细致掌握监督学习机制与实战

如何实操机器学习？这本2022《简明机器学习》新书：109页pdf带您细致掌握监督学习机制与实战

专知

1+阅读 · 2022年2月9日

【干货书】数据科学家统计学基础：R和Python实战，486页pdf

【干货书】数据科学家统计学基础：R和Python实战，486页pdf

专知

28+阅读 · 2022年1月29日

【干货书】使用Python进行高级数据分析，195页pdf，以机器学习、深度学习和NLP为例

【干货书】使用Python进行高级数据分析，195页pdf，以机器学习、深度学习和NLP为例

专知

27+阅读 · 2020年3月24日

421页《机器学习数学基础》最新2019版PDF下载

421页《机器学习数学基础》最新2019版PDF下载

专知

177+阅读 · 2019年3月17日

推荐：一文读懂随机森林的解释和实现（附python代码）

推荐：一文读懂随机森林的解释和实现（附python代码）

数据分析

38+阅读 · 2018年12月4日

【下载】深度强化学习实战书籍和代码《Deep Reinforcement Learning in Action》

【下载】深度强化学习实战书籍和代码《Deep Reinforcement Learning in Action》

专知

77+阅读 · 2018年8月7日

【强化学习】强化学习入门以及代码实现

【强化学习】强化学习入门以及代码实现

产业智能官

18+阅读 · 2017年9月4日

技术 | 强化学习入门以及代码实现

技术 | 强化学习入门以及代码实现

AI100

51+阅读 · 2017年8月26日

分布式有监督学习的学习理论

国家自然科学基金

17+阅读 · 2015年12月31日

不确定环境下强化学习和决策的神经机制

国家自然科学基金

11+阅读 · 2012年12月31日

基于稀疏编码模型的深层学习神经网络

国家自然科学基金

7+阅读 · 2012年12月31日

证券市场中ARA的建模算法及实证研究

国家自然科学基金

1+阅读 · 2012年12月31日

大数据环境下基于视觉主题模型的视觉数据分类方法研究

国家自然科学基金

2+阅读 · 2012年12月31日

基于Affordance的详细设计知识建模、捕获与重用方法研究

国家自然科学基金

0+阅读 · 2012年12月31日

面向个性化推荐的地理信息可视化方法

国家自然科学基金

4+阅读 · 2012年12月31日

提高程序验证自动化程度的技术

国家自然科学基金

0+阅读 · 2011年12月31日

基于多智能体强化学习的多机器人系统研究

国家自然科学基金

48+阅读 · 2009年12月31日

时间序列数据挖掘中的聚类模型与算法研究

国家自然科学基金

14+阅读 · 2008年12月31日

Improving Predictive Performance and Calibration by Weight Fusion in Semantic Segmentation

Improving Predictive Performance and Calibration by Weight Fusion in Semantic Segmentation

Arxiv

0+阅读 · 2022年7月22日

Reinforcement Learning Approaches for the Orienteering Problem with Stochastic and Dynamic Release Dates

Arxiv

0+阅读 · 2022年7月22日

NUWA-Infinity: Autoregressive over Autoregressive Generation for Infinite Visual Synthesis

Arxiv

0+阅读 · 2022年7月20日

Automated Graph Machine Learning: Approaches, Libraries and Directions

Arxiv

20+阅读 · 2022年1月4日

The Principles of Deep Learning Theory

Arxiv

65+阅读 · 2021年6月18日

Equilibrium Refinements for Multi-Agent Influence Diagrams: Theory and Practice

Equilibrium Refinements for Multi-Agent Influence Diagrams: Theory and Practice

Arxiv

15+阅读 · 2021年2月9日

Deep Learning-Based Human Pose Estimation: A Survey

Arxiv

27+阅读 · 2020年12月24日

A Survey of the State of Explainable AI for Natural Language Processing

Arxiv

26+阅读 · 2020年10月1日

Object Detection in Optical Remote Sensing Images: A Survey and A New Benchmark

Object Detection in Optical Remote Sensing Images: A Survey and A New Benchmark

Arxiv

46+阅读 · 2019年9月22日

Exploring Models and Data for Remote Sensing Image Caption Generation

Arxiv

14+阅读 · 2017年12月21日

VIP会员

相关主题

相关VIP内容

强化学习实战：机遇与挑战，56页pdf

强化学习实战：机遇与挑战，56页pdf

专知会员服务

81+阅读 · 2022年5月7日

【经典书】机器学习统计学，476页pdf

【经典书】机器学习统计学，476页pdf

专知会员服务

122+阅读 · 2021年7月19日

【干货书】Python编程实战导论，263页pdf

专知会员服务

71+阅读 · 2021年7月10日

【2021干货书】Python可解释人工智能，207页pdf，Explainable AI with Python

【2021干货书】Python可解释人工智能，207页pdf，Explainable AI with Python

专知会员服务

186+阅读 · 2021年5月17日

【经典书】《数据科学家统计学实战》，409页pdf

【经典书】《数据科学家统计学实战》，409页pdf

专知会员服务

108+阅读 · 2020年12月31日

【斯坦福干货书】强化学习基金融领域应用，312页pdf

【斯坦福干货书】强化学习基金融领域应用，312页pdf

专知会员服务

134+阅读 · 2020年12月22日

【实用书】Python编程，140页pdf

【实用书】Python编程，140页pdf

专知会员服务

43+阅读 · 2020年8月20日

【干货书】Python 编程，480页pdf

【干货书】Python 编程，480页pdf

专知会员服务

242+阅读 · 2020年8月14日

【2020新书】高级Python编程，620页pdf

【2020新书】高级Python编程，620页pdf

专知会员服务

239+阅读 · 2020年7月31日

【新书】Python强化学习-基于Tensorflow与Keras和OpenAI Gym实战, 177页pdf

【新书】Python强化学习-基于Tensorflow与Keras和OpenAI Gym实战, 177页pdf

专知会员服务

184+阅读 · 2020年1月17日

热门VIP内容

开通专知VIP会员享更多权益服务

《战区安全决策课程体系》最新244页

《"无人机航母"原型平台》

任务规划与地形分析：现代复杂环境作战导航体系

《攻击场景描述形式化模型研究》

相关资讯

【实用书】数据科学和机器学习:数学和统计方法，533页pdf，Python手把手带你掌握机器学习

【实用书】数据科学和机器学习:数学和统计方法，533页pdf，Python手把手带你掌握机器学习

专知

20+阅读 · 2022年5月28日

搞强化学习还不了解AutoRL，牛津大学、谷歌等十余位学者撰文综述

搞强化学习还不了解AutoRL，牛津大学、谷歌等十余位学者撰文综述

机器之心

2+阅读 · 2022年2月10日

如何实操机器学习？这本2022《简明机器学习》新书：109页pdf带您细致掌握监督学习机制与实战

如何实操机器学习？这本2022《简明机器学习》新书：109页pdf带您细致掌握监督学习机制与实战

专知

1+阅读 · 2022年2月9日

【干货书】数据科学家统计学基础：R和Python实战，486页pdf

【干货书】数据科学家统计学基础：R和Python实战，486页pdf

专知

28+阅读 · 2022年1月29日

【干货书】使用Python进行高级数据分析，195页pdf，以机器学习、深度学习和NLP为例

【干货书】使用Python进行高级数据分析，195页pdf，以机器学习、深度学习和NLP为例

专知

27+阅读 · 2020年3月24日

421页《机器学习数学基础》最新2019版PDF下载

421页《机器学习数学基础》最新2019版PDF下载

专知

177+阅读 · 2019年3月17日

推荐：一文读懂随机森林的解释和实现（附python代码）

推荐：一文读懂随机森林的解释和实现（附python代码）

数据分析

38+阅读 · 2018年12月4日

【下载】深度强化学习实战书籍和代码《Deep Reinforcement Learning in Action》

【下载】深度强化学习实战书籍和代码《Deep Reinforcement Learning in Action》

专知

77+阅读 · 2018年8月7日

【强化学习】强化学习入门以及代码实现

【强化学习】强化学习入门以及代码实现

产业智能官

18+阅读 · 2017年9月4日

技术 | 强化学习入门以及代码实现

技术 | 强化学习入门以及代码实现

AI100

51+阅读 · 2017年8月26日

相关基金

分布式有监督学习的学习理论

国家自然科学基金

17+阅读 · 2015年12月31日

不确定环境下强化学习和决策的神经机制

国家自然科学基金

11+阅读 · 2012年12月31日

基于稀疏编码模型的深层学习神经网络

国家自然科学基金

7+阅读 · 2012年12月31日

证券市场中ARA的建模算法及实证研究

国家自然科学基金

1+阅读 · 2012年12月31日

大数据环境下基于视觉主题模型的视觉数据分类方法研究

国家自然科学基金

2+阅读 · 2012年12月31日

基于Affordance的详细设计知识建模、捕获与重用方法研究

国家自然科学基金

0+阅读 · 2012年12月31日

面向个性化推荐的地理信息可视化方法

国家自然科学基金

4+阅读 · 2012年12月31日

提高程序验证自动化程度的技术

国家自然科学基金

0+阅读 · 2011年12月31日

基于多智能体强化学习的多机器人系统研究

国家自然科学基金

48+阅读 · 2009年12月31日

时间序列数据挖掘中的聚类模型与算法研究

国家自然科学基金

14+阅读 · 2008年12月31日

相关论文

Improving Predictive Performance and Calibration by Weight Fusion in Semantic Segmentation

Improving Predictive Performance and Calibration by Weight Fusion in Semantic Segmentation

Arxiv

0+阅读 · 2022年7月22日

Reinforcement Learning Approaches for the Orienteering Problem with Stochastic and Dynamic Release Dates

Arxiv

0+阅读 · 2022年7月22日

NUWA-Infinity: Autoregressive over Autoregressive Generation for Infinite Visual Synthesis

Arxiv

0+阅读 · 2022年7月20日

Automated Graph Machine Learning: Approaches, Libraries and Directions

Arxiv

20+阅读 · 2022年1月4日

The Principles of Deep Learning Theory

Arxiv

65+阅读 · 2021年6月18日

Equilibrium Refinements for Multi-Agent Influence Diagrams: Theory and Practice

Equilibrium Refinements for Multi-Agent Influence Diagrams: Theory and Practice

Arxiv

15+阅读 · 2021年2月9日

Deep Learning-Based Human Pose Estimation: A Survey

Arxiv

27+阅读 · 2020年12月24日

A Survey of the State of Explainable AI for Natural Language Processing

Arxiv

26+阅读 · 2020年10月1日

Object Detection in Optical Remote Sensing Images: A Survey and A New Benchmark

Object Detection in Optical Remote Sensing Images: A Survey and A New Benchmark

Arxiv

46+阅读 · 2019年9月22日

Exploring Models and Data for Remote Sensing Image Caption Generation

Arxiv

14+阅读 · 2017年12月21日

微信扫码咨询专知VIP会员