强化学习是人工智能中一个强大的工具,其中虚拟或物理代理学习优化他们的决策,以实现长期目标。在某些情况下,这种机器学习方法可以节省程序员的时间,超越现有的控制器,达到超人的性能,并不断适应不断变化的条件。这本书认为,这些成功表明强化学习可以成功地应用于许多不同的情况,包括机器人控制、股票交易、供应链优化和工厂控制。

然而,强化学习传统上仅限于虚拟环境或模拟环境中的应用,在这些环境中已经提供了设置。此外,实验可以完成几乎无限次的尝试无风险。在许多现实生活任务中,使用强化学习并不像(1)数据没有正确的形式;(2)数据稀缺,(3)自动化在现实世界中有局限性。

因此,这本书是写来帮助学者,领域专家,和数据爱好者一样理解的基本原则,应用强化学习到现实世界的问题。这是通过将重点放在使用实际示例和将标准数据建模为所需的正确形式,然后应用基本智能体的过程来实现的。为了进一步帮助读者获得对这些方法的深入和接地气的理解,本书展示了完整的手工计算示例,以及如何用代码以更自动化的方式实现这一点。

对于对强化学习作为解决方案感兴趣但不精通的决策者,本书在介绍和案例研究部分包括简单的、非技术的例子。这些提供了强化学习的背景,以及在实践中应用它的挑战和风险。具体来说,这些部分阐述了强化学习和其他机器学习方法的区别,以及知名公司如何成功地使用这种方法解决他们的问题。

https://www.morganclaypool.com/doi/abs/10.2200/S01170ED1V01Y202202AIM052

成为VIP会员查看完整内容
147

相关内容

强化学习(RL)是机器学习的一个领域,与软件代理应如何在环境中采取行动以最大化累积奖励的概念有关。除了监督学习和非监督学习外,强化学习是三种基本的机器学习范式之一。 强化学习与监督学习的不同之处在于,不需要呈现带标签的输入/输出对,也不需要显式纠正次优动作。相反,重点是在探索(未知领域)和利用(当前知识)之间找到平衡。 该环境通常以马尔可夫决策过程(MDP)的形式陈述,因为针对这种情况的许多强化学习算法都使用动态编程技术。经典动态规划方法和强化学习算法之间的主要区别在于,后者不假设MDP的确切数学模型,并且针对无法采用精确方法的大型MDP。

知识荟萃

精品入门和进阶教程、论文和代码整理等

更多

查看相关VIP内容、论文、资讯等
强化学习实战:机遇与挑战,56页pdf
专知会员服务
80+阅读 · 2022年5月7日
【经典书】机器学习统计学,476页pdf
专知会员服务
120+阅读 · 2021年7月19日
专知会员服务
68+阅读 · 2021年7月10日
【经典书】《数据科学家统计学实战》,409页pdf
专知会员服务
102+阅读 · 2020年12月31日
【斯坦福干货书】强化学习基金融领域应用,312页pdf
专知会员服务
132+阅读 · 2020年12月22日
【实用书】Python编程,140页pdf
专知会员服务
41+阅读 · 2020年8月20日
【干货书】Python 编程,480页pdf
专知会员服务
235+阅读 · 2020年8月14日
【2020新书】高级Python编程,620页pdf
专知会员服务
235+阅读 · 2020年7月31日
421页《机器学习数学基础》最新2019版PDF下载
【强化学习】强化学习入门以及代码实现
产业智能官
18+阅读 · 2017年9月4日
技术 | 强化学习入门以及代码实现
AI100
51+阅读 · 2017年8月26日
国家自然科学基金
15+阅读 · 2015年12月31日
国家自然科学基金
10+阅读 · 2012年12月31日
国家自然科学基金
7+阅读 · 2012年12月31日
国家自然科学基金
1+阅读 · 2012年12月31日
国家自然科学基金
2+阅读 · 2012年12月31日
国家自然科学基金
0+阅读 · 2012年12月31日
国家自然科学基金
3+阅读 · 2012年12月31日
国家自然科学基金
0+阅读 · 2011年12月31日
国家自然科学基金
45+阅读 · 2009年12月31日
国家自然科学基金
12+阅读 · 2008年12月31日
Arxiv
64+阅读 · 2021年6月18日
Arxiv
27+阅读 · 2020年12月24日
VIP会员
相关VIP内容
强化学习实战:机遇与挑战,56页pdf
专知会员服务
80+阅读 · 2022年5月7日
【经典书】机器学习统计学,476页pdf
专知会员服务
120+阅读 · 2021年7月19日
专知会员服务
68+阅读 · 2021年7月10日
【经典书】《数据科学家统计学实战》,409页pdf
专知会员服务
102+阅读 · 2020年12月31日
【斯坦福干货书】强化学习基金融领域应用,312页pdf
专知会员服务
132+阅读 · 2020年12月22日
【实用书】Python编程,140页pdf
专知会员服务
41+阅读 · 2020年8月20日
【干货书】Python 编程,480页pdf
专知会员服务
235+阅读 · 2020年8月14日
【2020新书】高级Python编程,620页pdf
专知会员服务
235+阅读 · 2020年7月31日
相关基金
国家自然科学基金
15+阅读 · 2015年12月31日
国家自然科学基金
10+阅读 · 2012年12月31日
国家自然科学基金
7+阅读 · 2012年12月31日
国家自然科学基金
1+阅读 · 2012年12月31日
国家自然科学基金
2+阅读 · 2012年12月31日
国家自然科学基金
0+阅读 · 2012年12月31日
国家自然科学基金
3+阅读 · 2012年12月31日
国家自然科学基金
0+阅读 · 2011年12月31日
国家自然科学基金
45+阅读 · 2009年12月31日
国家自然科学基金
12+阅读 · 2008年12月31日
微信扫码咨询专知VIP会员