强化学习是人工智能中一个强大的工具,其中虚拟或物理代理学习优化他们的决策,以实现长期目标。在某些情况下,这种机器学习方法可以节省程序员的时间,超越现有的控制器,达到超人的性能,并不断适应不断变化的条件。这本书认为,这些成功表明强化学习可以成功地应用于许多不同的情况,包括机器人控制、股票交易、供应链优化和工厂控制。

然而,强化学习传统上仅限于虚拟环境或模拟环境中的应用,在这些环境中已经提供了设置。此外,实验可以完成几乎无限次的尝试无风险。在许多现实生活任务中,使用强化学习并不像(1)数据没有正确的形式;(2)数据稀缺,(3)自动化在现实世界中有局限性。

因此,这本书是写来帮助学者,领域专家,和数据爱好者一样理解的基本原则,应用强化学习到现实世界的问题。这是通过将重点放在使用实际示例和将标准数据建模为所需的正确形式,然后应用基本智能体的过程来实现的。为了进一步帮助读者获得对这些方法的深入和接地气的理解,本书展示了完整的手工计算示例,以及如何用代码以更自动化的方式实现这一点。

对于对强化学习作为解决方案感兴趣但不精通的决策者,本书在介绍和案例研究部分包括简单的、非技术的例子。这些提供了强化学习的背景,以及在实践中应用它的挑战和风险。具体来说,这些部分阐述了强化学习和其他机器学习方法的区别,以及知名公司如何成功地使用这种方法解决他们的问题。

https://www.morganclaypool.com/doi/abs/10.2200/S01170ED1V01Y202202AIM052

成为VIP会员查看完整内容
68
0

相关内容

强化学习(RL)是机器学习的一个领域,与软件代理应如何在环境中采取行动以最大化累积奖励的概念有关。除了监督学习和非监督学习外,强化学习是三种基本的机器学习范式之一。 强化学习与监督学习的不同之处在于,不需要呈现带标签的输入/输出对,也不需要显式纠正次优动作。相反,重点是在探索(未知领域)和利用(当前知识)之间找到平衡。 该环境通常以马尔可夫决策过程(MDP)的形式陈述,因为针对这种情况的许多强化学习算法都使用动态编程技术。经典动态规划方法和强化学习算法之间的主要区别在于,后者不假设MDP的确切数学模型,并且针对无法采用精确方法的大型MDP。

知识荟萃

精品入门和进阶教程、论文和代码整理等

更多

查看相关VIP内容、论文、资讯等
【干货书】Python3编程高级指南,494页pdf
专知会员服务
50+阅读 · 5月18日
强化学习实战:机遇与挑战,56页pdf
专知会员服务
52+阅读 · 5月7日
【干货书】Python机器学习,361页pdf
专知会员服务
176+阅读 · 2021年2月25日
【干货书】《机器学习导论(第二版)》,348页pdf
专知会员服务
195+阅读 · 2020年6月16日
【实用书】Python技术手册,第三版767页pdf
专知会员服务
168+阅读 · 2020年5月21日
强化学习精品书籍
平均机器
19+阅读 · 2019年1月2日
深度强化学习入门,这一篇就够了!
机器学习算法与Python学习
20+阅读 · 2018年8月17日
国家自然科学基金
2+阅读 · 2014年12月31日
国家自然科学基金
0+阅读 · 2013年12月31日
国家自然科学基金
0+阅读 · 2012年12月31日
国家自然科学基金
0+阅读 · 2012年12月31日
国家自然科学基金
0+阅读 · 2012年12月31日
国家自然科学基金
0+阅读 · 2012年12月31日
国家自然科学基金
0+阅读 · 2012年12月31日
国家自然科学基金
0+阅读 · 2011年12月31日
国家自然科学基金
0+阅读 · 2011年12月31日
国家自然科学基金
1+阅读 · 2008年12月31日
Arxiv
0+阅读 · 7月1日
Arxiv
0+阅读 · 6月29日
Arxiv
24+阅读 · 2021年3月8日
Arxiv
10+阅读 · 2018年1月20日
小贴士
相关VIP内容
【干货书】Python3编程高级指南,494页pdf
专知会员服务
50+阅读 · 5月18日
强化学习实战:机遇与挑战,56页pdf
专知会员服务
52+阅读 · 5月7日
【干货书】Python机器学习,361页pdf
专知会员服务
176+阅读 · 2021年2月25日
【干货书】《机器学习导论(第二版)》,348页pdf
专知会员服务
195+阅读 · 2020年6月16日
【实用书】Python技术手册,第三版767页pdf
专知会员服务
168+阅读 · 2020年5月21日
相关基金
国家自然科学基金
2+阅读 · 2014年12月31日
国家自然科学基金
0+阅读 · 2013年12月31日
国家自然科学基金
0+阅读 · 2012年12月31日
国家自然科学基金
0+阅读 · 2012年12月31日
国家自然科学基金
0+阅读 · 2012年12月31日
国家自然科学基金
0+阅读 · 2012年12月31日
国家自然科学基金
0+阅读 · 2012年12月31日
国家自然科学基金
0+阅读 · 2011年12月31日
国家自然科学基金
0+阅读 · 2011年12月31日
国家自然科学基金
1+阅读 · 2008年12月31日
微信扫码咨询专知VIP会员