强化学习是人工智能中一个强大的工具,其中虚拟或物理代理学习优化他们的决策,以实现长期目标。在某些情况下,这种机器学习方法可以节省程序员的时间,超越现有的控制器,达到超人的性能,并不断适应不断变化的条件。这本书认为,这些成功表明强化学习可以成功地应用于许多不同的情况,包括机器人控制、股票交易、供应链优化和工厂控制。
然而,强化学习传统上仅限于虚拟环境或模拟环境中的应用,在这些环境中已经提供了设置。此外,实验可以完成几乎无限次的尝试无风险。在许多现实生活任务中,使用强化学习并不像(1)数据没有正确的形式;(2)数据稀缺,(3)自动化在现实世界中有局限性。
因此,这本书是写来帮助学者,领域专家,和数据爱好者一样理解的基本原则,应用强化学习到现实世界的问题。这是通过将重点放在使用实际示例和将标准数据建模为所需的正确形式,然后应用基本智能体的过程来实现的。为了进一步帮助读者获得对这些方法的深入和接地气的理解,本书展示了完整的手工计算示例,以及如何用代码以更自动化的方式实现这一点。
对于对强化学习作为解决方案感兴趣但不精通的决策者,本书在介绍和案例研究部分包括简单的、非技术的例子。这些提供了强化学习的背景,以及在实践中应用它的挑战和风险。具体来说,这些部分阐述了强化学习和其他机器学习方法的区别,以及知名公司如何成功地使用这种方法解决他们的问题。
https://www.morganclaypool.com/doi/abs/10.2200/S01170ED1V01Y202202AIM052