强化学习是人工智能中的一个强大工具,其中虚拟或物理智能体学习优化其决策以实现长期目标。在某些情况下,这种机器学习方法可以节省程序员的时间,超越现有的控制器,达到超人的性能,并不断适应不断变化的条件。它展示了在许多任务(REF)和机器人和自动驾驶汽车(REF)的自动化方法上的人类水平的性能。这本书认为,这些成功表明强化学习可以在许多不同的情况下成功采用,包括机器人控制、股票交易、供应链优化和工厂控制。然而,强化学习传统上局限于虚拟环境或已经提供设置的模拟中的应用。此外,实验可以完成几乎无限的尝试,没有风险。在许多现实生活的任务中,应用强化学习并不简单,因为(1)数据的形式不适合强化学习;(2)数据稀缺,(3)自动化在现实世界中有局限性。因此,本书旨在帮助学者、领域专家和数据爱好者理解在现实问题中应用强化学习的基本原则。这是通过关注将实际示例和将标准数据建模为应用基本代理所需的正确形式的过程来实现的。为了进一步帮助读者获得对这些方法的深入和基础的理解,本书全面展示了手工计算的示例,然后介绍如何以更自动化的方式使用代码实现这一点。对于决策者谁对强化学习作为解决方案感兴趣,但不精通,这本书包括简单的,非技术的例子在介绍和案例研究部分。这些提供了强化学习提供的内容,也提供了在实践中应用它所面临的挑战和风险。具体来说,这些部分说明了强化学习和其他机器学习方法之间的区别,以及知名公司如何成功地使用这种方法解决他们的问题。