这是关于分布式强化学习的首本全面指南,提供了从概率视角考虑决策的新数学形式。 分布式强化学习是考虑决策的新数学形式。它超越了强化学习和期望值的常见方法,专注于因智能体的选择而获得的总奖励或回报 - 特别是,这种回报从概率视角看表现如何。在这本首本全面的分布式强化学习指南中,Marc G. Bellemare, Will Dabney, 和 Mark Rowland,他们引领了这个领域的发展,介绍了其关键概念并回顾了其许多应用。他们展示了其解释因与环境互动而产生的许多复杂有趣现象的能力。
作者们从经典强化学习中介绍核心思想,以使分布式主题有所背景,并包含了对文本中讨论的主要结果的数学证明。他们引导读者通过一系列的算法和数学发展,从而表征,计算,估计,以及基于随机回报做决策。在金融(风险管理)、计算神经科学、计算精神病学、心理学、宏观经济学和机器人技术等多种学科中的实践者已经在使用分布式强化学习,为其在数学金融、工程和生命科学中的扩展应用铺平了道路。分布式强化学习不仅仅是一种数学方法,它代表了智能体如何进行预测和决策的新视角。