强化学习技术是人工智能从感知智能向决策智能发展的关键技术之一;是基于控制论、心理学、生理学、认知科学、电脑科学等多学科交叉的新兴机器学习技术。
本书是学习和研究强化学习技术的重要参考书籍,作者是日本人工智能领域知名学者、东京大学杉山将教授。
全书将统计学习和强化学习结合,从模型无关策略迭代、模型无关策略搜索、模型相关强化学习三个技术路线角度,对强化学习函数估计中的基函数设计、样本重用以及策略搜索、模型估计等做了深入浅出的介绍。本书适合于从事人工智能和机器学习研究和应用的专家学者、技术人员、研究生阅读。
本书特色:
从现代机器学习的角度介绍了统计强化学习的基本概念和实用算法,为该领域提供了最新介绍。
涵盖了各种类型的强化学习方法,包括基于模型和无模型的方法、策略迭代和策略搜索方法。
涵盖了最近在数据挖掘和机器学习领域引入的方法,以便在强化学习和数据挖掘/机器学习研究人员之间提供系统桥梁。
呈现了最新的结果,包括强化学习的维数降低和风险敏感强化学习;介绍了许多示例来帮助读者理解强化学习技术的直观性和实用性。