引言 人工智能的飞速发展正在重塑人类社会的诸多领域,强化学习(Reinforcement Learning,RL)作为最重要一项核心技术,正引起了学术界和工业界的广泛关注。强化学习的成功应用,如AlphaGo, ChatGPT等,已经证明了其解决高复杂决策和控制问题的巨大潜力。本书旨在面向工业控制领域剖析强化学习的原理、算法和应用,系统性地介绍这一领域的基础知识与典型案例,为读者提供一个内容全面且易于理解的参考书。
Reinforcement Learning for Sequential Decision and Optimal Control
**
扫码查看图书详情
作者寄语
亲爱的读者们,随着工业领域对复杂决策与控制问题处理需求不断增加,以模仿人类大脑学习机制为原理的强化学习技术,展现出十分广阔的应用前景。然而,强化学习本身所涉及的数理知识深奥,体系比较繁杂,而实际工程应用又充满了各种各样地挑战。为了应对上述挑战,笔者依托在清华大学开设的研究生课程《强化学习与控制》,撰写了这一本教学参考书。在写作本书的过程中,笔者广泛征集了行业专家、领域学者的意见,力求打造一本内容全面、简洁明了的实用教材。期望您在学习过程中能够掌握强化学习的核心概念,熟练地运用各类算法设计,并将其用于解决实际工业控制问题。在此,提前预祝您学习愉快,收获满满!
图书简介
本书按照原理剖析、主流算法、典型示例的架构,系统地介绍了用于动态系统决策与控制的强化学习方法。全书共分为11章,内容涵盖了强化学习的基本概念、蒙特卡洛法、时序差分法、动态规划法、函数近似法、策略梯度法、近似动态规划、状态约束的处理和深度强化学习等知识点。本书主要面向工程应用领域的科研工作者和技术人员,旨在为领域内的行业同仁提供一本体系较为全面,且适合入门者学习和提升的参考书籍。
作者****介绍
李升波
清华大学教授,博导,车辆与运载学院副院长。曾留学于斯坦福大学,密歇根大学和加州伯克利大学。从事自动驾驶汽车、强化学习、最优控制等领域研究。发表论文130余篇,总引用>15000次,H因子62。国内外学术会议优秀论文奖10余次。获中国自动化学会自然科学一等奖、中国汽车工业科技进步特等奖、国家科技进步二等奖、国家技术发明二等奖等。入选国家级高层次科技创新领军人才、交通运输行业中青年科技创新领军人才、中国汽车行业优秀青年科技人才奖、首届北京市自然科学基金杰青等。曾任IEEE ITS Society BOG委员、中国汽车工程学会青工委主任(首任)、IEEE OJ ITS高级副主编、IEEE Trans on ITS/IEEE ITS Mag副主编等。
章节浏览
各位读者可以通过以下链接直接购买本书: https://www.readlink.com/front-book.html?id=21812844
欢迎通过Springer出版您的学术著作,联系编辑团队获取相关信息! 本文参考自公众号:计算机科学讲义