【新书推荐】清华最新《RL for Sequential Decision and Optimal Control》书籍

引言人工智能的飞速发展正在重塑人类社会的诸多领域，强化学习（Reinforcement Learning，RL）作为最重要一项核心技术，正引起了学术界和工业界的广泛关注。强化学习的成功应用，如AlphaGo, ChatGPT等，已经证明了其解决高复杂决策和控制问题的巨大潜力。本书旨在面向工业控制领域剖析强化学习的原理、算法和应用，系统性地介绍这一领域的基础知识与典型案例，为读者提供一个内容全面且易于理解的参考书。

Reinforcement Learning for Sequential Decision and Optimal Control

扫码查看图书详情

作者寄语

亲爱的读者们，随着工业领域对复杂决策与控制问题处理需求不断增加，以模仿人类大脑学习机制为原理的强化学习技术，展现出十分广阔的应用前景。然而，强化学习本身所涉及的数理知识深奥，体系比较繁杂，而实际工程应用又充满了各种各样地挑战。为了应对上述挑战，笔者依托在清华大学开设的研究生课程《强化学习与控制》，撰写了这一本教学参考书。在写作本书的过程中，笔者广泛征集了行业专家、领域学者的意见，力求打造一本内容全面、简洁明了的实用教材。期望您在学习过程中能够掌握强化学习的核心概念，熟练地运用各类算法设计，并将其用于解决实际工业控制问题。在此，提前预祝您学习愉快，收获满满！

图书简介

本书按照原理剖析、主流算法、典型示例的架构，系统地介绍了用于动态系统决策与控制的强化学习方法。全书共分为11章，内容涵盖了强化学习的基本概念、蒙特卡洛法、时序差分法、动态规划法、函数近似法、策略梯度法、近似动态规划、状态约束的处理和深度强化学习等知识点。本书主要面向工程应用领域的科研工作者和技术人员，旨在为领域内的行业同仁提供一本体系较为全面，且适合入门者学习和提升的参考书籍。

作者****介绍

李升波

清华大学教授，博导，车辆与运载学院副院长。曾留学于斯坦福大学，密歇根大学和加州伯克利大学。从事自动驾驶汽车、强化学习、最优控制等领域研究。发表论文130余篇，总引用>15000次，H因子62。国内外学术会议优秀论文奖10余次。获中国自动化学会自然科学一等奖、中国汽车工业科技进步特等奖、国家科技进步二等奖、国家技术发明二等奖等。入选国家级高层次科技创新领军人才、交通运输行业中青年科技创新领军人才、中国汽车行业优秀青年科技人才奖、首届北京市自然科学基金杰青等。曾任IEEE ITS Society BOG委员、中国汽车工程学会青工委主任（首任）、IEEE OJ ITS高级副主编、IEEE Trans on ITS/IEEE ITS Mag副主编等。

章节浏览