引言 人工智能的飞速发展正在重塑人类社会的诸多领域,强化学习(Reinforcement Learning,RL)作为最重要一项核心技术,正引起了学术界和工业界的广泛关注。强化学习的成功应用,如AlphaGo, ChatGPT等,已经证明了其解决高复杂决策和控制问题的巨大潜力。本书旨在面向工业控制领域剖析强化学习的原理、算法和应用,系统性地介绍这一领域的基础知识与典型案例,为读者提供一个内容全面且易于理解的参考书。

Reinforcement Learning for Sequential Decision and Optimal Control

**

扫码查看图书详情

作者寄语

亲爱的读者们,随着工业领域对复杂决策与控制问题处理需求不断增加,以模仿人类大脑学习机制为原理的强化学习技术,展现出十分广阔的应用前景。然而,强化学习本身所涉及的数理知识深奥,体系比较繁杂,而实际工程应用又充满了各种各样地挑战。为了应对上述挑战,笔者依托在清华大学开设的研究生课程《强化学习与控制》,撰写了这一本教学参考书。在写作本书的过程中,笔者广泛征集了行业专家、领域学者的意见,力求打造一本内容全面、简洁明了的实用教材。期望您在学习过程中能够掌握强化学习的核心概念,熟练地运用各类算法设计,并将其用于解决实际工业控制问题。在此,提前预祝您学习愉快,收获满满!

图书简介

本书按照原理剖析、主流算法、典型示例的架构,系统地介绍了用于动态系统决策与控制的强化学习方法。全书共分为11章,内容涵盖了强化学习的基本概念、蒙特卡洛法、时序差分法、动态规划法、函数近似法、策略梯度法、近似动态规划、状态约束的处理和深度强化学习等知识点。本书主要面向工程应用领域的科研工作者和技术人员,旨在为领域内的行业同仁提供一本体系较为全面,且适合入门者学习和提升的参考书籍。

作者****介绍

李升波

清华大学教授,博导,车辆与运载学院副院长。曾留学于斯坦福大学,密歇根大学和加州伯克利大学。从事自动驾驶汽车、强化学习、最优控制等领域研究。发表论文130余篇,总引用>15000次,H因子62。国内外学术会议优秀论文奖10余次。获中国自动化学会自然科学一等奖、中国汽车工业科技进步特等奖、国家科技进步二等奖、国家技术发明二等奖等。入选国家级高层次科技创新领军人才、交通运输行业中青年科技创新领军人才、中国汽车行业优秀青年科技人才奖、首届北京市自然科学基金杰青等。曾任IEEE ITS Society BOG委员、中国汽车工程学会青工委主任(首任)、IEEE OJ ITS高级副主编、IEEE Trans on ITS/IEEE ITS Mag副主编等。

章节浏览

各位读者可以通过以下链接直接购买本书: https://www.readlink.com/front-book.html?id=21812844

欢迎通过Springer出版您的学术著作,联系编辑团队获取相关信息! 本文参考自公众号:计算机科学讲义

成为VIP会员查看完整内容
69

相关内容

强化学习(RL)是机器学习的一个领域,与软件代理应如何在环境中采取行动以最大化累积奖励的概念有关。除了监督学习和非监督学习外,强化学习是三种基本的机器学习范式之一。 强化学习与监督学习的不同之处在于,不需要呈现带标签的输入/输出对,也不需要显式纠正次优动作。相反,重点是在探索(未知领域)和利用(当前知识)之间找到平衡。 该环境通常以马尔可夫决策过程(MDP)的形式陈述,因为针对这种情况的许多强化学习算法都使用动态编程技术。经典动态规划方法和强化学习算法之间的主要区别在于,后者不假设MDP的确切数学模型,并且针对无法采用精确方法的大型MDP。

知识荟萃

精品入门和进阶教程、论文和代码整理等

更多

查看相关VIP内容、论文、资讯等
《深度学习500问》一份超全深度学习资料,面试必备!
专知会员服务
160+阅读 · 2022年1月9日
专知会员服务
95+阅读 · 2021年7月11日
【新书】自然语言处理表示学习技术,349页pdf,清华大学
专知会员服务
172+阅读 · 2020年7月11日
【新书】深度学习搜索,Deep Learning for Search,附327页pdf
专知会员服务
202+阅读 · 2020年1月13日
新书速递 | 《知识图谱:方法、实践与应用》
开放知识图谱
15+阅读 · 2019年10月18日
强化学习精品书籍
平均机器
24+阅读 · 2019年1月2日
中文版新书《动手学深度学习》pdf免费分享
深度学习与NLP
74+阅读 · 2018年12月2日
国家自然科学基金
0+阅读 · 2012年12月31日
国家自然科学基金
1+阅读 · 2012年3月31日
国家自然科学基金
0+阅读 · 2011年12月31日
国家自然科学基金
0+阅读 · 2011年12月31日
国家自然科学基金
0+阅读 · 2011年12月31日
国家自然科学基金
2+阅读 · 2009年12月31日
国家自然科学基金
0+阅读 · 2008年12月31日
国家自然科学基金
2+阅读 · 2008年12月31日
国家自然科学基金
11+阅读 · 2008年12月31日
Arxiv
0+阅读 · 2023年7月5日
Arxiv
0+阅读 · 2023年7月5日
Arxiv
0+阅读 · 2023年7月2日
Arxiv
74+阅读 · 2022年7月16日
Arxiv
21+阅读 · 2018年8月30日
VIP会员
相关VIP内容
《深度学习500问》一份超全深度学习资料,面试必备!
专知会员服务
160+阅读 · 2022年1月9日
专知会员服务
95+阅读 · 2021年7月11日
【新书】自然语言处理表示学习技术,349页pdf,清华大学
专知会员服务
172+阅读 · 2020年7月11日
【新书】深度学习搜索,Deep Learning for Search,附327页pdf
专知会员服务
202+阅读 · 2020年1月13日
相关基金
国家自然科学基金
0+阅读 · 2012年12月31日
国家自然科学基金
1+阅读 · 2012年3月31日
国家自然科学基金
0+阅读 · 2011年12月31日
国家自然科学基金
0+阅读 · 2011年12月31日
国家自然科学基金
0+阅读 · 2011年12月31日
国家自然科学基金
2+阅读 · 2009年12月31日
国家自然科学基金
0+阅读 · 2008年12月31日
国家自然科学基金
2+阅读 · 2008年12月31日
国家自然科学基金
11+阅读 · 2008年12月31日
相关论文
微信扫码咨询专知VIP会员