入门强化学习，初学者值得一看！

会员服务 ·

入门强化学习，初学者值得一看！

2021 年 12 月 19 日 学术头条

人工智能的发展经历了三次浪潮，从空中楼阁到象牙之塔，现如今走进了万间广厦。

近十年，以深度学习为发端的第三次人工智能浪潮带来很多变化，有别于前两次浪潮的大浪淘沙，这次人工智能浪潮正呈席卷之势，引领新一代科学技术的发展，改变着每个领域、每个行业，也普惠着生活在这个时代的每一个人。

人工智能技术已经融入越来越多的行业，应用在越来越广的场景之中。人工智能开发的难易程度，也从十年前的高不可攀到如今走进千家万户，未来可期成为多数工程师的必备技能。

在这背后自然离不开每一位教育工作者的艰苦努力，也离不开每一本技术专著作者的辛勤付出。回看我国高校人工智能专业的发展历史，系统化的学科建设时间还不算长，从完备的学科设置到专业的师资队伍建设，再到相匹配的教材研发还需要进一步加强和完善。

强化学习是机器学习的重要分支，在学习强化学习的过程中会涉及概率、统计、运筹等数理知识。同时，强化学习又是一门实践性非常强的技术，市面上现有的强化学习书籍的学习门槛还相对较高、对初学者不够友好。

由袁莎、白朔天、唐杰等学者联合创作的书籍——《强化学习·微课版》 ，正是基于这一考量，为读者构建了一个完整的强化学习入门路径，深入浅出地介绍了强化学习算法的基本原理和实现方法。旨在详细介绍强化学习的入门基础知识。

《强化学习·微课版》

本书通过严谨简明的预备知识介绍，有的放矢地为读者梳理强化学习中涉及的数学知识，然后以强化学习拟解决的问题为着眼点，将强化学习要解决的问题转化为求解马尔科夫模型，接着循序渐进地给出了求解此模型的基础求解方法和优化求解方法。

本书看点

1）系统地介绍了强化学习，内容包括学习概述、强化学习预备知识、强化学习基础、表格求解法、近似求解法、实践与前沿六部分，涵盖了强化学习地方方面面。

2）理论与实践结合，偏重实践应用，通过算法原理与实践案例地结合，由浅入深地导入强化学习的概念和方法，达到学以致用。

3）配套资源非常丰富，包括源代码、教学视频和教学大纲。

内容简介

本书为读者构建了一个完整的强化学习入门路径，深入浅出地介绍了强化学习算法的基本原理和实现方法。

在正文开始前，本书带着初学者回顾了相关预备知识，包括数学基础和机器学习基础。在正文部分，本书首先介绍了强化学习的基本概念，给出了强化学习的数学框架（马尔可夫决策过程），随后介绍了强化学习的求解算法，包括表格求解法（动态规划法、蒙特卡洛法和时序差分法），以及近似求解法（值函数近似法、策略梯度法和深度强化学习）。本书最后一部分为实践与前沿，实践部分基于一个相同的例子实现了强化学习领域的主流基础算法，前言部分介绍了强化学习领域的最新研究领域进展。

本书内容架构如下所示：

作者简介

袁莎

曾在清华大学计算机系从事博士后研究，南安普顿大学访问学者。北京智源人工智能研究院大模型研究中心副主任，副研究员（副高级）。近年来主要从事知识大模型、数据科学和知识工程等相关研究。作为负责人主持国家重点研发计划课题、国家自然科学基金青年科学基金项目和中国博士后科学基金面上项目等。担任 AI Open 期刊编委。