深度强化学习实验室报道
活动组织:DeepRL-Lab联合华章图书发起
书籍获取方式见文章末尾
导读:机器学习领域著名学者周志华教授领衔撰写,系统梳理机器学习理论中的七大重要概念或理论工具,并给出若干分析实例。
机器学习近年来备受关注,对机器学习理论感兴趣的人士也日渐增多。然而这方面的专门书籍颇少,中文读物尤甚。
顾名思义,机器学习理论研究的是关于机器学习的理论基础,主要内容是分析学习任务的困难本质,为学习算法提供理论保证,并根据分析结果指导算法设计。虽然这方面的内容对深入理解机器学习技术甚为重要,但由于内容艰深广袤,既需对机器学习问题有恰当把握,又需相当的数学技巧,且不少内容来源流派颇为不同,不仅初学者感觉难以下手,浸淫多年的学者往往也难纵览全貌。
国际上关于机器学习理论的书籍大致有两类,一类从介绍机器学习具体技术的角度展开,重点在于告诉读者如何从理论角度来理解这些技术,学习理论自身的内容则散见于不同机器学习技术的讨论中。另一类则聚焦于某项具体的学习理论,其他理论内容则需另寻相关读物。
今天,小编为大家推荐《机器学习理论导引》,这本书试图为有志于机器学习理论学习和研究的读者提供一个入门导引。作者以为,对理论学习和研究来说,弄清楚基础概念和工具尤为重要。因此,本书采取了与上述书籍不同的组织方式。作者梳理出机器学习理论这个“百宝箱”中的七个重要概念或理论工具,姑且称之为“七种武器”,即:可学性、(假设空间)复杂度、泛化界、稳定性、一致性、收敛率、遗憾界。
前言
主要符号表
第1章 预备知识 ……………………………………………………… 1
1.1 函数的性质 ……………………………………………………… 1
1.2 重要不等式 ……………………………………………………… 5
1.3 最优化基础 ……………………………………………………… 9
1.4 支持向量机 ……………………………………………………… 13
1.5 理论的作用 ……………………………………………………… 18
1.6 阅读材料 ………………………………………………………… 19
习题 …………………………………………………………………… 21
参考文献 ……………………………………………………………… 22
第2章 可学性 ………………………………………………………… 25
2.1 基本概念 ………………………………………………………… 25
2.2 PAC学习 ………………………………………………………… 26
2.3 分析实例 ………………………………………………………… 30
2.4 阅读材料 ………………………………………………………… 35
习题 …………………………………………………………………… 36
参考文献 ……………………………………………………………… 37
第3章 复杂度 ………………………………………………………… 39
3.1 数据分布无关 …………………………………………………… 39
3.2 数据分布相关 …………………………………………………… 46
3.3 分析实例 ………………………………………………………… 50
3.4 阅读材料 ………………………………………………………… 56
习题 ..………………………………………………………………… 58
参考文献 ……………………………………………………………… 59
第4章 泛化界 ………………………………………………………… 61
4.1 泛化误差上界 …………………………………………………… 61
4.2 泛化误差下界 …………………………………………………… 71
4.3 分析实例 ………………………………………………………… 78
4.4 阅读材料 ………………………………………………………… 83
习题 …………………………………………………………………… 84
参考文献 ……………………………………………………………… 86
第5章 稳定性 ………………………………………………………… 89
5.1 基本概念 ………………………………………………………… 89
5.2 重要性质 ………………………………………………………… 92
5.3 分析实例 ………………………………………………………… 98
5.4 阅读材料 ………………………………………………………… 107
习题 …………………………………………………………………… 108
参考文献 ……………………………………………………………… 110
第6章 一致性 ………………………………………………………… 113
6.1 基本概念 ………………………………………………………… 113
6.2 替代函数 ………………………………………………………… 117
6.3 划分机制 ………………………………………………………… 122
6.4 分析实例 ………………………………………………………… 125
6.5 阅读材料 ………………………………………………………… 132
习题 …………………………………………………………………… 134
参考文献 ……………………………………………………………… 135
第7章 收敛率 ………………………………………………………… 137
7.1 基本概念 ………………………………………………………… 137
7.2 确定优化 ………………………………………………………… 139
7.3 随机优化 ………………………………………………………… 143
7.4 分析实例 ………………………………………………………… 155
7.5 阅读材料 ………………………………………………………… 157
习题 …………………………………………………………………… 159
参考文献 ……………………………………………………………… 161
第8章 遗憾界 ………………………………………………………… 163
8.1 基本概念 ………………………………………………………… 163
8.2 完全信息在线学习 ……………………………………………… 165
8.3 赌博机在线学习 ………………………………………………… 170
8.4 分析实例 …………………………………………………………184
8.5 阅读材料 ………………………………………………………… 188
习题 …………………………………………………………………… 189
参考文献 ……………………………………………………………… 191
索引 …………………………………………………………………… 193
上下滑动查看
本次赠书不再采用“随机抽奖”模式,为了让学习和分享强化学习的伙伴参与活动,将采用“投稿录用”方式,具体投稿要求如下:
须原创文章(可为个人优质博客文章)
题材为深度强化学习领域(论文笔记/解读、学习笔记、coding过程、笔记总结均可)
评价指标:根据综合分数(质量优先+数量)确定是否被录用。
投稿请使用markdown格式,并压缩对应文件夹为zip格式发送至微信[NeuronDance]
投稿作者务必附带作者简介:姓名、本硕博,学校、博客/github,方便于文章文章末尾进行作者简介(个人可选择是否公开)。邮箱(联系使用)
投稿截止日期:2020年6月7日18:00
注意
1. 如弄虚作假者,一律列入实验室黑名单。
2. 本解释权对深度强化学习实验室所有。