2012年,我出版了一本1200页的书《机器学习:概率视角》(Machine learning: a probability perspective),在概率建模的统一视角下,对当时的机器学习(ML)领域进行了较为全面的覆盖。这本书很受欢迎,并在2013年获得了 De Groot奖。
2012年也被普遍认为是“深度学习革命”的开始。术语“深度学习”指的是ML的一个分支,它基于多层神经网络(因此术语“深度”)。尽管这种基本技术已经存在很多年了,但直到2012年,它才开始在一些具有挑战性的基准测试上显著优于其他更“经典”的ML方法。例如,[KSH12]使用深度神经网络(DNNs)赢得了ImageNet图像分类挑战赛,[CMS12]使用DNNs赢得了另一场图像分类挑战赛,[DHK13]使用DNNs在语音识别方面大大优于现有方法。这些突破的实现得益于硬件技术的进步(特别是,从视频游戏到ML的快速图形处理单元的再利用)、数据收集技术(特别是,使用众包收集大型标记数据集,如ImageNet),以及各种新的算法思想。
自2012年以来,深度学习领域出现了爆炸式的发展,新的进展不断加快。由于该技术的商业成功以及其应用范围的广泛,人们对该领域的兴趣也出现了爆炸式的增长。因此,在2018年,我决定写我的书的第二版,试图总结一些进展。
我的书的第二版,试图总结一些进展。到2020年春天,我的第二版草稿已经增加到大约1600页,但我仍然没有完成。此时,发生了3件大事。首先,COVID-19大流行袭来,所以我决定“转向”,这样我就可以把大部分时间花在COVID-19建模上。其次,麻省理工学院出版社告诉我,他们不能出版1600页的书,我需要把它分成两卷。第三,我决定招募几个同事来帮我完成最后⇠15%的“缺失的内容”。(见下面的确认。)
结果是两本新书,“概率机器学习:简介”,你目前正在阅读,以及“概率机器学习:高级主题”,这是这本书的续集[Mur22]。这两本书使用了我在第一本书中使用的概率建模和贝叶斯决策理论的统一视角,试图对ML c. 2020领域进行相当广泛的覆盖。
第一本书的大部分内容都被重复使用了,但现在它被两本新书平均分配了。此外,每本书都有大量的新材料,涵盖了一些主题从深度学习,但也在其他领域的进展,如生成模型,变分推理和强化学习。为了使这本书更加完备和对学生有用,我还添加了一些更多的背景内容,关于优化和线性代数等主题,这些内容由于篇幅不足在第一本书中被省略了。
另一个主要的变化是几乎所有的软件现在都使用Python而不是Matlab。新代码利用了标准的Python库,如numpy、scipy、scikit-learn等。有些例子也依赖于各种深度学习库,如TensorFlow、PyTorch和JAX。除了创建一些图形的脚本之外,每一章还配有Jupyter记事本,这些记事本讨论了我们在主要文本中没有空间覆盖的实际方面。详情请访问http://mlbayes.ai。
地址:
https://probml.github.io/pml-book/book1.html
目录内容:
专知便捷查看
便捷下载,请关注专知公众号(点击上方蓝色专知关注)
后台回复“PML932” 可以获取《新书《概率机器学习导论》,谷歌大牛KevinMurphy最新932页pdf巨作》专知下载链接索引