时隔一年，Kevin P. Murphy《概率机器学习：进阶》成书，还开放了PDF下载

会员服务 ·

时隔一年，Kevin P. Murphy《概率机器学习：进阶》成书，还开放了PDF下载

2022 年 3 月 1 日 机器之心

机器之心报道

编辑：蛋酱

终于等到它，第二卷《概率机器学习：进阶》。

今天，谷歌研究科学家 Kevin P. Murphy 正式宣布：《概率机器学习：进阶》书稿已经完成，并面向公众提供免费下载。

这本书是《概率机器学习：简介》的续编，说起来，Kevin P. Murphy 的概率机器学习书算是经典教材了，所以去年他宣布再版的消息曾引起广泛关注。

在第二卷《进阶》中，作者扩展了机器学习的范围，以包含更具挑战性的问题。例如探讨了在多种不同分布下的学习和测试；生成高维输出，如图像、文本和图形；基于潜在变量模型发现数据「洞察力」的方法；以及如何在决策和控制任务中使用概率模型和推理。

消息公布后，一部分读者立即下载了第二卷书稿并开始学习，另一部分读者则突然想起去年下载的第一卷还没翻开过……

不过，Kevin P. Murphy 提到，这本书也还没有全部完成，目前缺失一章内容且需要进一步校对。他还会对网络发布版本进行微调，最终书稿将在今年夏天发送给 MIT 出版社。

或许是因为第二卷成书的效率太高，一位读者表示大受震撼：「什么？第一卷我还没看完啊……」

更多读者还是表达了对第二卷新书的期待：

「你找不到比这两本书更全面、更连贯的现代机器学习评论了（这里是第二本书）。这套书籍提供了一流的教育效果，只需要你愿意阅读……」

阅读本书之前，读者应该基本了解 (监督) 机器学习和其他相关的数学主题 (概率、统计、线性代数、优化)。这些背景材料在第一卷中有所涉及，不过第二卷是自成一体的，先阅读第一卷不是必需的。

第二卷涵盖了众多主题，因此不可能把全部内容都放进书稿中，一些额外的材料可以在书籍主页的线上补充中找到，这个页面还包含用于复现书中大部分图形的 Python 代码。

作者表示，第二卷《概率机器学习：进阶》将于 2023 年正式出版。同时，去年成稿的第一卷《概率机器学习：简介》近日也已经正式出版，只是价格略贵：

第二卷的整体目录如下：

书籍地址：https://github.com/probml/pml2-book/releases/latest/download/pml2.pdf
完整目录：https://probml.github.io/pml-book/pml2/toc2-long-2022-02-27.pdf

这本书侧重于概率建模和推理，用于解决四种主要任务：预测 (分类和回归) 、生成 (图像和文本生成) 、发现 (聚类、降维和状态估计) 和控制 (决策)。

第一部分更详细地介绍了这个领域的一些基本原理，并对一些第一卷中缺少的细节进行了详细介绍。

第二部分讨论了各种概率模型中的贝叶斯推理算法。这些不同的算法在速度、精度、通用性等方面的影响不同，由此产生的方法可以应用于许多不同的问题。

第三部分讨论了预测方法，用于适合 p (y|x) 形式的条件分布，其中 x ∈ X 是输入（通常是高维的），y ∈ Y 是期望的输出（通常是低维的）。这一部分假设了存在一个想要预测的正确答案，尽管通常这个答案是不确定的。

第四部分讨论了生成模型，形式为 p (y) 或 p (y|x)，其中可能有多个有效输出。例如，给定一个文本提示符 x，希望生成一组多样化的图片 y 与标题相匹配。在预测设置中，评估这些模型比评估标题更难，因为它的期望输出是不清楚的。

第五部分将注意力转向了数据分析，讨论了一些旨在揭示有意义的潜在状态或模式的方法。这部分主要关注潜在变量模型，它们是 p (z, y) = p (z) p (y|z) 的联合模型，其中 z 是隐藏状态，y 是观测值，目标是从 y 中推断 z。（该模型可以选择性地以固定的输入为条件，得到 p (z, y|x)。）此外还探讨了一些方法，用于发现以 p (y|x) 形式的预测模型隐式学习到的模式，而不依赖于显式的生成模型。

最后，第六部分讨论了如何使用概率模型和推理在不确定性中进行决策，引出了因果关系这个重要命题。

此外，由于内容涉及范围广泛，大约三分之一的章节是与客座作者共同撰写或合作撰写的，这些客座作者都是领域专家 (参见下面的贡献者完整名单)。