今天,谷歌研究科学家 Kevin P. Murphy 正式宣布:《概率机器学习:进阶》书稿已经完成,并面向公众提供免费下载。
这本书是《概率机器学习:简介》的续编,说起来,Kevin P. Murphy 的概率机器学习书算是经典教材了,所以去年他宣布再版的消息曾引起广泛关注。
在第二卷《进阶》中,作者扩展了机器学习的范围,以包含更具挑战性的问题。例如探讨了在多种不同分布下的学习和测试;生成高维输出,如图像、文本和图形;基于潜在变量模型发现数据「洞察力」的方法;以及如何在决策和控制任务中使用概率模型和推理。
消息公布后,一部分读者立即下载了第二卷书稿并开始学习,另一部分读者则突然想起去年下载的第一卷还没翻开过……
不过,Kevin P. Murphy 提到,这本书也还没有全部完成,目前缺失一章内容且需要进一步校对。他还会对网络发布版本进行微调,最终书稿将在今年夏天发送给 MIT 出版社。
或许是因为第二卷成书的效率太高,一位读者表示大受震撼:「什么?第一卷我还没看完啊……」
「你找不到比这两本书更全面、更连贯的现代机器学习评论了(这里是第二本书)。这套书籍提供了一流的教育效果,只需要你愿意阅读……」
阅读本书之前,读者应该基本了解 (监督) 机器学习和其他相关的数学主题 (概率、统计、线性代数、优化)。这些背景材料在第一卷中有所涉及,不过第二卷是自成一体的,先阅读第一卷不是必需的。
第二卷涵盖了众多主题,因此不可能把全部内容都放进书稿中,一些额外的材料可以在书籍主页的线上补充中找到,这个页面还包含用于复现书中大部分图形的 Python 代码。
作者表示,第二卷《概率机器学习:进阶》将于 2023 年正式出版。同时,去年成稿的第一卷《概率机器学习:简介》近日也已经正式出版,只是价格略贵:
这本书侧重于概率建模和推理,用于解决四种主要任务:预测 (分类和回归) 、生成 (图像和文本生成) 、发现 (聚类、降维和状态估计) 和控制 (决策)。
第一部分更详细地介绍了这个领域的一些基本原理,并对一些第一卷中缺少的细节进行了详细介绍。
第二部分讨论了各种概率模型中的贝叶斯推理算法。这些不同的算法在速度、精度、通用性等方面的影响不同,由此产生的方法可以应用于许多不同的问题。
第三部分讨论了预测方法,用于适合 p (y|x) 形式的条件分布,其中 x ∈ X 是输入(通常是高维的),y ∈ Y 是期望的输出(通常是低维的)。这一部分假设了存在一个想要预测的正确答案,尽管通常这个答案是不确定的。
第四部分讨论了生成模型,形式为 p (y) 或 p (y|x),其中可能有多个有效输出。例如,给定一个文本提示符 x,希望生成一组多样化的图片 y 与标题相匹配。在预测设置中,评估这些模型比评估标题更难,因为它的期望输出是不清楚的。
第五部分将注意力转向了数据分析,讨论了一些旨在揭示有意义的潜在状态或模式的方法。这部分主要关注潜在变量模型,它们是 p (z, y) = p (z) p (y|z) 的联合模型,其中 z 是隐藏状态,y 是观测值,目标是从 y 中推断 z。(该模型可以选择性地以固定的输入为条件,得到 p (z, y|x)。)此外还探讨了一些方法,用于发现以 p (y|x) 形式的预测模型隐式学习到的模式,而不依赖于显式的生成模型。
最后,第六部分讨论了如何使用概率模型和推理在不确定性中进行决策,引出了因果关系这个重要命题。
此外,由于内容涉及范围广泛,大约三分之一的章节是与客座作者共同撰写或合作撰写的,这些客座作者都是领域专家 (参见下面的贡献者完整名单)。
© THE END
转载请联系本公众号获得授权
投稿或寻求报道:content@jiqizhixin.com