本书着重于概率建模和推理,用于解决四种主要任务:预测(如分类和回归)、生成(如图像和文本生成)、发现(如聚类、降维和状态估计)和控制(决策)。
在第一部分中,我们将更详细地介绍这一领域的一些基本知识,以填补这本书前传中所缺失的一些细节。
在第二部分,我们讨论了各种概率模型下的贝叶斯推理算法。这些不同的算法在速度、准确性、通用性等方面做出了不同的权衡。所得的方法可应用于许多不同的问题。
在第三部分中,我们讨论了拟合p(y|x)形式的条件分布的预测方法,其中x∈x是一些输入(通常是高维的),y∈y是期望的输出(通常是低维的)。在本书的这一部分,我们假设有一个我们想要预测的正确答案,尽管我们可能不确定。
在第四部分中,我们讨论生成模型,它是p(y)或p(y|x)形式的模型,其中可能有多个有效输出。例如,给定一个文本提示符x,我们可能想生成一组不同的图像y来“匹配”标题。评估这样的模型比在预测环境中更难,因为预期的输出应该是什么不太清楚。
在第五部分中,我们将注意力转向数据分析,使用旨在揭示一些有意义的底层状态或模式的方法。我们的重点主要是潜变量模型,即p(z, y) = p(z)p(y|z)的联合模型,其中z是隐状态,y是观测值;目标是从y推断出z。(模型可以选择性地以固定的输入为条件,得到p(z, y|x)。)我们还考虑了通过p(y|x)形式的预测模型隐式学习模式,而不依赖于显式生成模型的方法。
最后,在第六部分,我们讨论了如何使用概率模型和推理在不确定性下作出决策。这自然就引出了非常重要的因果关系的话题,我们将以此结束这本书。