本书使用数学和Python代码的新颖集成,说明了连接概率、统计和机器学习的基本概念,使读者不仅可以使用现代Python模块使用统计和机器学习模型,而且还了解它们的相对优点和缺点。为了将理论概念与实际实现清晰地联系起来,作者提供了许多经过设计的示例以及“编程技巧”,鼓励读者编写高质量的Python代码。整个文本,包括所有的图和数值结果,都可以使用所提供的Python代码进行重现,从而使读者能够在自己的计算机上使用相同的代码进行实验。
现代Python模块,如Pandas、Sympy、Scikit-learn、Statsmodels、Scipy、Xarray、Tensorflow和Keras,用于实现和可视化重要的机器学习概念,如偏差/方差权衡、交叉验证、可解释性和正则化。许多抽象的数学思想,如概率的收敛模式,都用具体的数值例子加以解释和说明。这本书适合任何具有概率论、统计学或机器学习本科水平经验并具有Python编程基本知识的人。