《数据科学家的统计基础:使用R和Python》是一本一学期或两学期的数学统计入门教材,供培养成为数据科学家的学生使用。它深入介绍了任何数据科学家都应该熟悉的统计科学主题,包括概率分布、描述性和推理统计方法以及线性建模。这本书假设有基本的微积分知识,所以演示可以集中在“为什么它可以工作”以及“如何做它”上。然而,与传统的“数理统计”教科书相比,这本书较少强调概率论,而更强调使用软件来实现统计方法和进行模拟来说明关键概念。书中所有的统计分析都使用R软件,还有一个附录展示了用Python进行的相同分析。
这本书还介绍了现代主题,通常不出现在数理统计文本,但与数据科学家高度相关,如贝叶斯推理,非正态响应的广义线性模型(例如,逻辑回归和泊松loglinear模型),和正则模型拟合。将近500个练习被分为“数据分析与应用”和“方法与概念”。附录介绍了R和Python,并包含了奇数号练习的解决方案。本书的网站扩展了R, Python和Matlab的附录,以及来自示例和练习的所有数据集。