本书介绍了数据科学的数学和算法基础,包括机器学习、高维几何和大型网络分析。主题包括高维数据的反直觉性质,重要的线性代数技术,如奇异值分解,随机行走理论和马尔可夫链,机器学习的基础和重要算法,聚类算法和分析,大型网络的概率模型,表示学习包括主题建模和非负矩阵分解、小波和压缩感知。发展了重要的概率技术,包括大数定律、尾部不等式、随机投影分析、机器学习中的泛化保证,以及用于分析大型随机图中的相变的矩方法。此外,还讨论了重要的结构和复杂性度量,如矩阵规范和VC维。这本书是适合的本科生和研究生课程的设计和分析的算法的数据。