大量大维度数据是现代机器学习(ML)的默认设置。标准的ML算法,从支持向量机这样的内核方法和基于图的方法(如PageRank算法)开始,最初的设计是基于小维度的,在处理真实世界的大数据集时,即使不是完全崩溃的话,往往会表现失常。随机矩阵理论最近提出了一系列广泛的工具来帮助理解这种新的维数诅咒,帮助修复或完全重建次优算法,最重要的是提供了处理现代数据挖掘的新方向。本编著的主要目的是提供这些直觉,通过提供一个最近的理论和应用突破的随机矩阵理论到机器学习摘要。针对广泛的受众,从对统计学习感兴趣的本科生到人工智能工程师和研究人员,这本书的数学先决条件是最小的(概率论、线性代数和真实和复杂分析的基础是足够的):与随机矩阵理论和大维度统计的数学文献中的介绍性书籍不同,这里的理论重点仅限于机器学习应用的基本要求。这些应用范围从检测、统计推断和估计,到基于图和核的监督、半监督和非监督分类,以及神经网络: 为此,本文提供了对算法性能的精确理论预测(在不采用随机矩阵分析时往往难以实现)、大维度的洞察力、改进方法,以及对这些方法广泛适用于真实数据的基本论证。该专著中提出的大多数方法、算法和图形都是用MATLAB和Python编写的,读者可以查阅(https://github.com/Zhenyu-LIAO/RMT4ML)。本专著也包含一系列练习两种类型:短的练习与修正附加到书的最后让读者熟悉随机矩阵的基本理论概念和工具分析,以及长期指导练习应用这些工具进一步具体的机器学习应用程序。