大量大维度数据是现代机器学习(ML)的默认设置。标准的ML算法,从支持向量机这样的内核方法和基于图的方法(如PageRank算法)开始,最初的设计是基于小维度的,在处理真实世界的大数据集时,即使不是完全崩溃的话,往往会表现失常。随机矩阵理论最近提出了一系列广泛的工具来帮助理解这种新的维数诅咒,帮助修复或完全重建次优算法,最重要的是提供了处理现代数据挖掘的新方向。本编著的主要目的是提供这些直觉,通过提供一个最近的理论和应用突破的随机矩阵理论到机器学习摘要。针对广泛的受众,从对统计学习感兴趣的本科生到人工智能工程师和研究人员,这本书的数学先决条件是最小的(概率论、线性代数和真实和复杂分析的基础是足够的):与随机矩阵理论和大维度统计的数学文献中的介绍性书籍不同,这里的理论重点仅限于机器学习应用的基本要求。这些应用范围从检测、统计推断和估计,到基于图和核的监督、半监督和非监督分类,以及神经网络: 为此,本文提供了对算法性能的精确理论预测(在不采用随机矩阵分析时往往难以实现)、大维度的洞察力、改进方法,以及对这些方法广泛适用于真实数据的基本论证。该专著中提出的大多数方法、算法和图形都是用MATLAB和Python编写的,读者可以查阅(https://github.com/Zhenyu-LIAO/RMT4ML)。本专著也包含一系列练习两种类型:短的练习与修正附加到书的最后让读者熟悉随机矩阵的基本理论概念和工具分析,以及长期指导练习应用这些工具进一步具体的机器学习应用程序。

https://zhenyu-liao.github.io/book/

成为VIP会员查看完整内容
145

相关内容

“机器学习是近20多年兴起的一门多领域交叉学科,涉及概率论、统计学、逼近论、凸分析、算法复杂度理论等多门学科。机器学习理论主要是设计和分析一些让 可以自动“ 学习”的算法。机器学习算法是一类从数据中自动分析获得规律,并利用规律对未知数据进行预测的算法。因为学习算法中涉及了大量的统计学理论,机器学习与统计推断学联系尤为密切,也被称为统计学习理论。算法设计方面,机器学习理论关注可以实现的,行之有效的学习算法。很多 推论问题属于 无程序可循难度,所以部分的机器学习研究是开发容易处理的近似算法。” ——中文维基百科

知识荟萃

精品入门和进阶教程、论文和代码整理等

更多

查看相关VIP内容、论文、资讯等
专知会员服务
125+阅读 · 2021年8月4日
专知会员服务
115+阅读 · 2021年7月24日
【经典书】机器学习统计学,476页pdf
专知会员服务
122+阅读 · 2021年7月19日
专知会员服务
230+阅读 · 2021年6月3日
【经典书】数理统计学,142页pdf
专知会员服务
97+阅读 · 2021年3月25日
【硬核书】不完全信息决策理论,467页pdf
专知会员服务
354+阅读 · 2020年6月24日
【经典书】机器学习高斯过程,266页pdf
专知会员服务
231+阅读 · 2020年5月2日
缺失数据统计分析,第三版,462页pdf
专知
47+阅读 · 2020年2月28日
【资源】机器学习数学全书,1900页PDF下载
全球人工智能
154+阅读 · 2019年10月17日
421页《机器学习数学基础》最新2019版PDF下载
Arxiv
0+阅读 · 2021年10月11日
Optimization for deep learning: theory and algorithms
Arxiv
105+阅读 · 2019年12月19日
Arxiv
22+阅读 · 2018年8月30日
VIP会员
相关VIP内容
专知会员服务
125+阅读 · 2021年8月4日
专知会员服务
115+阅读 · 2021年7月24日
【经典书】机器学习统计学,476页pdf
专知会员服务
122+阅读 · 2021年7月19日
专知会员服务
230+阅读 · 2021年6月3日
【经典书】数理统计学,142页pdf
专知会员服务
97+阅读 · 2021年3月25日
【硬核书】不完全信息决策理论,467页pdf
专知会员服务
354+阅读 · 2020年6月24日
【经典书】机器学习高斯过程,266页pdf
专知会员服务
231+阅读 · 2020年5月2日
微信扫码咨询专知VIP会员