本课程深入介绍机器学习中的数学理论、算法和核方法的应用。该课程是为研究生开设的,由Julien Mairal和Jean-Philippe Vert于2021年教授,是巴黎高等师范学院“数学、计算机视觉和机器学习”硕士课程的一部分。

http://members.cbio.mines-paristech.fr/~jvert/svn/kernelcourse/course/2021mva/index.html

机器学习在现实世界应用中的许多问题可以被形式化为经典的统计问题,例如模式识别、回归或降维,但要注意的是数据通常不是数字的向量。例如,计算生物学中的蛋白质序列和结构、web挖掘中的文本和XML文档、图像处理中的分割图像、语音识别和金融中的时间序列,都具有包含统计问题相关信息但难以编码为有限维向量表示的特定结构。

内核方法是一类非常适合于此类问题的算法。实际上,它们将最初为向量设计的许多统计方法的适用性扩展到了几乎任何类型的数据,而不需要对数据进行明确的向量化。向非向量扩展的代价是需要在对象之间定义一个所谓的正定核函数,形式上相当于数据的隐式向量化。近年来,各种对象内核设计的“艺术”取得了重要的进展,产生了许多最先进的算法,并在许多领域获得了成功的应用。

本课程的目的是介绍核方法的数学基础,以及到目前为止在核设计中出现的主要方法。我们将首先介绍正定核的理论和重建核希尔伯特空间,这将允许我们介绍几种核方法,包括核主成分分析和支持向量机。然后我们再回到定义内核的问题。我们将介绍关于Mercer核和半群核的主要结果,以及字符串和图的核的一些例子,从计算生物学的应用,文本处理和图像分析。最后,我们将讨论一些活跃的研究课题,如大规模核方法和深度核机器。

成为VIP会员查看完整内容
104

相关内容

“机器学习是近20多年兴起的一门多领域交叉学科,涉及概率论、统计学、逼近论、凸分析、算法复杂度理论等多门学科。机器学习理论主要是设计和分析一些让 可以自动“ 学习”的算法。机器学习算法是一类从数据中自动分析获得规律,并利用规律对未知数据进行预测的算法。因为学习算法中涉及了大量的统计学理论,机器学习与统计推断学联系尤为密切,也被称为统计学习理论。算法设计方面,机器学习理论关注可以实现的,行之有效的学习算法。很多 推论问题属于 无程序可循难度,所以部分的机器学习研究是开发容易处理的近似算法。” ——中文维基百科

知识荟萃

精品入门和进阶教程、论文和代码整理等

更多

查看相关VIP内容、论文、资讯等
专知会员服务
111+阅读 · 2021年3月23日
【PKDD2020教程】机器学习不确定性,附88页ppt与视频
专知会员服务
94+阅读 · 2020年10月18日
最新《统计机器学习》课程,26页ppt
专知会员服务
80+阅读 · 2020年8月30日
【普林斯顿】持续视角下的机器学习,31页ppt及视频
专知会员服务
23+阅读 · 2020年8月19日
斯坦福EE364a《凸优化》课件,301页ppt
专知会员服务
95+阅读 · 2020年7月14日
少标签数据学习,54页ppt
专知会员服务
197+阅读 · 2020年5月22日
【经典书】机器学习高斯过程,266页pdf
专知会员服务
195+阅读 · 2020年5月2日
246 页《统计机器学习与凸优化》教程 PPT 下载
新智元
24+阅读 · 2018年9月21日
【WWW2018】网络表示学习Tutorial(附下载)
专知
11+阅读 · 2018年4月25日
一文读懂神经网络(附PPT、视频)
数据派THU
17+阅读 · 2018年3月25日
【资源】15个在线机器学习课程和教程
专知
8+阅读 · 2017年12月22日
Arxiv
0+阅读 · 2021年4月20日
Deep Graph Infomax
Arxiv
17+阅读 · 2018年12月21日
Arxiv
6+阅读 · 2017年12月7日
VIP会员
相关VIP内容
专知会员服务
111+阅读 · 2021年3月23日
【PKDD2020教程】机器学习不确定性,附88页ppt与视频
专知会员服务
94+阅读 · 2020年10月18日
最新《统计机器学习》课程,26页ppt
专知会员服务
80+阅读 · 2020年8月30日
【普林斯顿】持续视角下的机器学习,31页ppt及视频
专知会员服务
23+阅读 · 2020年8月19日
斯坦福EE364a《凸优化》课件,301页ppt
专知会员服务
95+阅读 · 2020年7月14日
少标签数据学习,54页ppt
专知会员服务
197+阅读 · 2020年5月22日
【经典书】机器学习高斯过程,266页pdf
专知会员服务
195+阅读 · 2020年5月2日
微信扫码咨询专知VIP会员