https://www.worldscientific.com/page/pressroom/2018-07-31-01

这本书提供了一个机器学习和数据挖掘领域的数学分析。典型的计算机科学数学课程的数学分析部分省略了这些非常重要的思想和技术,这些思想和技术对于机器学习的专门领域是不可缺少的,以优化为中心,如支持向量机,神经网络,各种类型的回归,特征选择和聚类。本书适用于研究者和研究生,他们将从书中讨论的这些应用领域获益。

数学分析可以被松散地描述为数学的一个领域,其主要对象是研究函数及其关于极限的行为。术语“函数”指的是实参数实函数的广义集合,包括函数、运算符、测度等。在数学分析中,有几个发展良好的领域对机器学习产生了特殊的兴趣:拓扑(具有不同的风格:点集拓扑、组合拓扑和代数拓扑),赋范和内积空间的泛函分析(包括巴拿赫和希尔伯特空间),凸分析,优化,等等。此外,像测量和集成理论这样的学科在统计学中发挥着至关重要的作用,这是机器学习的另一个支柱,在计算机科学家的教育中缺乏。我们的目标是为缩小这一差距做出贡献,这是对研究感兴趣的人的一个严重障碍。机器学习和数据挖掘文献非常广泛,包括各种各样的方法,从非正式的到复杂的数学展示。然而,接近研究主题所需要的必要的数学背景通常以一种简洁和无动机的方式呈现,或者干脆就不存在。本卷机器学习的通常介绍,并提供(通过其应用章节,讨论优化,迭代算法,神经网络,回归,和支持向量机)的数学方面的研究。

成为VIP会员查看完整内容
0
99

相关内容

“机器学习是近20多年兴起的一门多领域交叉学科,涉及概率论、统计学、逼近论、凸分析、算法复杂度理论等多门学科。机器学习理论主要是设计和分析一些让 可以自动“ 学习”的算法。机器学习算法是一类从数据中自动分析获得规律,并利用规律对未知数据进行预测的算法。因为学习算法中涉及了大量的统计学理论,机器学习与统计推断学联系尤为密切,也被称为统计学习理论。算法设计方面,机器学习理论关注可以实现的,行之有效的学习算法。很多 推论问题属于 无程序可循难度,所以部分的机器学习研究是开发容易处理的近似算法。” ——中文维基百科

知识荟萃

精品入门和进阶教程、论文和代码整理等

更多

查看相关VIP内容、论文、资讯等

在过去的十年里,人们对人工智能和机器学习的兴趣有了相当大的增长。从最广泛的意义上说,这些领域旨在“学习一些有用的东西”,了解生物体所处的环境。如何处理收集到的信息导致了算法的发展——如何处理高维数据和处理不确定性。在机器学习和相关领域的早期研究阶段,类似的技术在相对孤立的研究社区中被发现。虽然不是所有的技术都有概率论的自然描述,但许多都有,它是图模型的框架(图和概率论的结合),使从统计物理、统计、机器学习和信息理论的想法的理解和转移。在这种程度上,现在有理由期待机器学习研究人员熟悉统计建模技术的基础知识。这本书集中在信息处理和机器学习的概率方面。当然,没有人说这种方法是正确的,也没有人说这是唯一有用的方法。事实上,有人可能会反驳说,这是没有必要的,因为“生物有机体不使用概率论”。无论情况是否如此,不可否认的是,图模型和概率框架帮助机器学习领域出现了新算法和模型的爆炸式增长。我们还应该清楚,贝叶斯观点并不是描述机器学习和信息处理的唯一方法。贝叶斯和概率技术在需要考虑不确定性的领域中发挥了自己的作用。

http://www0.cs.ucl.ac.uk/staff/d.barber/brml/

本书结构

本书第一部分的目的之一是鼓励计算机科学专业的学生进入这一领域。许多现代学生面临的一个特别困难是有限的正规微积分和线性代数训练,这意味着连续和高维分布的细节可能会让他们离开。在以概率作为推理系统的一种形式开始时,我们希望向读者展示他们可能更熟悉的逻辑推理和动态规划的想法如何在概率环境中有自然的相似之处。特别是,计算机科学的学生熟悉的概念,算法为核心。然而,在机器学习中更常见的做法是将模型视为核心,而如何实现则是次要的。从这个角度来看,理解如何将一个数学模型转换成一段计算机代码是核心。

第二部分介绍了理解连续分布所需的统计背景,以及如何从概率框架来看待学习。第三部分讨论机器学习的主题。当然,当一些读者看到他们最喜欢的统计话题被列在机器学习下面时,他们会感到惊讶。统计学和机器学习之间的一个不同观点是,我们最终希望构建什么样的系统(能够完成“人类/生物信息处理任务的机器),而不是某些技术。因此,我认为这本书的这一部分对机器学习者来说是有用的。第四部分讨论了明确考虑时间的动态模型。特别是卡尔曼滤波器被视为图模型的一种形式,这有助于强调模型是什么,而不是像工程文献中更传统的那样把它作为一个“过滤器”。第五部分简要介绍了近似推理技术,包括随机(蒙特卡罗)和确定性(变分)技术。

成为VIP会员查看完整内容
0
60

这本书的目的是全面概述在算法的数学分析中使用的主要技术。涵盖的材料从经典的数学主题,包括离散数学,基本的真实分析,和组合学,以及从经典的计算机科学主题,包括算法和数据结构。重点是“平均情况”或“概率”分析,但也涵盖了“最坏情况”或“复杂性”分析所需的基本数学工具。我们假设读者对计算机科学和实际分析的基本概念有一定的熟悉。简而言之,读者应该既能写程序,又能证明定理。否则,这本书是自成一体的。

这本书是用来作为算法分析高级课程的教科书。它也可以用于计算机科学家的离散数学课程,因为它涵盖了离散数学的基本技术,以及组合学和重要的离散结构的基本性质,在计算机科学学生熟悉的背景下。传统的做法是在这类课程中有更广泛的覆盖面,但许多教师可能会发现,这里的方法是一种有用的方式,可以让学生参与到大量的材料中。这本书也可以用来向数学和应用数学的学生介绍与算法和数据结构相关的计算机科学原理。

尽管有大量关于算法数学分析的文献,但该领域的学生和研究人员尚未直接获得广泛使用的方法和模型的基本信息。本书旨在解决这种情况,汇集了大量的材料,旨在为读者提供该领域的挑战的欣赏和学习正在开发的先进工具以应对这些挑战所需的背景知识。补充的论文从文献,这本书可以作为基础的介绍性研究生课程的算法分析,或作为一个参考或基础的研究人员在数学或计算机科学谁想要获得这个领域的文献自学。

成为VIP会员查看完整内容
0
63

大量大维度数据是现代机器学习(ML)的默认设置。标准的ML算法,从支持向量机这样的内核方法和基于图的方法(如PageRank算法)开始,最初的设计是基于小维度的,在处理真实世界的大数据集时,即使不是完全崩溃的话,往往会表现失常。随机矩阵理论最近提出了一系列广泛的工具来帮助理解这种新的维数诅咒,帮助修复或完全重建次优算法,最重要的是提供了处理现代数据挖掘的新方向。本编著的主要目的是提供这些直觉,通过提供一个最近的理论和应用突破的随机矩阵理论到机器学习摘要。针对广泛的受众,从对统计学习感兴趣的本科生到人工智能工程师和研究人员,这本书的数学先决条件是最小的(概率论、线性代数和真实和复杂分析的基础是足够的):与随机矩阵理论和大维度统计的数学文献中的介绍性书籍不同,这里的理论重点仅限于机器学习应用的基本要求。这些应用范围从检测、统计推断和估计,到基于图和核的监督、半监督和非监督分类,以及神经网络: 为此,本文提供了对算法性能的精确理论预测(在不采用随机矩阵分析时往往难以实现)、大维度的洞察力、改进方法,以及对这些方法广泛适用于真实数据的基本论证。该专著中提出的大多数方法、算法和图形都是用MATLAB和Python编写的,读者可以查阅(https://github.com/Zhenyu-LIAO/RMT4ML)。本专著也包含一系列练习两种类型:短的练习与修正附加到书的最后让读者熟悉随机矩阵的基本理论概念和工具分析,以及长期指导练习应用这些工具进一步具体的机器学习应用程序。

https://zhenyu-liao.github.io/book/

成为VIP会员查看完整内容
0
57

《量子信息理论》这本书基本上是自成体系的,主要关注构成这门学科基础的基本事实的精确数学公式和证明。它是为研究生和研究人员在数学,计算机科学,理论物理学寻求发展一个全面的理解关键结果,证明技术,和方法,与量子信息和计算理论的广泛研究主题相关。本书对基础数学,包括线性代数,数学分析和概率论有一定的理解。第一章总结了这些必要的数学先决条件,并从这个基础开始,这本书包括清晰和完整的证明它提出的所有结果。接下来的每一章都包含了具有挑战性的练习,旨在帮助读者发展自己的技能,发现关于量子信息理论的证明。

这是一本关于量子信息的数学理论的书,专注于定义、定理和证明的正式介绍。它主要是为对量子信息和计算有一定了解的研究生和研究人员准备的,比如将在本科生或研究生的入门课程中涵盖,或在目前存在的关于该主题的几本书中的一本中。量子信息科学近年来有了爆炸性的发展,特别是在过去的二十年里。对这个问题的全面处理,即使局限于理论方面,也肯定需要一系列的书,而不仅仅是一本书。与这一事实相一致的是,本文所涉及的主题的选择并不打算完全代表该主题。量子纠错和容错,量子算法和复杂性理论,量子密码学,和拓扑量子计算是在量子信息科学的理论分支中发现的许多有趣的和基本的主题,在这本书中没有涵盖。然而,当学习这些主题时,人们很可能会遇到本书中讨论的一些核心数学概念。

https://www.cambridge.org/core/books/theory-of-quantum-information/AE4AA5638F808D2CFEB070C55431D897#fndtn-information

成为VIP会员查看完整内容
0
57

这本书的目的是介绍计算机科学家所需要的一些基本数学知识。读者并不期望自己是数学家,我们希望下面的内容对你有用。

成为VIP会员查看完整内容
0
83

如果您不熟悉基础知识,则机器学习可能是一个困难的主题。借助本书,您将获得统计编程语言R在机器学习中使用的入门原则的坚实基础。您将从回归等基础知识开始,然后进入神经网络等更高级的主题,最后深入研究像Caret这样的软件包在R世界中机器学习的前沿。

通过熟悉诸如理解回归模型和分类模型之间的差异之类的主题,您将能够解决一系列机器学习问题。知道何时使用特定模型可能意味着高精度模型与完全无用的模型之间的区别。本书提供了大量示例来构建机器学习的实用知识。

了解机器学习算法的主要部分: 认识到如何使用机器学习以简单的方式解决问题 找出何时使用某些机器学习算法与其他算法 了解如何使用最先进的软件包实施算法

成为VIP会员查看完整内容
0
32

机器学习使用各种数学领域的工具。本文试图对机器学习入门课程所需的数学背景进行总结,这门课在加州大学伯克利分校被称为CS 189/289A。我们假设读者已经熟悉多变量微积分和线性代数的基本概念(UCB数学53/54的水平)。这里介绍的大多数主题都很少涉及; 我们打算给出一个概述,并向感兴趣的读者指出更全面的处理以获得进一步的细节。请注意,本文关注的是机器学习的数学背景,而不是机器学习本身。我们将不讨论具体的机器学习模型或算法,除非可能通过强调数学概念的相关性。该文件的早期版本不包括校样。我们已开始在有助于理解的相当短的证明里加上证明。这些证明不是cs189的必要背景,但可以用来加深读者的理解。

成为VIP会员查看完整内容
0
123

这本书来自统计学习课程,这是一门统计机器学习的入门课程,面向具有一些微积分、线性代数和统计学背景的学生。这门课程的重点是监督学习:分类和回归。本课程将涵盖机器学习和数据科学中使用的一系列方法,包括:

  • 线性回归(包括岭回归和Lasso)
  • 通过logistic回归和k近邻进行分类
  • 线性和二次判别分析
  • 回归和分类树(包括套袋林和随机林)
  • Boosting
  • 神经网络和深度学习

这些方法将在整个课程中被研究并应用于来自各种应用的真实数据。课程还涵盖了一些重要的实际问题,如交叉验证、模型选择和偏方差权衡。课程包括理论(例如,推导和证明)以及实践(特别是实验室和小型项目)。实际部分将使用Python实现。

成为VIP会员查看完整内容
0
117

在复杂的以人为中心的系统中,每天的决策都具有决策相关信息不完全的特点。现有决策理论的主要问题是,它们没有能力处理概率和事件不精确的情况。在这本书中,我们描述了一个新的理论的决策与不完全的信息。其目的是将决策分析和经济行为的基础从领域二价逻辑转向领域模糊逻辑和Z约束,从行为决策的外部建模转向组合状态的框架。

这本书将有助于在模糊逻辑,决策科学,人工智能,数学经济学,和计算经济学的专业人员,学者,经理和研究生。

读者:专业人士,学者,管理者和研究生在模糊逻辑,决策科学,人工智能,数学经济学,和计算经济学。

成为VIP会员查看完整内容
0
175

本书涵盖了这些领域中使用Python模块演示的概率、统计和机器学习的关键思想。整本书包括所有的图形和数值结果,都可以使用Python代码及其相关的Jupyter/IPython Notebooks。作者通过使用多种分析方法和Python代码的有意义的示例,开发了机器学习中的关键直觉,从而将理论概念与具体实现联系起来。现代Python模块(如panda、y和Scikit-learn)用于模拟和可视化重要的机器学习概念,如偏差/方差权衡、交叉验证和正则化。许多抽象的数学思想,如概率论中的收敛性,都得到了发展,并用数值例子加以说明。本书适合任何具有概率、统计或机器学习的本科生,以及具有Python编程的基本知识的人。

成为VIP会员查看完整内容
0
163
小贴士
相关VIP内容
专知会员服务
60+阅读 · 10月8日
专知会员服务
63+阅读 · 8月30日
专知会员服务
57+阅读 · 8月12日
专知会员服务
57+阅读 · 8月4日
专知会员服务
83+阅读 · 7月27日
专知会员服务
123+阅读 · 1月8日
专知会员服务
117+阅读 · 2020年6月27日
专知会员服务
175+阅读 · 2020年6月24日
专知会员服务
163+阅读 · 2020年6月3日
相关论文
G. Duchamp,Viincel Hoang Ngoc Minh,Vu Nguyen Dinh,Pierre Simonnet
0+阅读 · 10月25日
Xavier Caruso,Amaury Durand
0+阅读 · 10月25日
Weijia Yao,Hector Garcia de Marina,Bohuan Lin,Ming Cao
0+阅读 · 10月23日
Muhammad F. Kasim,Susi Lehtola,Sam M. Vinko
0+阅读 · 10月22日
Nicole Mücke,Enrico Reiss,Jonas Rungenhagen,Markus Klein
0+阅读 · 10月21日
Daoping Zhang,Gary P. T. Choi,Jianping Zhang,Lok Ming Lui
0+阅读 · 10月20日
TrungTin Nguyen,Faicel Chamroukhi,Hien D Nguyen,Geoffrey J McLachlan
0+阅读 · 10月19日
Peter L. Bartlett,Andrea Montanari,Alexander Rakhlin
14+阅读 · 3月16日
Top