381页机器学习数学基础PDF下载

2018 年 10 月 9 日 专知
381页机器学习数学基础PDF下载

【导读】近期,由Marc Peter Deisenroth,A Aldo Faisal和Cheng Soon Ong撰写的《机器学习数学基础》“Mathematics for Machine Learning” 381页草稿版本已经放出,作者表示撰写这本书旨在激励人们学习数学概念。这本书并不打算涵盖前沿的机器学习技术,因为已经有很多书这样做了。相反,作者的目标是通过该书提供阅读其他书籍所需的数学基础。这本书分为两部分:数学基础知识和使用数学基础知识进行机器学习算法示例。值得初学者收藏和学习!

 

前言(Foreword)

随着机器学习变得越来越普遍,它的软件包也越来越容易使用。一些低级的技术细节被抽象出来,并对实践者隐藏起来,这是很自然的,也是可取的。然而,这带来了一些风险,即实践者不知道设计决策,因此不知道机器学习算法的局限性。


有兴趣了解机器学习算法背后机制的实践者需要具备如下的先验知识:

  • 编程语言和数据分析工具

  • 大规模计算和相关框架

  • 数学和统计学知识,以及机器学习是如何基于这些知识构建的

 

在大学里,关于机器学习的入门课程往往会在课程的早期部分涉及到以上这些先验知识。由于历史原因,机器学习的课程倾向于在计算机科学系进行授课。在计算机科学系,学生通常在前两个知识领域受到的训练比较多,但在数学和统计学方面的训练较少。目前的一些机器学习教科书试图加入一到两章的内容来介绍数学背景知识,但是这些介绍要么在书的开头,要么作为附录。本书将机器学习中的数学基础知识放在首位,并且信息相对集中。

 

【为什么要写一本关于机器学习的书?】


机器学习建立在数学语言的基础上,用来表达直观上显而易见但却难以形式化的概念。一旦正确地形式化,我们就可以使用数学工具来得出我们设计选择的结果。这使我们能够深入了解我们正在解决的任务以及智能的本质。全球数学系学生普遍抱怨的一个问题是,数学所涵盖的主题似乎与实际问题没有太多关联。我们认为机器学习是人们学习数学的一个明显而直接的动机。


作者希望这本书可以成为一本指导机器学习大量数学基础的指南。作者通过直接指出数学概念在基本机器学习问题中的有用性来激发对数学概念的需求。为了使书简短,许多细节和更先进的概念都被省略了。书中介绍了一些基本概念,以及这些概念如何适用于机器学习的大背景,读者可以找到大量的资源进行进一步研究。对于有数学背景的读者,这本书提供了一个简短但精确的机器学习入门介绍。书中只提供四个代表性的经典的机器学习算法示例。作者关注的是模型本身背后的数学概念,目的是阐明它们的抽象美。作者希望所有的读者都能对机器学习的基本问题有更深入的了解,并将机器学习的实际问题与数学模型的基本选择联系起来。


【谁是目标受众】


随着机器学习在社会中的广泛应用,作者相信每个人都应该对它的基本原理有一些了解。这本书是用学术数学的风格来写的,这使读者能够精确地了解机器学习背后的概念。作者鼓励不熟悉这种简洁的风格的读者坚持阅读下去,并牢记每个主题的目标。作者在整篇文章中都有标记和评论,希望这些评论能对读者提供一些有用的指导。此外,本书假定读者具备高中数学和物理中常用的数学知识。例如,导数和积分,以及二维或三维的几何向量。因此,本书的目标受众包括普通大学生、夜校生和机器学习在线课程的学习者等等。

 

简介(Introduction)


本书分为两部分,第一部分是数学基础的讲解,第二部分是将第一部分的数学概念应用于基本的机器学习问题中,从而形成“机器学习四大支柱”,如下图所示:


 

这本书的第一部分描述了关于机器学习系统的三个主要组成部分的数学概念和数学基础:数据、模型和学习。在本书中,作者假设数据已经被适当地转换成适合于阅读的数字表示形式,并被转换成计算机程序。在这本书中,作者认为数据是向量。模型是现实世界的简化版本,它捕获与任务相关的现实世界的各个方面。模型的用户需要理解模型没有捕捉到什么,从而理解模型的局限性。概括起来就是,作者使用领域知识将数据表示为向量。并选择一个合适的模型,要么使用概率方法,要么使用优化方法。采用数值优化的方法,对过去的数据进行学习,目的是它在看不见的数据上表现良好。

 

本书第二部分介绍了上图所示的机器学习四大支柱,如下表所示。表中的每一行区分了相关变量是连续的还是非连续的类别的问题。 作者解释了如何将本书第一部分介绍的数学概念应用于机器学习算法的设计中。在第8章中,作者以数学的方式重述了机器学习的三个组成部分(数据、模型和学习)。此外,作者还提供了一些建立实验设置的指南,以防止对机器学习系统过于乐观的评估。

此外,作者在第一部分提供了一些练习,这些练习大部分可以用笔和纸来完成。在第二部分中,作者提供了一些编程教程(jupyter记事本)来探索在本书中讨论的机器学习算法的一些特性。


请关注专知公众号(扫一扫最下面专知二维码,或者点击上方蓝色专知)

  • 后台回复“MML2018” 就可以获取全书381页 PDF下载链接~ 


全书配套网站:https://mml-book.com


全文目录如下:

-END-

专 · 知


人工智能领域26个主题知识资料全集获取与加入专知人工智能服务群: 欢迎微信扫一扫加入专知人工智能知识星球群,获取专业知识教程视频资料和与专家交流咨询!


请PC登录www.zhuanzhi.ai或者点击阅读原文,注册登录专知,获取更多AI知识资料!


请加专知小助手微信(扫一扫如下二维码添加),加入专知主题群(请备注主题类型:AI、NLP、CV、 KG等)交流~

 AI 项目技术 & 商务合作:bd@zhuanzhi.ai, 或扫描上面二维码联系!

请关注专知公众号,获取人工智能的专业知识!

点击“阅读原文”,使用专知

登录查看更多
74

相关内容

机器学习使用来自各种数学领域的工具。本文件试图提供一个概括性的数学背景,需要在入门类的机器学习,这是在加州大学伯克利分校被称为CS 189/289A。

https://people.eecs.berkeley.edu/~jrs/189/

我们的假设是读者已经熟悉多变量微积分和线性代数的基本概念(达到UCB数学53/54的水平)。我们强调,本文档不是对必备类的替代。这里介绍的大多数主题涉及的很少;我们打算给出一个概述,并指出感兴趣的读者更全面的理解进一步的细节。

请注意,本文档关注的是机器学习的数学背景,而不是机器学习本身。我们将不讨论特定的机器学习模型或算法,除非可能顺便强调一个数学概念的相关性。

这份文件的早期版本不包括校样。我们已经开始在一些证据中加入一些比较简短并且有助于理解的证据。这些证明不是cs189的必要背景,但可以用来加深读者的理解。

成为VIP会员查看完整内容
0
174

本备忘单是机器学习手册的浓缩版,包含了许多关于机器学习的经典方程和图表,旨在帮助您快速回忆起机器学习中的知识和思想。

这个备忘单有两个显著的优点:

  1. 清晰的符号。数学公式使用了许多令人困惑的符号。例如,X可以是一个集合,一个随机变量,或者一个矩阵。这是非常混乱的,使读者很难理解数学公式的意义。本备忘单试图规范符号的使用,所有符号都有明确的预先定义,请参见小节。

  2. 更少的思维跳跃。在许多机器学习的书籍中,作者省略了数学证明过程中的一些中间步骤,这可能会节省一些空间,但是会给读者理解这个公式带来困难,读者会在中间迷失。

成为VIP会员查看完整内容
0
218

由Marc Peter Deisenroth,A Aldo Faisal和Cheng Soon Ong撰写的《机器学习数学基础》“Mathematics for Machine Learning” 最新版417页pdf版本已经放出,作者表示撰写这本书旨在激励人们学习数学概念。这本书并不打算涵盖前沿的机器学习技术,因为已经有很多书这样做了。相反,作者的目标是通过该书提供阅读其他书籍所需的数学基础。这本书分为两部分:数学基础知识和使用数学基础知识进行机器学习算法示例。值得初学者收藏和学习!

目录

Part I: 数据基础

  • Introduction and Motivation
  • Linear Algebra
  • Analytic Geometry
  • Matrix Decompositions
  • Vector Calculus
  • Probability and Distribution
  • Continuous Optimization

Part II: 机器学习问题

  • When Models Meet Data
  • Linear Regression
  • Dimensionality Reduction with Principal Component Analysis
  • Density Estimation with Gaussian Mixture Models
  • Classification with Support Vector Machines
成为VIP会员查看完整内容
0
152
小贴士
相关资讯
机器学习必备的数学基础有哪些?
人工智能头条
10+阅读 · 2019年10月18日
421页《机器学习数学基础》最新2019版PDF下载
【资源】机器学习算法工程师手册(PDF下载)
机器学习算法与Python学习
32+阅读 · 2018年10月14日
机器学习数学基础【附PPT下载】
专知
37+阅读 · 2018年9月17日
第二章 机器学习中的数学基础
Datartisan数据工匠
9+阅读 · 2018年4月5日
机器学习实践指南
Linux中国
4+阅读 · 2017年9月28日
相关VIP内容
机器学习速查手册,135页pdf
专知会员服务
218+阅读 · 2020年3月15日
【2020新书】简明机器学习导论,电子书与500页PPT
专知会员服务
187+阅读 · 2020年2月7日
【机器学习课程】Google机器学习速成课程
专知会员服务
94+阅读 · 2019年12月2日
【电子书】机器学习实战(Machine Learning in Action),附PDF
专知会员服务
84+阅读 · 2019年11月25日
相关论文
Emmanuel Bengio,Joelle Pineau,Doina Precup
8+阅读 · 2020年3月13日
CAN-NER: Convolutional Attention Network for Chinese Named Entity Recognition
Yuying Zhu,Guoxin Wang,Börje F. Karlsson
5+阅读 · 2019年4月30日
Kwonjoon Lee,Subhransu Maji,Avinash Ravichandran,Stefano Soatto
4+阅读 · 2019年4月23日
Piotr Szymański,Tomasz Kajdanowicz,Nitesh Chawla
3+阅读 · 2019年1月1日
Elior Sulem,Omri Abend,Ari Rappoport
3+阅读 · 2018年10月11日
Yong Wang,Xiao-Ming Wu,Qimai Li,Jiatao Gu,Wangmeng Xiang,Lei Zhang,Victor O. K. Li
9+阅读 · 2018年7月8日
Di Lu,Spencer Whitehead,Lifu Huang,Heng Ji,Shih-Fu Chang
7+阅读 · 2018年4月21日
Dianqi Li,Qiuyuan Huang,Xiaodong He,Lei Zhang,Ming-Ting Sun
10+阅读 · 2018年4月11日
Yi-Nan Li,Mei-Chen Yeh
5+阅读 · 2018年2月21日
Yeeleng S. Vang,Zhen Chen,Xiaohui Xie
9+阅读 · 2018年2月3日
Top
微信扫码咨询专知VIP会员