机器学习和人工神经网络无处不在,它们对我们日常生活的影响比我们可能意识到的还要深远。这堂课是专门针对机器学习在不同科学领域的使用的介绍。在科学研究中,我们看到机器学习的应用越来越多,反映了工业技术的发展。这样一来,机器学习就成为了精确科学的通用新工具,与微积分、传统统计学和数值模拟等方法并行其道。这就提出了一个问题,在图2所示的科学工作流程中,这些新方法是最好的。

此外,一旦确定了一项特定的任务,将机器学习应用到科学领域就会面临非常具体的挑战: (i) 科学数据通常具有非常特定的结构,例如晶体图像中近乎完美的周期性; (ii) 通常情况下,我们对应该反映在机器学习分析中的数据相关性有特定的知识; (iii) 我们想要了解为什么一个特定的算法会起作用,寻求对自然机制和法则的基本见解; (iv) 在科学领域,我们习惯于算法和定律提供确定性答案,而机器学习本质上是概率性的——不存在绝对的确定性。尽管如此,定量精度在许多科学领域是至关重要的,因此是机器学习方法的一个关键基准。

这堂课是为科学领域的科学家和学生介绍基本机器学习算法。我们将涵盖:

  • 最基本的机器学习算法,
  • 该领域的术语,简要解释,
  • 监督和无监督学习的原理,以及为什么它是如此成功,
  • 各种人工神经网络的架构和它们适合的问题,
  • 我们如何发现机器学习算法使用什么来解决问题

机器学习领域充满了行话,对于不了解机器学习的人来说,这些行话掩盖了机器学习方法的核心。作为一个不断变化的领域,新的术语正在以快速的速度被引入。我们的目标是通过精确的数学公式和简洁的公式来切入俚语,为那些了解微积分和线性代数的人揭开机器学习概念的神秘面纱。

如上所述,数据是本节课所讨论的大多数机器学习方法的核心。由于原始数据在很多情况下非常复杂和高维,首先更好地理解数据并降低它们的维数往往是至关重要的。下一节,第2节将讨论在转向神经网络的重型机器之前可以使用的简单算法。

我们最关注的机器学习算法,一般可以分为两类算法,即判别算法和生成算法,如图3所示。判别任务的例子包括分类问题,如上述数字分类或分类为固体,液体和气相给出一些实验观测。同样,回归,也就是估计变量之间的关系,也是一个判别问题。更具体地说,我们在给定一些输入数据x的情况下,尝试近似某个变量y (label)的条件概率分布P(y|x)。由于这些任务中的大部分数据都是以输入数据和目标数据的形式提供的,这些算法通常采用监督学习。判别算法最直接地适用于科学,我们将在第3和第4节中讨论它们。

人工智能的前景可能引发科学领域的不合理预期。毕竟,科学知识的产生是最复杂的智力过程之一。计算机算法肯定还远没有达到那样复杂的水平,而且在不久的将来也不会独立地制定新的自然法则。尽管如此,研究人员研究了机器学习如何帮助科学工作流程的各个部分(图2)。虽然制定牛顿经典力学定律所需的抽象类型似乎难以置信地复杂,但神经网络非常擅长隐式知识表示。然而,要准确地理解它们是如何完成某些任务的,并不是一件容易的事情。我们将在第6节讨论这个可解释的问题。

第三类算法被称为强化学习(reinforcement learning),它不完全符合近似统计模型的框架. 机器学习的成功很大程度上与科学家使用适当算法的经验有关。因此,我们强烈建议认真解决伴随练习,并充分利用练习课程。

成为VIP会员查看完整内容
69

相关内容

“机器学习是近20多年兴起的一门多领域交叉学科,涉及概率论、统计学、逼近论、凸分析、算法复杂度理论等多门学科。机器学习理论主要是设计和分析一些让 可以自动“ 学习”的算法。机器学习算法是一类从数据中自动分析获得规律,并利用规律对未知数据进行预测的算法。因为学习算法中涉及了大量的统计学理论,机器学习与统计推断学联系尤为密切,也被称为统计学习理论。算法设计方面,机器学习理论关注可以实现的,行之有效的学习算法。很多 推论问题属于 无程序可循难度,所以部分的机器学习研究是开发容易处理的近似算法。” ——中文维基百科

知识荟萃

精品入门和进阶教程、论文和代码整理等

更多

查看相关VIP内容、论文、资讯等
【斯坦福经典书】机器学习导论,188页pdf
专知会员服务
78+阅读 · 2021年3月31日
【经典书】R机器学习入门:严格的数学分析,225页pdf
专知会员服务
62+阅读 · 2021年2月16日
专知会员服务
182+阅读 · 2021年1月8日
最新《机器学习:基本原理》2021新书,209页pdf
专知会员服务
133+阅读 · 2020年10月24日
最新《高斯过程回归简明教程》,19页pdf
专知会员服务
72+阅读 · 2020年9月30日
【经典书】人工智能及机器学习导论,457页pdf
专知会员服务
163+阅读 · 2020年7月5日
【干货书】《机器学习导论(第二版)》,348页pdf
专知会员服务
248+阅读 · 2020年6月16日
【2020新书】简明机器学习导论,电子书与500页PPT
专知会员服务
202+阅读 · 2020年2月7日
吴恩达机器学习课程
平均机器
9+阅读 · 2018年2月5日
机器学习翻译基本原理
论智
5+阅读 · 2017年12月21日
干货|掌握机器学习数学基础之优化[1](重点知识)
机器学习研究会
10+阅读 · 2017年11月19日
如何用 3 个月零基础入门机器学习?
AI研习社
6+阅读 · 2017年9月27日
Fashion Meets Computer Vision: A Survey
Arxiv
5+阅读 · 2020年3月31日
Arxiv
6+阅读 · 2018年10月3日
Arxiv
3+阅读 · 2018年8月17日
The Matrix Calculus You Need For Deep Learning
Arxiv
12+阅读 · 2018年7月2日
Arxiv
7+阅读 · 2018年5月23日
VIP会员
相关VIP内容
【斯坦福经典书】机器学习导论,188页pdf
专知会员服务
78+阅读 · 2021年3月31日
【经典书】R机器学习入门:严格的数学分析,225页pdf
专知会员服务
62+阅读 · 2021年2月16日
专知会员服务
182+阅读 · 2021年1月8日
最新《机器学习:基本原理》2021新书,209页pdf
专知会员服务
133+阅读 · 2020年10月24日
最新《高斯过程回归简明教程》,19页pdf
专知会员服务
72+阅读 · 2020年9月30日
【经典书】人工智能及机器学习导论,457页pdf
专知会员服务
163+阅读 · 2020年7月5日
【干货书】《机器学习导论(第二版)》,348页pdf
专知会员服务
248+阅读 · 2020年6月16日
【2020新书】简明机器学习导论,电子书与500页PPT
专知会员服务
202+阅读 · 2020年2月7日
相关资讯
吴恩达机器学习课程
平均机器
9+阅读 · 2018年2月5日
机器学习翻译基本原理
论智
5+阅读 · 2017年12月21日
干货|掌握机器学习数学基础之优化[1](重点知识)
机器学习研究会
10+阅读 · 2017年11月19日
如何用 3 个月零基础入门机器学习?
AI研习社
6+阅读 · 2017年9月27日
相关论文
微信扫码咨询专知VIP会员