来自Andrew撰写的《 “简明机器学习”》旨在是发展对ML内部工作机制的直觉理解。我们使用简单直观的例子来解释复杂的概念、算法或方法,以及背后的所有数学。读完这本书,你将理解所有进入监督机器学习范围内的东西。你不仅能理解数学的本质细节,而且还能向任何人解释机器学习模型是如何工作的。

Andrew,MLOps工程师 https://www.awolf.io/

简明机器学习:监督学习

书的第一部分详细介绍了监督学习。我们将解释大部分术语-人工智能,数据科学,机器学习,深度学习,梯度下降,线性回归,过拟合和欠拟合,偏差和方差误差,基扩展和正则化。本书的第二部分尚未出版,但将涵盖所有已知的算法,包括logit模型、最大边际模型、贝叶斯模型、集成模型(boosting / bagging)、基于树的模型和评估指标。

地址: https://themlsbook.com/

有监督机器学习问题的典型流程。步骤一和步骤二负责提取和准备数据,步骤三负责构建机器学习模型(本书的其余部分将详细介绍这个过程中的步骤),步骤四负责部署模型。在一个小项目中,一个人可能可以完成所有的任务。然而,在一个大型项目中,步骤I和步骤II可能由数据科学专家执行,步骤III可能由数据科学家或机器学习操作执行,或MLOps,工程师执行,步骤IV可能由MLOps工程师执行。

基本AI: 基本AI是AI最简单的形式。它不会形成对过去经验的记忆来影响现在或未来的决定。换句话说,它不学习,它只对当前存在的条件做出反应。基本的人工智能通常利用由人类编码的一组预定义的简单规则。Basic AI的一个例子就是上面提到的智能电梯。

有限的人工智能: 有限的人工智能系统需要大量的信息或数据来做出决策。这样做的好处是,它们可以在没有明确编程的情况下做出决策。上面讨论的电子邮件垃圾邮件检测器是有限人工智能的一个例子——垃圾邮件检测器根据已知是垃圾邮件或不是垃圾邮件的电子邮件数据集学习预测电子邮件是否是垃圾邮件的规则。(通常,人类必须提供这些机器学习的标签。)机器学习是有限人工智能的主要和最著名的例子,电子邮件垃圾邮件检测器是监督ML的一个例子,我们将在下一节讨论。

先进的人工智能: 先进的人工智能系统将拥有人类的智能。例如,它们将能够驾驶你的汽车,识别你的脸,与其他人类对话,理解他们的情绪,并执行任何一个智能人类可以做的任务。这些系统通常被描述为计算“大脑”。

超级智能: 超级智能人工智能系统将拥有远远超过人类能力的智能。

本书详细介绍了数据准备和模型构建模块——图1.2的步骤II和步骤III。这本书也分为两部分。在第一部分,你将学习机器学习的基础知识,在第二部分,你将学习更复杂的机器学习算法的细节。我把这本书分成这两个部分是出于一个非常重要的原因。很多时候,人们听到某些强大的机器学习算法的名字,如支持向量机、神经网络或增强决策树,并对它们着迷。他们急于学习复杂的算法。你可以想象,如果他们不先学习简单的模型,就很难学习复杂的模型。但是,您可能还没有意识到,大多数ML模型都会遇到一些常见的问题和困难(比如过拟合),这些您将在下一章中了解。因此,虽然可能很想马上深入研究特定的算法,但你应该花时间来获得ML世界的高层图片以及它所建立的基本原则的所有细节(例如,从数学的角度来看,算法实际上是如何从数据中学习的)。这有点像用封面上的图片做拼图;当然,你可以在没有图像的情况下完成拼图,但这会花费更长的时间,而且你可能会犯很多错误。一旦你掌握了ML的基本原理,你将对这些常见问题有一个清晰的想法,你将能够理解如何避免常见的陷阱,无论你使用哪种学习算法用于特定的问题。

目录内容:

  1. 导论 Introduction
  2. 监督机器学习概述 Overview of Supervised Learning
  3. 模型学习 Model Learning
  4. 基本扩展 Basis Expansion & Regularization
  5. 模型选择 Model Selection
  6. 特征选择 Feature Selection
  7. 数据准备 Data Preparation
成为VIP会员查看完整内容
67

相关内容

“机器学习是近20多年兴起的一门多领域交叉学科,涉及概率论、统计学、逼近论、凸分析、算法复杂度理论等多门学科。机器学习理论主要是设计和分析一些让 可以自动“ 学习”的算法。机器学习算法是一类从数据中自动分析获得规律,并利用规律对未知数据进行预测的算法。因为学习算法中涉及了大量的统计学理论,机器学习与统计推断学联系尤为密切,也被称为统计学习理论。算法设计方面,机器学习理论关注可以实现的,行之有效的学习算法。很多 推论问题属于 无程序可循难度,所以部分的机器学习研究是开发容易处理的近似算法。” ——中文维基百科

知识荟萃

精品入门和进阶教程、论文和代码整理等

更多

查看相关VIP内容、论文、资讯等
专知会员服务
252+阅读 · 2021年10月8日
【干货书】Python机器学习,361页pdf
专知会员服务
264+阅读 · 2021年2月25日
干货|书籍《百页机器学习》推荐(附最新135页PDF下载)
专知会员服务
61+阅读 · 2020年9月22日
【2020新书】简明机器学习导论,电子书与500页PPT
专知会员服务
200+阅读 · 2020年2月7日
神经网络的基础数学,95页pdf
专知
25+阅读 · 2022年1月23日
干货 | 深入理解深度学习中的激活函数
计算机视觉life
16+阅读 · 2019年1月29日
资源 | 一文读懂深度学习(附学习资源)
AI100
14+阅读 · 2017年11月30日
国家自然科学基金
4+阅读 · 2014年12月31日
国家自然科学基金
0+阅读 · 2014年12月31日
国家自然科学基金
2+阅读 · 2013年12月31日
国家自然科学基金
4+阅读 · 2013年12月31日
国家自然科学基金
0+阅读 · 2012年12月31日
国家自然科学基金
4+阅读 · 2012年12月31日
国家自然科学基金
3+阅读 · 2012年12月31日
国家自然科学基金
4+阅读 · 2011年12月31日
国家自然科学基金
8+阅读 · 2008年12月31日
Arxiv
0+阅读 · 2022年4月20日
Meta-Learning to Cluster
Arxiv
17+阅读 · 2019年10月30日
Self-Attention Graph Pooling
Arxiv
13+阅读 · 2019年6月13日
Arxiv
26+阅读 · 2018年8月19日
VIP会员
相关基金
国家自然科学基金
4+阅读 · 2014年12月31日
国家自然科学基金
0+阅读 · 2014年12月31日
国家自然科学基金
2+阅读 · 2013年12月31日
国家自然科学基金
4+阅读 · 2013年12月31日
国家自然科学基金
0+阅读 · 2012年12月31日
国家自然科学基金
4+阅读 · 2012年12月31日
国家自然科学基金
3+阅读 · 2012年12月31日
国家自然科学基金
4+阅读 · 2011年12月31日
国家自然科学基金
8+阅读 · 2008年12月31日
微信扫码咨询专知VIP会员