在一头扎进机器学习前应该知道的那些事儿 - 专知

会员服务 ·

0

在一头扎进机器学习前应该知道的那些事儿

2018 年 4 月 24 日 全球人工智能

高薪招聘兼职AI讲师和AI助教！

摘要：本文简单总结了机器学习的几大任务及其对应的方法，方便初学者根据自己的任务选择合适的方法。当掌握机器学习基本知识以及清楚自己所要处理的任务后，应用机器学习就不会那么难了。

机器学习一直是一个火热的研究领域，深度学习方法的提出又为这个领域添了一把火，使得很多人对该领域感兴趣并想投身于该领域的研究之中。那么，对于想从事机器学习领域的人来说，有哪些是应该首先了解的内容呢？本文将简单的介绍下机器学习的基本相关知识。
机器学习是指使计算机系统使用统计技术学习数据的过程，而不需要具体的编程程序。该方法是一个主动学习的算法，使得它能够从数据中学习并进行预测。机器学习与计算统计、数学优化以及数据学习密切相关，通常被用来进行预测、分析等任务。机器学习一般用于处理两类任务：

有监督学习：输入给计算机的示例带有标签（期望输出），基于标签调整建立的模型，以学习输入到输出的映射规则。
无监督学习：输入给计算机的示例没有标签，建立的模型必须通过自身学习产生输出。无监督学习涉及到从数据中发现隐藏的模式，包含特征学习。
机器学习这个术语对于大多非该领域的人来说听起来很高级，但其实不然。只要你清楚机器学习的基本概念以及相关方法后，机器学习其实很简单，即根据相关任务，选择合适的机器学习方法，让机器学习并处理特征以完成相应的任务。因此，在学习和应用机器学习之前，我们首先应该明确自己的任务是什么，以及适合使用哪种机器学习方法来完成。

如果我们想了解算法背后的基本理论以及其工作原理，那么精通概率与统计、线性代数和微积分对我们而言显得至关重要。此外，了解诸如Python等编程语言将使你能够容易得实现相关算法，理论基础与编程能力二者在手，机器学习我有。此外，理解相关的数学知识和应用也是很有必要的，无论是通过线下自学或者是网络在线培训等学习方法，都必须实践，实践可以增加自己对基本知识的理解，同时也能锻炼其编程能力。
在学习机器学习之前，掌握以下知识是很有必要的：

线性代数
微积分
概率论
程序设计
最优化理论
下面是一些最常见的机器学习任务以及相关方法，对其理解后方便在后续工程中应用。

回归

回归主要涉及连续变量或数值变量的估计，比如估计房价、股票价格、产品价格等使用回归估计。即根据相关的数据建立回归曲线，对新的数据进行预测估计。以下机器学习方法用于解决回归问题：

核回归（Kernel regression）
支持向量回归（Support vector regression）
高斯过程回归（Gaussian process regression）
线性回归（Linear regression）
LASSO回归（Least absolute shrinkage and selection operator）
回归树（Regression tree）

分类

分类与离散变量或数据类别的预测有关。比如区分垃圾邮件、病人患有哪种疾病、交易是否属于欺诈行为等任务，都是使用分类方法处理的。以下方法可以用于解决分类问题：

核判别分析（Kernel discriminant analysis）
人工神经网络（Artificial neural networks）
K邻近算法（K-nearests neighbors）
Boosted trees
随机森林（Random forests）
逻辑回归（Logistic regression）
支持向量机（Support vector machine）
深度学习（Deep learning）
朴素贝叶斯（Naive Bayes）
决策树（Decision trees）

聚类

聚类一般应用于数据自然分组。比如产品特征识别、客户细分等任务都是聚类的一些应用场景。以下机器学习方法用于聚类问题：

均值漂移（Mean-shift）
K-均值（K-means）
主题模型（Topic models）
层次聚类（Hierarchical clustering）

多元查询

多元查询是用来寻找相似目标。下面的方法可用于解决与多元查询有关的问题：

近邻取样（Nearest neighbors）
最远邻居（Farthest neighbors）
范围搜索（Range search）

降维

降维是指降低多个随机变量的维度，将其分为特征提取和特征选择。常用的降维方法如下：

流线学习方法/核主成分分析（Manifold learning/KPCA）
独立分量分析（Independent component analysis）
主成分分析（Principal component analysis）
非负矩阵分解（Non-negative matrix factorization）
压缩感知（Compressed sensing）
高斯图模型（Gaussian graphical models）

－今晚直播预告－

点击“阅读原文”进入学习

登录查看更多

3

相关内容

机器学习

“机器学习是近20多年兴起的一门多领域交叉学科，涉及概率论、统计学、逼近论、凸分析、算法复杂度理论等多门学科。机器学习理论主要是设计和分析一些让可以自动“ 学习”的算法。机器学习算法是一类从数据中自动分析获得规律，并利用规律对未知数据进行预测的算法。因为学习算法中涉及了大量的统计学理论，机器学习与统计推断学联系尤为密切，也被称为统计学习理论。算法设计方面，机器学习理论关注可以实现的，行之有效的学习算法。很多推论问题属于无程序可循难度，所以部分的机器学习研究是开发容易处理的近似算法。” ——中文维基百科

知识荟萃

精品入门和进阶教程、论文和代码整理等

更多

查看相关VIP内容、论文、资讯等

【2020新书】从Excel中学习数据挖掘，223页pdf

【2020新书】从Excel中学习数据挖掘，223页pdf

专知会员服务

93+阅读 · 2020年6月28日

【斯坦福大学博士论文】机器学习中的凸优化问题,108页pdf

【斯坦福大学博士论文】机器学习中的凸优化问题,108页pdf

专知会员服务

162+阅读 · 2020年6月14日

【实用书】Python机器学习Scikit-Learn应用指南，247页pdf

【实用书】Python机器学习Scikit-Learn应用指南，247页pdf

专知会员服务

270+阅读 · 2020年6月10日

《Python机器学习项目实战》，135页pdf带你小白入门机器学习

《Python机器学习项目实战》，135页pdf带你小白入门机器学习

专知会员服务

174+阅读 · 2020年6月6日

【硬核书】理解机器学习：从理论到算法，449页pdf深度理解机器学习

【硬核书】理解机器学习：从理论到算法，449页pdf深度理解机器学习

专知会员服务

317+阅读 · 2020年5月28日

【干货书】机器学习，408页pdf，开发人员和技术专业人员的动手实践手册

【干货书】机器学习，408页pdf，开发人员和技术专业人员的动手实践手册

专知会员服务

218+阅读 · 2020年5月7日

【2020新书】数据科学:十大Python项目，247页pdf

【2020新书】数据科学:十大Python项目，247页pdf

专知会员服务

216+阅读 · 2020年2月21日

【经典书】精通机器学习特征工程，中文版，178页pdf

【经典书】精通机器学习特征工程，中文版，178页pdf

专知会员服务

360+阅读 · 2020年2月15日

人工智能学习笔记，247页pdf

人工智能学习笔记，247页pdf

专知会员服务

187+阅读 · 2019年12月14日

【经典】深度学习数学宝典《深度学习所需要的矩阵微积分》

【经典】深度学习数学宝典《深度学习所需要的矩阵微积分》

专知会员服务

286+阅读 · 2019年12月2日

机器学习必备的数学基础有哪些？

机器学习必备的数学基础有哪些？

人工智能头条

12+阅读 · 2019年10月18日

逃离数学焦虑、算法选择，思考做好机器学习项目的3个核心问题

逃离数学焦虑、算法选择，思考做好机器学习项目的3个核心问题

PaperWeekly

6+阅读 · 2019年2月18日

成为顶尖机器学习算法专家需要知道哪些算法？

成为顶尖机器学习算法专家需要知道哪些算法？

云栖社区

5+阅读 · 2018年10月13日

机器学习：从入门到绝不放弃！

机器学习：从入门到绝不放弃！

图灵教育

5+阅读 · 2018年3月19日

Python 如何快速入门？

Python 如何快速入门？

全球人工智能

6+阅读 · 2018年3月15日

关于机器学习，你需要知道的三件事！

关于机器学习，你需要知道的三件事！

云栖社区

3+阅读 · 2018年3月3日

最适合机器学习新手的10种算法

最适合机器学习新手的10种算法

论智

9+阅读 · 2018年1月23日

从0到1 | 0基础/转行如何用3个月搞定机器学习

从0到1 | 0基础/转行如何用3个月搞定机器学习

算法与数学之美

4+阅读 · 2017年11月20日

快速掌握机器学习，这 3 种算法你必须知道

快速掌握机器学习，这 3 种算法你必须知道

开源中国

8+阅读 · 2017年11月9日

难？不难？机器学习套路就这三个！

难？不难？机器学习套路就这三个！

聊聊架构

3+阅读 · 2017年10月25日

Multi-Label Classification with Label Graph Superimposing

Arxiv

9+阅读 · 2019年11月21日

Meta-Learning with Implicit Gradients

Meta-Learning with Implicit Gradients

Arxiv

13+阅读 · 2019年9月10日

Revisiting CycleGAN for semi-supervised segmentation

Revisiting CycleGAN for semi-supervised segmentation

Arxiv

3+阅读 · 2019年8月30日

Learning a Deep ConvNet for Multi-label Classification with Partial Labels

Learning a Deep ConvNet for Multi-label Classification with Partial Labels

Arxiv

6+阅读 · 2019年2月26日

Generalization and Regularization in DQN

Generalization and Regularization in DQN

Arxiv

6+阅读 · 2019年1月30日

q-Space Novelty Detection with Variational Autoencoders

q-Space Novelty Detection with Variational Autoencoders

Arxiv

3+阅读 · 2018年10月25日

Generalizing Across Multi-Objective Reward Functions in Deep Reinforcement Learning

Generalizing Across Multi-Objective Reward Functions in Deep Reinforcement Learning

Arxiv

5+阅读 · 2018年9月17日

Weakly-Supervised Semantic Segmentation by Iteratively Mining Common Object Features

Arxiv

3+阅读 · 2018年6月12日

Universal Language Model Fine-tuning for Text Classification

Arxiv

3+阅读 · 2018年5月23日

AspEm: Embedding Learning by Aspects in Heterogeneous Information Networks

Arxiv

7+阅读 · 2018年3月5日

VIP会员

相关主题

应用机器学习

无监督学习

相关VIP内容

【2020新书】从Excel中学习数据挖掘，223页pdf

【2020新书】从Excel中学习数据挖掘，223页pdf

专知会员服务

93+阅读 · 2020年6月28日

【斯坦福大学博士论文】机器学习中的凸优化问题,108页pdf

【斯坦福大学博士论文】机器学习中的凸优化问题,108页pdf

专知会员服务

162+阅读 · 2020年6月14日

【实用书】Python机器学习Scikit-Learn应用指南，247页pdf

【实用书】Python机器学习Scikit-Learn应用指南，247页pdf

专知会员服务

270+阅读 · 2020年6月10日

《Python机器学习项目实战》，135页pdf带你小白入门机器学习

《Python机器学习项目实战》，135页pdf带你小白入门机器学习

专知会员服务

174+阅读 · 2020年6月6日

【硬核书】理解机器学习：从理论到算法，449页pdf深度理解机器学习

【硬核书】理解机器学习：从理论到算法，449页pdf深度理解机器学习

专知会员服务

317+阅读 · 2020年5月28日

【干货书】机器学习，408页pdf，开发人员和技术专业人员的动手实践手册

【干货书】机器学习，408页pdf，开发人员和技术专业人员的动手实践手册

专知会员服务

218+阅读 · 2020年5月7日

【2020新书】数据科学:十大Python项目，247页pdf

【2020新书】数据科学:十大Python项目，247页pdf

专知会员服务

216+阅读 · 2020年2月21日

【经典书】精通机器学习特征工程，中文版，178页pdf

【经典书】精通机器学习特征工程，中文版，178页pdf

专知会员服务

360+阅读 · 2020年2月15日

人工智能学习笔记，247页pdf

人工智能学习笔记，247页pdf

专知会员服务

187+阅读 · 2019年12月14日

【经典】深度学习数学宝典《深度学习所需要的矩阵微积分》

【经典】深度学习数学宝典《深度学习所需要的矩阵微积分》

专知会员服务

286+阅读 · 2019年12月2日

热门VIP内容

开通专知VIP会员享更多权益服务

数据要素发展报告(2025年)：附下载

人工智能代理提升战时舰船战备水平

【NeurIPS2025教程】大语言模型规划

NeurIPS 2025 教程：深度学习训练不稳定性的理论洞见

相关资讯

机器学习必备的数学基础有哪些？

机器学习必备的数学基础有哪些？

人工智能头条

12+阅读 · 2019年10月18日

逃离数学焦虑、算法选择，思考做好机器学习项目的3个核心问题

逃离数学焦虑、算法选择，思考做好机器学习项目的3个核心问题

PaperWeekly

6+阅读 · 2019年2月18日

成为顶尖机器学习算法专家需要知道哪些算法？

成为顶尖机器学习算法专家需要知道哪些算法？

云栖社区

5+阅读 · 2018年10月13日

机器学习：从入门到绝不放弃！

机器学习：从入门到绝不放弃！

图灵教育

5+阅读 · 2018年3月19日

Python 如何快速入门？

Python 如何快速入门？

全球人工智能

6+阅读 · 2018年3月15日

关于机器学习，你需要知道的三件事！

关于机器学习，你需要知道的三件事！

云栖社区

3+阅读 · 2018年3月3日

最适合机器学习新手的10种算法

最适合机器学习新手的10种算法

论智

9+阅读 · 2018年1月23日

从0到1 | 0基础/转行如何用3个月搞定机器学习

从0到1 | 0基础/转行如何用3个月搞定机器学习

算法与数学之美

4+阅读 · 2017年11月20日

快速掌握机器学习，这 3 种算法你必须知道

快速掌握机器学习，这 3 种算法你必须知道

开源中国

8+阅读 · 2017年11月9日

难？不难？机器学习套路就这三个！

难？不难？机器学习套路就这三个！

聊聊架构

3+阅读 · 2017年10月25日

相关论文

Multi-Label Classification with Label Graph Superimposing

Arxiv

9+阅读 · 2019年11月21日

Meta-Learning with Implicit Gradients

Meta-Learning with Implicit Gradients

Arxiv

13+阅读 · 2019年9月10日

Revisiting CycleGAN for semi-supervised segmentation

Revisiting CycleGAN for semi-supervised segmentation

Arxiv

3+阅读 · 2019年8月30日

Learning a Deep ConvNet for Multi-label Classification with Partial Labels

Learning a Deep ConvNet for Multi-label Classification with Partial Labels

Arxiv

6+阅读 · 2019年2月26日

Generalization and Regularization in DQN

Generalization and Regularization in DQN

Arxiv

6+阅读 · 2019年1月30日

q-Space Novelty Detection with Variational Autoencoders

q-Space Novelty Detection with Variational Autoencoders

Arxiv

3+阅读 · 2018年10月25日

Generalizing Across Multi-Objective Reward Functions in Deep Reinforcement Learning

Generalizing Across Multi-Objective Reward Functions in Deep Reinforcement Learning

Arxiv

5+阅读 · 2018年9月17日

Weakly-Supervised Semantic Segmentation by Iteratively Mining Common Object Features

Arxiv

3+阅读 · 2018年6月12日

Universal Language Model Fine-tuning for Text Classification

Arxiv

3+阅读 · 2018年5月23日

AspEm: Embedding Learning by Aspects in Heterogeneous Information Networks

Arxiv

7+阅读 · 2018年3月5日

大家都在搜

大型语言模型

生成式人工智能

无人机系统

蓝牙安全攻防

朱克爱德华兹家族

冷启动，0预算，如何借助分销裂变引爆私域用户增长？

微信扫码咨询专知VIP会员