最全机器学习族谱!

2019 年 6 月 27 日 凡人机器学习

今天的文章大神请忽略,主要是针对对机器学习一些关键概念还比较模糊的同学,希望通过这篇文章帮大家梳理

如果把机器学习的各种方式组合看成是机器学习家谱的话,这个家谱差不多有四个分支:

  1. 按学习时效性区分

  2. 按学习是否增量区分

  3. 按模型的深度学区分

  4. 按学习方式区分


看下整个的家谱结构图:

下面还是分别介绍一下~


按学习时效性区分


这一点比较好理解,离线学习就是常规的机器学习方式,通过历史收集的数据去训练模型。实时机器学习指的是通过线上实时产生的数据训练模型,数据源通常会是Kafka这样的流式数据源,训练框架目前比较主流的是Flink、Spark-stream等。


按是否增量区分

增量式算法的重要性体现在2个方面:

1)在实际的数据库中,数据量往往是逐渐增加的,因此,在面临新的数据时,学习方法应能对训练好的系统进行某些改动,以对新数据中蕴涵的知识进行学习。

2) 对一个训练好的系统进行修改的时间代价通常低于重新训练一个系统所需的代价。

增量学习背后衍生的道理可以通过一个例子说明。在社会圈或者自然界,很多事物的底层原理都是相通的。比如一个人会下象棋,那么他很容易去学习下围棋,因为无论是象棋和围棋,底层的一些逻辑是相同的。在模型层面,如果一个模型已经具备了对象棋知识的理解,那么就可以用迁移学习的方式让它在原有基础上去学习围棋,而不是重头学习。


按模型深度区分

一句话形容,深度学习模型深度深,浅层学习模型深度浅。还有一种方法是利用深度学习的深和浅层学习的宽,就是推荐系统中常用的Wide&Deep。


按学习方式区分


有监督学习:训练数据既有特征(feature)又有标签(label),通过训练,让机器可以自己找到特征和标签之间的联系,在面对只有特征没有标签的数据时,可以判断出标签。


无监督学习(unsupervised learning):训练样本的标记信息未知,目标是通过对无标记训练样本的学习来揭示数据的内在性质及规律,为进一步的数据分析提供基础,此类学习任务中研究最多、应用最广的是"聚类" (clustering),其他无监督算法还有:密度估计(densityestimation)、异常检测(anomaly detection) 等。


半监督学习:训练集同时包含有标记样本数据和未标记样本数据,不需要人工干预,让学习器不依赖外界交互、自动地利用未标记样本来提升学习性能,就是半监督学习。


强化学习:通过一些行为产生的反馈来促使模型的演进。举个例子,比如做一个自动驾驶模型,当模型对汽车发出某些预测指令之后,汽车会有相应的回馈,比如正常驾驶 or 发生碰撞。通过不断的学习环境的反馈,找到对自己最有利的判断模式,就是增化学习的原理。





登录查看更多
0

相关内容

“机器学习是近20多年兴起的一门多领域交叉学科,涉及概率论、统计学、逼近论、凸分析、算法复杂度理论等多门学科。机器学习理论主要是设计和分析一些让 可以自动“ 学习”的算法。机器学习算法是一类从数据中自动分析获得规律,并利用规律对未知数据进行预测的算法。因为学习算法中涉及了大量的统计学理论,机器学习与统计推断学联系尤为密切,也被称为统计学习理论。算法设计方面,机器学习理论关注可以实现的,行之有效的学习算法。很多 推论问题属于 无程序可循难度,所以部分的机器学习研究是开发容易处理的近似算法。” ——中文维基百科

知识荟萃

精品入门和进阶教程、论文和代码整理等

更多

查看相关VIP内容、论文、资讯等
【实用书】Python机器学习Scikit-Learn应用指南,247页pdf
专知会员服务
266+阅读 · 2020年6月10日
【经典书】机器学习高斯过程,266页pdf
专知会员服务
195+阅读 · 2020年5月2日
【干货书】机器学习Python实战教程,366页pdf
专知会员服务
340+阅读 · 2020年3月17日
机器学习速查手册,135页pdf
专知会员服务
341+阅读 · 2020年3月15日
【经典书】精通机器学习特征工程,中文版,178页pdf
专知会员服务
356+阅读 · 2020年2月15日
【新书】Pro 机器学习算法Python实现,379页pdf
专知会员服务
200+阅读 · 2020年2月11日
【机器学习课程】Google机器学习速成课程
专知会员服务
164+阅读 · 2019年12月2日
【机器学习】机器学习:未来十年研究热点
产业智能官
16+阅读 · 2018年11月4日
机器学习面试题,更有大厂内推机会
七月在线实验室
4+阅读 · 2018年4月10日
手把手带你玩转机器学习和深度学习
大数据技术
8+阅读 · 2018年1月3日
Python & 机器学习之项目实践 | 赠书
人工智能头条
14+阅读 · 2017年12月26日
【机器学习】从零开始入门机器学习算法实践
产业智能官
10+阅读 · 2017年12月1日
干货 | 从零开始入门机器学习算法实践
雷锋网
9+阅读 · 2017年11月30日
推荐|一份不错的机器学习笔记!
全球人工智能
22+阅读 · 2017年11月20日
机器学习必备手册
机器学习研究会
19+阅读 · 2017年10月24日
【机器学习】推荐13个机器学习框架
产业智能官
8+阅读 · 2017年9月10日
机器学习算法比较
我爱机器学习
4+阅读 · 2016年12月11日
Learning to See Through Obstructions
Arxiv
7+阅读 · 2020年4月2日
Heterogeneous Deep Graph Infomax
Arxiv
12+阅读 · 2019年11月19日
Arxiv
53+阅读 · 2018年12月11日
Arxiv
3+阅读 · 2018年9月12日
Arxiv
22+阅读 · 2018年8月30日
Arxiv
7+阅读 · 2018年5月23日
Arxiv
9+阅读 · 2018年4月12日
VIP会员
相关VIP内容
【实用书】Python机器学习Scikit-Learn应用指南,247页pdf
专知会员服务
266+阅读 · 2020年6月10日
【经典书】机器学习高斯过程,266页pdf
专知会员服务
195+阅读 · 2020年5月2日
【干货书】机器学习Python实战教程,366页pdf
专知会员服务
340+阅读 · 2020年3月17日
机器学习速查手册,135页pdf
专知会员服务
341+阅读 · 2020年3月15日
【经典书】精通机器学习特征工程,中文版,178页pdf
专知会员服务
356+阅读 · 2020年2月15日
【新书】Pro 机器学习算法Python实现,379页pdf
专知会员服务
200+阅读 · 2020年2月11日
【机器学习课程】Google机器学习速成课程
专知会员服务
164+阅读 · 2019年12月2日
相关资讯
【机器学习】机器学习:未来十年研究热点
产业智能官
16+阅读 · 2018年11月4日
机器学习面试题,更有大厂内推机会
七月在线实验室
4+阅读 · 2018年4月10日
手把手带你玩转机器学习和深度学习
大数据技术
8+阅读 · 2018年1月3日
Python & 机器学习之项目实践 | 赠书
人工智能头条
14+阅读 · 2017年12月26日
【机器学习】从零开始入门机器学习算法实践
产业智能官
10+阅读 · 2017年12月1日
干货 | 从零开始入门机器学习算法实践
雷锋网
9+阅读 · 2017年11月30日
推荐|一份不错的机器学习笔记!
全球人工智能
22+阅读 · 2017年11月20日
机器学习必备手册
机器学习研究会
19+阅读 · 2017年10月24日
【机器学习】推荐13个机器学习框架
产业智能官
8+阅读 · 2017年9月10日
机器学习算法比较
我爱机器学习
4+阅读 · 2016年12月11日
相关论文
Learning to See Through Obstructions
Arxiv
7+阅读 · 2020年4月2日
Heterogeneous Deep Graph Infomax
Arxiv
12+阅读 · 2019年11月19日
Arxiv
53+阅读 · 2018年12月11日
Arxiv
3+阅读 · 2018年9月12日
Arxiv
22+阅读 · 2018年8月30日
Arxiv
7+阅读 · 2018年5月23日
Arxiv
9+阅读 · 2018年4月12日
Top
微信扫码咨询专知VIP会员