【原创手写笔记】面试准备,关于Adaboost & GBDT算法你需要知道的那些

2020 年 3 月 9 日 深度学习自然语言处理

点击上方,选择星标置顶,每天给你送干货

阅读大概需要15分钟

跟随小博主,每天进步一丢丢


作者:潘瑞东
研究方向:机器学习和自然语言处理



导读



上一份笔记在介绍决策树的过程中我们提到了“决策树是许多集成学习算法的基础算法”。那么,什么是集成学习算法、集成学习算法有哪几种、它们彼此之间有什么区别、集成学习算法合起来性能一定会超过基础学习器吗?在接下来的几份笔记中,我们将会针对几种集成学习算法针对高频问题做推导和解答。

这份笔记将首先针对Adaboost和GBDT算法进行介绍,Adaboost和GBDT算法都属于集成学习中采用Boosting策略的算法,Boosting策略的本质思想就是通过高度相关的弱学习器,在每一轮的迭代重逐渐减小偏差。细分来看,Adaboost和GBDT算法对于减小偏差的方式各有不同:
Adaboost算法的核心是权重的调整:Adaboost在迭代中依据学习器每一轮的表现,调整样本权重和弱学习器权重,最终将多个弱学习器累加成一个强学习器。

GBDT (Gradient Boosting Decision Tree) 梯度提升树的核心在于残差的拟合:GBDT用损失函数的负梯度作为残差的估计值,使用CART回归是依据均方差进行拟合。

如果你刚刚接触集成学习算法,你可能会有如下疑惑:
  • Adaboost和随机森林有什么区别?

  • GBDT和Adaboost如何实现分类和回归?

  • GBDT和Adaboost有什么区别和联系?

  • GBDT如何应对过拟合?

  • 在实际使用中,GBDT为什么在高维稀疏特征的数据集上表现较差?

  • ...


这份笔记将会从个人的理解对这些问题进行推导和解答,如有疏漏,感谢提出~



笔记







投稿或交流学习,备注: 昵称-学校(公司)-方向,进入DL&NLP交流群。
方向有很多: 机器学习、深度学习,python,情感分析、意见挖掘、句法分析、机器翻译、人机对话、知识图谱、语音识别等
记得备注呦



让更多的人知道你“在看”
登录查看更多
0

相关内容

Adaboost 是一种迭代算法,是集成学习的一种,其核心思想是针对同一个训练集训练不同的分类器(弱分类器),然后把这些弱分类器集合起来,构成一个更强的最终分类器(强分类器)。
专知会员服务
139+阅读 · 2020年5月19日
Sklearn 与 TensorFlow 机器学习实用指南,385页pdf
专知会员服务
129+阅读 · 2020年3月15日
【经典书】精通机器学习特征工程,中文版,178页pdf
专知会员服务
354+阅读 · 2020年2月15日
【机器学习课程】机器学习中的常识性问题
专知会员服务
73+阅读 · 2019年12月2日
【干货】数据科学与机器学习面试指南
机器学习算法与Python学习
8+阅读 · 2018年8月15日
【机器学习】从零开始入门机器学习算法实践
产业智能官
10+阅读 · 2017年12月1日
干货 | 从零开始入门机器学习算法实践
雷锋网
9+阅读 · 2017年11月30日
【回顾】从零开始入门机器学习算法实践
AI研习社
5+阅读 · 2017年11月28日
ML笔记 | 零基础学懂机器学习(六)
七月在线实验室
5+阅读 · 2017年11月2日
机器学习(23)之GBDT详解
机器学习算法与Python学习
12+阅读 · 2017年10月25日
机器学习算法比较
我爱机器学习
4+阅读 · 2016年12月11日
Arxiv
7+阅读 · 2018年5月23日
Arxiv
5+阅读 · 2018年5月22日
Arxiv
3+阅读 · 2018年5月11日
Arxiv
5+阅读 · 2017年12月14日
VIP会员
相关资讯
【干货】数据科学与机器学习面试指南
机器学习算法与Python学习
8+阅读 · 2018年8月15日
【机器学习】从零开始入门机器学习算法实践
产业智能官
10+阅读 · 2017年12月1日
干货 | 从零开始入门机器学习算法实践
雷锋网
9+阅读 · 2017年11月30日
【回顾】从零开始入门机器学习算法实践
AI研习社
5+阅读 · 2017年11月28日
ML笔记 | 零基础学懂机器学习(六)
七月在线实验室
5+阅读 · 2017年11月2日
机器学习(23)之GBDT详解
机器学习算法与Python学习
12+阅读 · 2017年10月25日
机器学习算法比较
我爱机器学习
4+阅读 · 2016年12月11日
Top
微信扫码咨询专知VIP会员