数据分析师应该知道的16种回归技术:介绍篇

2018 年 7 月 28 日 数萃大数据

回归分析是我们进行数据挖掘和模型预测时最常用的统计方法之一。目前已经有十几种回归方法用来分析不同类型的数据,每一种回归方法都有它自己的特征。然而大多数人仅仅了解2-3种常见的回归方法,如:线性和逻辑回归。对于某些数据,如果我们依然使用常见的几种回归方法,就会导致错误的统计决策。因此,每一位数据分析师都应该熟知每类回归方法以及它们适应的数据类型。

什么是回归分析

首先让我们看一个简单的例子:假如公司经理要求你预测公司来年的销售额,这里有数百个影响销量的因子。在这个例子中,销量就是的你的因变量,所有影响销量的因子都是你的自变量。回归分析将会帮助你解决这个问题。

简单地说,回归分析就是用来模拟一个因变量和一个或多个自变量之间的关系。

对于前面的例子,通过回归分析,我们可以回答下列问题:

  1. 哪些因子对销量有显著的影响

  2. 因子是如何影响销量的

  3. 公司来年销售额是多少

回归分析常用术语

  1. 异常点(outliers):指数据集中那些远高或远低于总体平均水平的点,我们也称这些点为极端值

  2. 多重共线性(Multicollinearity):指自变量之间有较高的相关性。

  3. 异方差性(Heteroscedasticity):指总体回归函数中的随机误差项不满足同方差性。

  4. 过拟合(Overfitting)和欠拟合(Underfitting):使用不必要的解释变量可能会导致过拟合,过拟合意味着算法可以很好拟合训练集但不能较好地反映测试集的特征,这也称为高方差问题;当模型不能有效拟合训练集时,就认为模型欠拟合,这也称为高偏差问题。

16种回归方法

目前已经收集的16种回归方法

  1. 线性回归

  2. 多项式回归

  3. 逻辑回归

  4. KNN回归

  5. 分位数回归

  6. 岭回归

  7. Lasso回归

  8. 弹性网络回归

  9. 主成份回归

  10. 局部最小二乘回归

  11. 支持向量回归

  12. 有序回归

  13. 泊松回归

  14. 负二项回归

  15. 准泊松回归

  16. Cox回归


后续课程会对上面的15种回归方法进行一一讲解,欢迎大家关注学习。

长按二维码关注“数萃大数据”


登录查看更多
7

相关内容

【实用书】学习用Python编写代码进行数据分析,103页pdf
专知会员服务
192+阅读 · 2020年6月29日
【新书册】贝叶斯神经网络,41页pdf
专知会员服务
177+阅读 · 2020年6月3日
打怪升级!2020机器学习工程师技术路线图
专知会员服务
98+阅读 · 2020年6月3日
商业数据分析,39页ppt
专知会员服务
159+阅读 · 2020年6月2日
【经典书】机器学习高斯过程,266页pdf
专知会员服务
195+阅读 · 2020年5月2日
Sklearn 与 TensorFlow 机器学习实用指南,385页pdf
专知会员服务
129+阅读 · 2020年3月15日
【机器学习课程】Google机器学习速成课程
专知会员服务
164+阅读 · 2019年12月2日
一文读懂线性回归、岭回归和Lasso回归
CSDN
34+阅读 · 2019年10月13日
博客 | 回归类算法最全综述及逻辑回归重点讲解
AI研习社
13+阅读 · 2018年11月29日
数据分析师应该知道的16种回归方法:负二项回归
数萃大数据
74+阅读 · 2018年9月16日
数据分析师应该知道的16种回归技术:弹性网络回归
数萃大数据
91+阅读 · 2018年8月16日
数据分析师应该知道的16种回归技术:分位数回归
数萃大数据
29+阅读 · 2018年8月8日
机器学习者都应该知道的五种损失函数!
数盟
5+阅读 · 2018年6月21日
快速掌握机器学习,这 3 种算法你必须知道
开源中国
8+阅读 · 2017年11月9日
Arxiv
18+阅读 · 2019年1月16日
Feature Selection Library (MATLAB Toolbox)
Arxiv
7+阅读 · 2018年8月6日
Arxiv
3+阅读 · 2018年2月24日
VIP会员
相关VIP内容
【实用书】学习用Python编写代码进行数据分析,103页pdf
专知会员服务
192+阅读 · 2020年6月29日
【新书册】贝叶斯神经网络,41页pdf
专知会员服务
177+阅读 · 2020年6月3日
打怪升级!2020机器学习工程师技术路线图
专知会员服务
98+阅读 · 2020年6月3日
商业数据分析,39页ppt
专知会员服务
159+阅读 · 2020年6月2日
【经典书】机器学习高斯过程,266页pdf
专知会员服务
195+阅读 · 2020年5月2日
Sklearn 与 TensorFlow 机器学习实用指南,385页pdf
专知会员服务
129+阅读 · 2020年3月15日
【机器学习课程】Google机器学习速成课程
专知会员服务
164+阅读 · 2019年12月2日
相关资讯
Top
微信扫码咨询专知VIP会员