为什么数据科学家都喜欢高斯分布

2018 年 6 月 5 日 论智
来源:Medium
编译:weakish

编者按:数据科学家Abhishek Parbhakar简洁明了地解释了机器学习中高斯分布如此受欢迎的原因。

对深度学习和机器学习工程师而言,在世界上所有的概率模型中,高斯分布(Gaussian distribution)模型最为引人注目。即使你从来没有进行过AI项目,有很大的几率你曾经遇到过高斯模型。

高斯分布,又称为正态分布(Normal distribution),常常可以通过其标志性的钟形曲线识别出来。高斯分布如此流行,有三大原因。

高斯概率分布函数


在自然现象中普遍存在

所有的模型都是错的,但有些模型有用!

—— George Box

扩散中的微粒的位置可以用高斯分布描述

自然科学和社会科学中有极其大量的过程天然遵循高斯分布。即使当它们并不遵循高斯分布的时候,高斯分布也往往提供最佳的逼近。一些例子:

  • 成人的身高、血压、智商

  • 扩散中的微粒位置

  • 测量误差

数学上的原因:中心极限定理


二维平面随机行走两百万步

中心极限定理表明,满足一定条件时,大量相互独立的随机变量经适当标准化后,收敛于高斯分布。例如,随机行走的总距离分趋向于高斯概率分布。

这一定理意味着专门为高斯模型开发的大量科学方法和统计学方法同样适用于可能牵涉其他类型分布的广阔领域内的问题。

可以认为,这一定理解释了为什么这么多自然现象遵循高斯分布。

另外,高斯分布在一些转换后仍然是高斯分布:

  • 高斯函数经傅里叶变换后,所得仍为高斯函数。

  • 两个高斯函数的积仍然是高斯函数。

  • 两个高斯函数的卷积仍然是高斯函数。

  • 两个符合高斯分布的独立随机变量之和仍然符合高斯分布。

简单性


奥卡姆剃刀原则强调在其他条件相同时,最简单的解是最佳解

对每个高斯模型逼近而言,可能存在一个提供更好的逼近的复杂多参数分布。然而,我们仍然选择高斯模型,因为它大大简化了数学!

  • 均值、中位数、众数均相等

  • 整个分布仅需指定两个参数——均值和方差

高斯分布得名于伟大的数学家和物理学家卡尔·弗里德里希·高斯(Carl Friedrich Gauss)。

原文地址:https://towardsdatascience.com/why-data-scientists-love-gaussian-6e7a7b726859

登录查看更多
2

相关内容

正态(或高斯或高斯或拉普拉斯-高斯)分布是实值随机变量的一种连续概率分布。高斯分布具有一些独特的属性,这些属性在分析研究中很有价值。 例如,法线偏差的固定集合的任何线性组合就是法线偏差。 当相关变量呈正态分布时,许多结果和方法(例如不确定性的传播和最小二乘参数拟合)都可以以显式形式进行分析得出。
最新《自动微分手册》77页pdf
专知会员服务
102+阅读 · 2020年6月6日
【干货书】用于概率、统计和机器学习的Python,288页pdf
专知会员服务
291+阅读 · 2020年6月3日
【新书册】贝叶斯神经网络,41页pdf
专知会员服务
179+阅读 · 2020年6月3日
【干货书】数值计算C编程,319页pdf,Numerical C
专知会员服务
70+阅读 · 2020年4月7日
GAN 为什么需要如此多的噪声?
AI科技评论
14+阅读 · 2020年3月17日
一文读懂线性回归、岭回归和Lasso回归
CSDN
34+阅读 · 2019年10月13日
深入机器学习系列之:高斯混合模型
数据猿
8+阅读 · 2019年1月10日
数据科学家需要了解的5种聚类算法
论智
4+阅读 · 2018年4月7日
生活中处处的贝叶斯
算法与数学之美
4+阅读 · 2018年2月19日
揭开神秘面纱: 一文详解高斯混合模型原理
数据猿
4+阅读 · 2018年2月13日
Image Captioning: Transforming Objects into Words
Arxiv
7+阅读 · 2019年6月14日
Implicit Maximum Likelihood Estimation
Arxiv
7+阅读 · 2018年9月24日
Arxiv
3+阅读 · 2018年5月21日
Arxiv
5+阅读 · 2018年1月17日
VIP会员
相关VIP内容
相关资讯
GAN 为什么需要如此多的噪声?
AI科技评论
14+阅读 · 2020年3月17日
一文读懂线性回归、岭回归和Lasso回归
CSDN
34+阅读 · 2019年10月13日
深入机器学习系列之:高斯混合模型
数据猿
8+阅读 · 2019年1月10日
数据科学家需要了解的5种聚类算法
论智
4+阅读 · 2018年4月7日
生活中处处的贝叶斯
算法与数学之美
4+阅读 · 2018年2月19日
揭开神秘面纱: 一文详解高斯混合模型原理
数据猿
4+阅读 · 2018年2月13日
相关论文
Top
微信扫码咨询专知VIP会员