干货|PRML读书后记(一): 拟合学习

会员服务 ·

干货|PRML读书后记(一): 拟合学习

2017 年 9 月 29 日 机器学习研究会

优美的高斯分布

[P29]图1.16很好的描绘了这样表达的优美之处：

极大似然估计的病态拟合

参数-Regularizer

先验分布：高斯分布

高斯分布应该算是我们认知中，描绘一切连续型数值不确定性的最基本、最硬派的先验知识了。

甭管你是什么妖魔鬼怪，只要你是连续的，不是离散的，先给你套个高斯分布的罪状。

当然，钦定高斯分布从数学角度是由原因的，和其优美的数学共轭形式有关。

[P98]的练习证明了，高斯似然分布 x 高斯先验分布，结果仍然是一个高斯分布。

(此证明需要熟读第二章关于高斯分布的 150 个公式，需要很好的概率论、线代基础。)

高斯分布在数学形式上有许多便利，比如下面提到的零均值简化版高斯分布，这为贝叶斯方法招来很多

恶评，[P23] 是这样解释的：贝叶斯方法广受批判的原因之一，是因为其在选取先验概率分布上，根据的是

数学形式的便利为基础而不是 先验分布的信度 。

贝叶斯方法讲究推导严谨，公式齐全，对于那些奇怪的、无法用数学语言表达原理的、广布自然界的先验知识，

如Deep Learning思想，自然不会考虑，这也是为什么有人会认为Deep Learning与Bayesian是对着干的。[Quroa]

波动性惩罚：简化高斯分布

稀疏性惩罚：L1 Regularizer

I、大脑中有1000亿以上的神经元，但是同时只有1%~4%激活，而且每次激活的区域都不一样。

这是生物神经中的稀疏性。

II、稀疏性将原本信息缠绕密集数据给稀疏化，得到稀疏特征表达。比如将实数5，稀疏为一个[1,0,1]向量，

很容易线性可分了。又比如识别一直鸟，只要把噪声给稀疏掉，保留关键部位，最后就有更好的特征表达。

这是特征表达上的稀疏性，实际应用有[稀疏编码][深度神经网络]，当然还有我们的生物神经网络。

转自：机器学习算法与自然语言处理

完整内容请点击“”阅读原文“”

登录查看更多

相关内容

高斯分布

关注 2

正态（或高斯或高斯或拉普拉斯-高斯）分布是实值随机变量的一种连续概率分布。高斯分布具有一些独特的属性，这些属性在分析研究中很有价值。例如，法线偏差的固定集合的任何线性组合就是法线偏差。当相关变量呈正态分布时，许多结果和方法（例如不确定性的传播和最小二乘参数拟合）都可以以显式形式进行分析得出。

【2020新书】监督机器学习，156页pdf，剑桥大学出版社

专知会员服务

154+阅读 · 2020年6月27日

【经典书】机器学习高斯过程，266页pdf

专知会员服务

200+阅读 · 2020年5月2日

【UIUC硬核书】统计学习理论，Statistical Learning Theory，213页pdf

专知会员服务

134+阅读 · 2020年4月14日

【干货书】机器学习Python实战教程，366页pdf

专知会员服务

346+阅读 · 2020年3月17日

机器学习速查手册，135页pdf

专知会员服务

345+阅读 · 2020年3月15日

【干货】机器学习经典书PRML 最新 Python 3 代码实现，附最全 PRML 笔记视频学习资料

专知会员服务

179+阅读 · 2020年3月3日

国科大UCAS胡包钢教授《信息论与机器学习》课程第三讲：信息论基础二

专知会员服务

71+阅读 · 2020年3月2日

【经典书】精通机器学习特征工程，中文版，178页pdf

专知会员服务

360+阅读 · 2020年2月15日

【新书：机器学习简介】《A Concise Introduction to Machine Learning》by A.C. Faul (CRC 2019)

专知会员服务

77+阅读 · 2020年2月8日

知识神经元网络 KNN（简介），12页pdf

专知会员服务

15+阅读 · 2019年12月25日

一文读懂线性回归、岭回归和Lasso回归

CSDN

34+阅读 · 2019年10月13日

【机器学习】一文读懂线性回归、岭回归和Lasso回归

AINLP

20+阅读 · 2019年10月12日

【干货】卷积神经网络CNN学习笔记

机器学习研究会

15+阅读 · 2017年12月17日

BAT题库 | 机器学习面试1000题系列（第211~215题）

七月在线实验室

9+阅读 · 2017年11月22日

BAT题库 | 机器学习面试1000题系列（第196~200题）

七月在线实验室

17+阅读 · 2017年11月16日

BAT题库 | 机器学习面试1000题系列（第191~195题）

七月在线实验室

6+阅读 · 2017年11月15日

BAT题库 | 机器学习面试1000题系列（第161~165题）

七月在线实验室

7+阅读 · 2017年11月6日

干货|机器学习零基础？不要怕，吴恩达机器学习课程笔记2-多元线性回归

机器学习研究会

4+阅读 · 2017年10月22日

BAT机器学习面试1000题系列（第51~55题）

七月在线实验室

10+阅读 · 2017年10月8日

BAT机器学习面试1000题系列（第46~50题）

七月在线实验室

7+阅读 · 2017年10月7日

ASLFeat: Learning Local Features of Accurate Shape and Localization

Arxiv

6+阅读 · 2020年3月23日

Adversarial Multimodal Representation Learning for Click-Through Rate Prediction

Arxiv

23+阅读 · 2020年3月7日

Label Embedded Dictionary Learning for Image Classification

Arxiv

6+阅读 · 2019年3月7日

Discovery and recognition of motion primitives in human activities

Arxiv

4+阅读 · 2019年2月4日

Stochastic Gradient Descent Optimizes Over-parameterized Deep ReLU Networks

Arxiv

8+阅读 · 2018年11月21日

Towards Understanding Regularization in Batch Normalization

Arxiv

4+阅读 · 2018年9月27日

The Matrix Calculus You Need For Deep Learning

Arxiv

12+阅读 · 2018年7月2日

Learning Unsupervised Learning Rules

Arxiv

7+阅读 · 2018年5月23日

SimplE Embedding for Link Prediction in Knowledge Graphs

Arxiv

7+阅读 · 2018年2月13日

Subset Labeled LDA for Large-Scale Multi-Label Classification

Arxiv

3+阅读 · 2017年9月16日

VIP会员