机器学习(30)之线性判别分析(LDA)原理详解 - 专知

会员服务 ·

0

机器学习(30)之线性判别分析(LDA)原理详解

2017 年 12 月 6 日 机器学习算法与Python学习

微信公众号

关键字全网搜索最新排名

【机器学习算法】：排名第一

【机器学习】：排名第一

【Python】：排名第三

【算法】：排名第四

前言

在主成分分析（PCA）原理总结（机器学习(27)【降维】之主成分分析(PCA)详解）中对降维算法PCA做了总结。这里就对另外一种经典的降维方法线性判别分析（Linear Discriminant Analysis, 简称LDA）做一个总结。LDA在模式识别领域（比如人脸识别，舰艇识别等图形图像识别领域）中有非常广泛的应用，因此我们有必要了解下它的算法原理。在学习LDA之前，有必要将其自然语言处理领域的LDA区别开来，在自然语言处理领域， LDA是隐含狄利克雷分布（Latent Dirichlet Allocation，简称LDA），是一种处理文档的主题模型。本文只讨论线性判别分析，因此后面所有的LDA均指线性判别分析。

LDA思想

LDA是一种监督学习的降维技术，也就是说它的数据集的每个样本是有类别输出的，这点和PCA不同。PCA是不考虑样本类别输出的无监督降维技术。LDA的思想可以用一句话概括，就是“投影后类内方差最小，类间方差最大”，如下图所示。 我们要将数据在低维度上进行投影，投影后希望每一种类别数据的投影点尽可能的接近，而不同类别的数据的类别中心之间的距离尽可能的大。

可能还是有点抽象，先看看最简单的情况。

假设有两类数据，分别为红色和蓝色，如下图所示，这些数据特征是二维的，希望将这些数据投影到一维的一条直线，让每一种类别数据的投影点尽可能的接近，而红色和蓝色数据中心之间的距离尽可能的大。

上图中提供了两种投影方式，哪一种能更好的满足我们的标准呢？从直观上可以看出，右图要比左图的投影效果好，因为右图的黑色数据和蓝色数据各个较为集中，且类别之间的距离明显。左图则在边界处数据混杂。以上就是LDA的主要思想了，当然在实际应用中，数据是多个类别的，我们的原始数据一般也是超过二维的，投影后的也一般不是直线，而是一个低维的超平面。

LDA原理与流程

LDA与PCA

LDA用于降维，和PCA有很多相同，也有很多不同的地方，因此值得好好的比较一下两者的降维异同点。

相同点

1）两者均可以对数据进行降维。

2）两者在降维时均使用了矩阵特征分解的思想。

3）两者都假设数据符合高斯分布。

不同点

1）LDA是有监督的降维方法，而PCA是无监督的降维方法

2）LDA降维最多降到类别数k-1的维数，而PCA没有这个限制。

3）LDA除了可以用于降维，还可以用于分类。

4）LDA选择分类性能最好的投影方向，而PCA选择样本点投影具有最大方差的方向。这点可以从下图形象的看出，在某些数据分布下LDA比PCA降维较优。

当然，某些某些数据分布下PCA比LDA降维较优，如下图所示：

LDA小结

LDA算法既可以用来降维，又可以用来分类，但是目前来说，主要还是用于降维。在进行图像识别相关的数据分析时，LDA是一个有力的工具。下面总结下LDA算法的优缺点。

优点

1）在降维过程中可以使用类别的先验知识经验，而像PCA这样的无监督学习则无法使用类别先验知识。

2）LDA在样本分类信息依赖均值而不是方差的时候，比PCA之类的算法较优。

缺点

1）LDA不适合对非高斯分布样本进行降维，PCA也有这个问题。

2）LDA降维最多降到类别数k-1的维数，如果我们降维的维度大于k-1，则不能使用LDA。当然目前有一些LDA的进化版算法可以绕过这个问题。

3）LDA在样本分类信息依赖方差而不是均值的时候，降维效果不好。

4）LDA可能过度拟合数据。

欢迎分享给他人让更多的人受益

参考：

周志华《机器学习》
Neural Networks and Deep Learning by By Michael Nielsen
博客园
http://www.cnblogs.com/pinard/p/6244265.html
李航《统计学习方法》
Deep Learning, book by Ian Goodfellow, Yoshua Bengio, and Aaron Courville

近期热文

精心整理 | 11月文章汇总（含系列文章以及免费资源下载）

关于处理样本不平衡问题的Trick整理

机器学习(29)之奇异值分解SVD原理与应用详解

干货 | 高盛：2017人工智能报告中文版（附PDF版下载）

机器学习(28)【降维】之sklearn中PCA库讲解与实战

值的收藏的干货 | 如何用Python实现常见机器学习算法

想进微信机器学习交流1群

加微信：guodongwe1991

备注姓名-单位-研究方向

广告、商业合作

请加微信：guodongwe1991

12月23日，DAL的三位数据科学大牛将在中关村进行一场关于实用数据与人工智能的线下分享会。

活动主题：

成为超级人类，驯服人工智能

活动时间：

12月23日 14:00～17:00

活动地点：

中关村创业大街

扫码即可报名

前100名免费购票

登录查看更多

11

相关内容

LDA

最新《自动微分手册》77页pdf

最新《自动微分手册》77页pdf

专知会员服务

103+阅读 · 2020年6月6日

【硬核书】理解机器学习：从理论到算法，449页pdf深度理解机器学习

【硬核书】理解机器学习：从理论到算法，449页pdf深度理解机器学习

专知会员服务

317+阅读 · 2020年5月28日

【经典书】机器学习高斯过程，266页pdf

【经典书】机器学习高斯过程，266页pdf

专知会员服务

200+阅读 · 2020年5月2日

《深度学习》圣经花书的数学推导、原理与Python代码实现

《深度学习》圣经花书的数学推导、原理与Python代码实现

专知会员服务

325+阅读 · 2020年3月6日

人工智能算法工程师手册-程序员写的AI书《深度学习，统计学习，数学基础》，50章一书打尽

人工智能算法工程师手册-程序员写的AI书《深度学习，统计学习，数学基础》，50章一书打尽

专知会员服务

211+阅读 · 2019年11月29日

【收藏】支持向量机原理详解+案例+代码！【点击阅读原文下载】

【收藏】支持向量机原理详解+案例+代码！【点击阅读原文下载】

机器学习算法与Python学习

10+阅读 · 2018年9月13日

机器学习(33)之局部线性嵌入(LLE)【降维】总结

机器学习(33)之局部线性嵌入(LLE)【降维】总结

机器学习算法与Python学习

7+阅读 · 2017年12月21日

机器学习(29)之奇异值分解SVD原理与应用详解

机器学习(29)之奇异值分解SVD原理与应用详解

机器学习算法与Python学习

6+阅读 · 2017年11月30日

机器学习(28)【降维】之sklearn中PCA库讲解与实战

机器学习(28)【降维】之sklearn中PCA库讲解与实战

机器学习算法与Python学习

8+阅读 · 2017年11月27日

机器学习(27)【降维】之主成分分析(PCA)详解

机器学习(27)【降维】之主成分分析(PCA)详解

机器学习算法与Python学习

9+阅读 · 2017年11月22日

Manifold Approximation by Moving Least-Squares Projection (MMLS)

Manifold Approximation by Moving Least-Squares Projection (MMLS)

Arxiv

4+阅读 · 2019年3月7日

Scalable attribute-aware network embedding with locality

Arxiv

4+阅读 · 2018年4月30日

Scalable attribute-aware network embedding with localily

Arxiv

3+阅读 · 2018年4月17日

Dr.VAE: Drug Response Variational Autoencoder

Arxiv

3+阅读 · 2017年7月6日

LA-LDA: A Limited Attention Topic Model for Social Recommendation

Arxiv

3+阅读 · 2013年1月26日

VIP会员

相关主题

线性判别分析

主成分分析

相关VIP内容

最新《自动微分手册》77页pdf

最新《自动微分手册》77页pdf

专知会员服务

103+阅读 · 2020年6月6日

【硬核书】理解机器学习：从理论到算法，449页pdf深度理解机器学习

【硬核书】理解机器学习：从理论到算法，449页pdf深度理解机器学习

专知会员服务

317+阅读 · 2020年5月28日

【经典书】机器学习高斯过程，266页pdf

【经典书】机器学习高斯过程，266页pdf

专知会员服务

200+阅读 · 2020年5月2日

《深度学习》圣经花书的数学推导、原理与Python代码实现

《深度学习》圣经花书的数学推导、原理与Python代码实现

专知会员服务

325+阅读 · 2020年3月6日

人工智能算法工程师手册-程序员写的AI书《深度学习，统计学习，数学基础》，50章一书打尽

人工智能算法工程师手册-程序员写的AI书《深度学习，统计学习，数学基础》，50章一书打尽

专知会员服务

211+阅读 · 2019年11月29日

热门VIP内容

开通专知VIP会员享更多权益服务

《利用人工智能对军事行动进行建模》

《利用人工智能学习、优化与推演美国海军作战部队的战略布局与分散（续文）》

机器人、无人机与实时影像：应对城市爆炸威胁的三大技术方案

《指挥官意图消息中关键概念自动提取》最新47页

相关资讯

【收藏】支持向量机原理详解+案例+代码！【点击阅读原文下载】

【收藏】支持向量机原理详解+案例+代码！【点击阅读原文下载】

机器学习算法与Python学习

10+阅读 · 2018年9月13日

机器学习(33)之局部线性嵌入(LLE)【降维】总结

机器学习(33)之局部线性嵌入(LLE)【降维】总结

机器学习算法与Python学习

7+阅读 · 2017年12月21日

机器学习(29)之奇异值分解SVD原理与应用详解

机器学习(29)之奇异值分解SVD原理与应用详解

机器学习算法与Python学习

6+阅读 · 2017年11月30日

机器学习(28)【降维】之sklearn中PCA库讲解与实战

机器学习(28)【降维】之sklearn中PCA库讲解与实战

机器学习算法与Python学习

8+阅读 · 2017年11月27日

机器学习(27)【降维】之主成分分析(PCA)详解

机器学习(27)【降维】之主成分分析(PCA)详解

机器学习算法与Python学习

9+阅读 · 2017年11月22日

相关论文

Manifold Approximation by Moving Least-Squares Projection (MMLS)

Manifold Approximation by Moving Least-Squares Projection (MMLS)

Arxiv

4+阅读 · 2019年3月7日

Scalable attribute-aware network embedding with locality

Arxiv

4+阅读 · 2018年4月30日

Scalable attribute-aware network embedding with localily

Arxiv

3+阅读 · 2018年4月17日

Dr.VAE: Drug Response Variational Autoencoder

Arxiv

3+阅读 · 2017年7月6日

LA-LDA: A Limited Attention Topic Model for Social Recommendation

Arxiv

3+阅读 · 2013年1月26日

大家都在搜

朱克爱德华兹家族

大型语言模型

蓝牙安全攻防

【论文笔记】用于数据驱动交通预测的扩散卷积循环神经网络（DCRNN）

微信扫码咨询专知VIP会员