简述多种降维算法

2018 年 9 月 23 日 算法与数学之美

最近看了一些关于降维算法的东西,本文首先给出了七种算法的一个信息表,归纳了关于每个算法可以调节的(超)参数、算法主要目的等等,然后介绍了降维的一些基本概念,包括降维是什么、为什么要降维、降维可以解决维数灾难等,然后分析可以从什么样的角度来降维,接着整理了这些算法的具体流程。主要目录如下:

  • 1. 降维基本概念

  • 2. 从什么角度出发降维

  • 3. 降维算法

    • 3.1 主成分分析PCA

    • 3.2 多维缩放(MDS)

    • 3.3 线性判别分析(LDA)

    • 3.4 等度量映射(Isomap)

    • 3.5 局部线性嵌入(LLE)

    • 3.6 t-SNE

    • 3.7 Deep Autoencoder Networks

  • 4. 小结


老规矩,先上一个各个算法信息表,表示高维输入矩阵大小是高维数D乘以样本个数N,,表示降维输出矩阵大小低维数d乘以N,,线性映射是,高维空间中两两之间的距离矩阵为A,Sw,Sb分别是LDA的类内散度矩阵和类间散度矩阵,k表示流形学习中一个点与k个点是邻近关系,F表示高维空间中一个点由周围几个点的线性组合矩阵,表示不确定。是高维空间中两点距离占所有距离比重的概率矩阵,低维空间中两点距离占所有距离比重的概率矩阵。表示全连接神经网络的层数,表示每一层的节点个数。