SPD流形 | 面向图像集分类的切空间稀疏表示

2018 年 7 月 26 日 中国图象图形学报

导语：在图像集分类的任务中，用对称正定(SPD)矩阵来描述图像集，并考虑所得到的黎曼流形(SPD流形)，已被证明对许多分类任务有较好的效果。本文考虑了SPD流形的几何特性及相关黎曼度量，并与欧氏空间的经典方法相结合，实现了图像集的分类任务。

引用格式

陈凯旋,吴小俊. 面向图像集分类的切空间稀疏表示算法[J]. 中国图象图形学报, 2018, 23(7): 961-972.

DOI: 10.11834/jig.170572

原文链接

http://www.cjig.cn/html/jig/2018/7/weixin/20180703.htm

专家评价

将欧氏空间的分类方法应用于解决黎曼空间上图像集的分类，得到欧氏空间中分类算法的输入。本文算法在解决图像分类问题时能够改善分类效果，提升了分类性能。

本文看点

(1) 通过SPD流形特有的LEM度量，将SPD矩阵映射到切空间中；再对切空间的样本进行分类以实现图像集的分类。

(2) 使用NYSTRÖM METHOD和(2D)²PCA (two-directional two-dimensional PCA)两种方法的降维处理，运用了Log-Euclidean kernel来得到切空间的样本的在再生和希尔伯特空间的表示形式，从而也达到了降维的效果。

本文方法

通过矩阵的对数映射将SPD流形上的样本点映射到切空间中，切空间中的样本点与图像集是一一对应的关系，此时，再将切空间中的样本点作为欧氏空间中稀疏表示分类算法的输入以实现图像集的分类任务。但是切空间样本的形式为对称矩阵，且维度较大，包含一定冗余信息，为了提高算法的性能和运行效率，使用NYSTRÖM METHOD和(2D)²PCA (two-directional two-dimensional PCA)两种方法来获得包含图像集的主要信息且维度更低的数据表示形式。

▲算法流程图

本文结果

实验对人脸、物体和病毒细胞3种不同的对象进行分类，并且与一些用于图像集分类的经典算法进行对比。

实现结果表明，本文算法不仅具有较高的识别率，而且标准差也相对较小。在人脸数据集上，本文算法的识别率可以达到78.26%，比其他算法高出10%左右，同时，具有最小的标准差2.71。在病毒数细胞据集上，本文算法的识别率可以达到58.67%，在所有的方法中识别率最高。在物体识别的任务中，本文算法的识别率可以达到96.25%，标准差为2.12。

与一些经典的基于图像集的分类算法对比，本文算法的识别率有较大的提高且具有较小的标准差，对多种数据集有较强的泛化能力，这充分说明了本文算法可以广泛应用于解决基于图像集的分类任务。

但是，本文是通过(2D)²PCA和NYSTRÖM METHOD对切空间中样本进行降维来获得更低维度的样本，以提高算法的运行速度和性能。如何直接构建维度更低，且具有判别性的SPD流形将是下一步的研究重点。

▲ETH-80数据集中的部分图像

▲YTC数据集中的部分图像

▲Virus数据集中的部分图像

第一作者

陈凯旋，江南大学物联网工程学院计算机技术硕士研究生，主要研究方向计算机视觉、模式识别、黎曼流形。E-mail: kaixuan_chen_jnu@163.com

通信作者

吴小俊，江南大学二级教授、博导、科研院院长，从事模式识别与人工智能方面的研究。2006年教育部新世纪优秀人才、江苏省333工程领军人才。教育部计算机类教学指导委员会委员、中国航空学会信息融合专委会委员、江苏省人工智能学会副理事长、江苏省系统工程学会副理事长、江苏省计算机学会学术工委会副主任和无锡市计算机学会理事长等职。E-mail: xiaojun_wu_jnu@163.com