SPD流形 | 面向图像集分类的切空间稀疏表示

2018 年 7 月 26 日 中国图象图形学报

导语:在图像集分类的任务中,用对称正定(SPD)矩阵来描述图像集,并考虑所得到的黎曼流形(SPD流形),已被证明对许多分类任务有较好的效果。本文考虑了SPD流形的几何特性及相关黎曼度量,并与欧氏空间的经典方法相结合,实现了图像集的分类任务。


引用格式

陈凯旋,吴小俊. 面向图像集分类的切空间稀疏表示算法[J]. 中国图象图形学报, 2018, 23(7): 961-972.

DOI: 10.11834/jig.170572

原文链接

http://www.cjig.cn/html/jig/2018/7/weixin/20180703.htm


专家评价

将欧氏空间的分类方法应用于解决黎曼空间上图像集的分类,得到欧氏空间中分类算法的输入。本文算法在解决图像分类问题时能够改善分类效果,提升了分类性能。


本文看点

(1) 通过SPD流形特有的LEM度量,将SPD矩阵映射到切空间中;再对切空间的样本进行分类以实现图像集的分类。


(2) 使用NYSTRÖM METHOD和(2D)2PCA (two-directional two-dimensional PCA)两种方法的降维处理,运用了Log-Euclidean kernel来得到切空间的样本的在再生和希尔伯特空间的表示形式,从而也达到了降维的效果。


本文方法 

通过矩阵的对数映射将SPD流形上的样本点映射到切空间中, 切空间中的样本点与图像集是一一对应的关系, 此时, 再将切空间中的样本点作为欧氏空间中稀疏表示分类算法的输入以实现图像集的分类任务。但是切空间样本的形式为对称矩阵, 且维度较大, 包含一定冗余信息, 为了提高算法的性能和运行效率, 使用NYSTRÖM METHOD和(2D)2PCA (two-directional two-dimensional PCA)两种方法来获得包含图像集的主要信息且维度更低的数据表示形式。


 ▲算法流程图


本文结果

实验对人脸、物体和病毒细胞3种不同的对象进行分类, 并且与一些用于图像集分类的经典算法进行对比。


实现结果表明, 本文算法不仅具有较高的识别率, 而且标准差也相对较小。在人脸数据集上, 本文算法的识别率可以达到78.26%, 比其他算法高出10%左右, 同时, 具有最小的标准差2.71。在病毒数细胞据集上, 本文算法的识别率可以达到58.67%, 在所有的方法中识别率最高。在物体识别的任务中, 本文算法的识别率可以达到96.25%, 标准差为2.12。


与一些经典的基于图像集的分类算法对比, 本文算法的识别率有较大的提高且具有较小的标准差, 对多种数据集有较强的泛化能力, 这充分说明了本文算法可以广泛应用于解决基于图像集的分类任务。


但是, 本文是通过(2D)2PCA和NYSTRÖM METHOD对切空间中样本进行降维来获得更低维度的样本, 以提高算法的运行速度和性能。如何直接构建维度更低, 且具有判别性的SPD流形将是下一步的研究重点。


▲ETH-80数据集中的部分图像


▲YTC数据集中的部分图像


▲Virus数据集中的部分图像


第一作者

陈凯旋,江南大学物联网工程学院计算机技术硕士研究生,主要研究方向计算机视觉、模式识别、黎曼流形。E-mail: kaixuan_chen_jnu@163.com


通信作者

吴小俊,江南大学二级教授、博导、科研院院长,从事模式识别与人工智能方面的研究。2006年教育部新世纪优秀人才、江苏省333工程领军人才。教育部计算机类教学指导委员会委员、中国航空学会信息融合专委会委员、江苏省人工智能学会副理事长、江苏省系统工程学会副理事长、江苏省计算机学会学术工委会副主任和无锡市计算机学会理事长等职。E-mail: xiaojun_wu_jnu@163.com



实验室简介


江苏省模式识别与计算智能工程实验室的研究方向定位于模式识别与计算智能技术。这些技术在物联网中有着广泛的应用,是物联网中智能信息处理的基础。


实验室依托“物联网技术与应用教育部工程研究中心”、“轻工过程先进控制教育部重点实验室”,以国家特色专业“计算机科学与技术”和江苏省优势学科“物联网技术与工程”为学科基础,开展模式识别与计算智能技术与应用的研究。近年来,实验室在模式识别、机器学习、计算智能等方面的取得了可喜的成果。


实验室中方负责人吴小俊教授是教育部新世纪优秀人才、江苏省“333”工程领军人才、江南大学二级教授、科研院院长。实验室外方负责人Josef Kittler教授,2016年中国政府“友谊奖”获得者,英国萨里大学杰出教授,英国皇家工程院院士,前国际模式识别协会主席。

前沿丨观点丨咨讯丨独家

扫描下方二维码 关注学报公众号

中国图象图形学报 | 订阅号


登录查看更多
0

相关内容

基于改进卷积神经网络的短文本分类模型
专知会员服务
25+阅读 · 2020年7月22日
【ICML2020】对比多视角表示学习
专知会员服务
52+阅读 · 2020年6月28日
基于深度学习的多标签生成研究进展
专知会员服务
142+阅读 · 2020年4月25日
八篇 ICCV 2019 【图神经网络(GNN)+CV】相关论文
专知会员服务
29+阅读 · 2020年1月10日
计算机视觉方向简介 | 多视角立体视觉MVS
计算机视觉life
14+阅读 · 2019年10月10日
机器学习计算距离和相似度的方法
极市平台
10+阅读 · 2019年9月20日
基于几何特征的激光雷达地面点云分割
泡泡机器人SLAM
15+阅读 · 2018年4月1日
机器学习(30)之线性判别分析(LDA)原理详解
机器学习算法与Python学习
11+阅读 · 2017年12月6日
机器学习(27)【降维】之主成分分析(PCA)详解
机器学习算法与Python学习
9+阅读 · 2017年11月22日
支持向量机分类实战
全球人工智能
4+阅读 · 2017年10月18日
Deformable Style Transfer
Arxiv
14+阅读 · 2020年3月24日
Arxiv
14+阅读 · 2019年11月26日
Arxiv
30+阅读 · 2019年3月13日
Arxiv
6+阅读 · 2018年7月12日
VIP会员
相关VIP内容
相关资讯
计算机视觉方向简介 | 多视角立体视觉MVS
计算机视觉life
14+阅读 · 2019年10月10日
机器学习计算距离和相似度的方法
极市平台
10+阅读 · 2019年9月20日
基于几何特征的激光雷达地面点云分割
泡泡机器人SLAM
15+阅读 · 2018年4月1日
机器学习(30)之线性判别分析(LDA)原理详解
机器学习算法与Python学习
11+阅读 · 2017年12月6日
机器学习(27)【降维】之主成分分析(PCA)详解
机器学习算法与Python学习
9+阅读 · 2017年11月22日
支持向量机分类实战
全球人工智能
4+阅读 · 2017年10月18日
Top
微信扫码咨询专知VIP会员