信号处理、数据分析与数据挖掘在科学与工程中无处不在。从实验原始数据、测量结果和观测中提取有价值的知识,并理解复杂数据,已经成为一个重要的挑战与目标。通常,从复杂现象中收集到的数据集,代表了多个相互关联变量的综合结果,或者是潜在成分或因子的组合。为了发现其内在结构并提取隐藏信息,可以先将这些数据集分解或分离为其潜在的组成部分。在许多情况下,这些测量结果以数据矩阵或多向数组(张量)的形式存储,并可由线性或多线性模型进行描述。 近似低秩矩阵与张量分解在数据增强与潜在成分提取中发挥着基础性作用。去噪、模型降维、可行性重建以及盲源分离(Blind Source Separation, BSS)等方法中的一个共同思路,是用通过矩阵或多向数组分解得到的低维近似表示替代原始数据。矩阵分解的概念出现在众多重要应用中,而不同的矩阵分解方法基于对成分矩阵及其潜在结构的不同假设,因此在各应用领域选择合适的方法至关重要。通常情况下,需要分析的数据、信号或图像是非负的(或部分非负),并且在某些情况下还具有稀疏或平滑的表示。对于这类数据,在分析中考虑这些约束条件是更为合理的做法,以便提取具有物理意义或合理解释的非负且稀疏/平滑成分,避免荒谬或不可预测的结果。传统工具无法保证非负性。 在本研究专著中,我们对**非负矩阵分解(Nonnegative Matrix Factorization, NMF)及其各种扩展和变体,特别是非负张量分解(Nonnegative Tensor Factorization, NTF)与非负 Tucker 分解(Nonnegative Tucker Decomposition, NTD)**的模型与算法方面进行了广泛综述。在 NTF 与 NTD 方法中,高维数据(如高光谱图像或医学影像)可直接进行分解,近似为若干秩一非负张量的和。NMF、NTF 和 NTD 的研究动机在于:除了许多应用中所追求的降维效果外,基础数据本身往往是非负的,因此通过非负(最好再具备稀疏或平滑性)的成分进行建模与解释更为自然和有效。 NMF、NTF 与 NTD 在众多重要应用中都起着关键作用,包括:生物信息学、基因芯片分析、神经科学、文本挖掘、图像理解、大气污染研究、化学计量学以及光谱数据分析。除此之外,非负矩阵与张量分解还广泛应用于线性稀疏编码、图像分类、聚类、神经学习过程、声音识别、遥感以及目标表征等任务。例如,NMF/NTF 处理能够识别复杂生物系统中基因表达的可替代或上下文依赖模式,尤其有助于从癌症相关的基因芯片数据中恢复有意义的生物学信息。我们相信,NMF 及其扩展在科学进步中的潜在影响力,可能与独立成分分析(Independent Component Analysis, ICA)或奇异值分解(Singular Value Decomposition, SVD)与主成分分析(Principal Component Analysis, PCA)相当。与 ICA 或 SVD/PCA 不同,NMF/NTF 与 NTD 技术若能成功应用,能够在保持物理可行性的同时,提升大规模数据的可解释性与可视化效果。 来自不同领域的研究者对 NMF 与 NTF 有着多样化的兴趣。例如: * 神经科学与生物学家需要可靠的方法与技术,从受到大量噪声与干扰污染的叠加生物医学数据中提取或分离有用信息,例如利用非侵入式的人脑活动记录,探索大脑在感知、识别、存储与回忆模式方面的能力,并理解学习的核心要素:联想、抽象与泛化。 * 工程师与计算机科学家主要关注如何开发和实现灵活高效的算法,用于特定的工程与科学应用。 * 数学家与物理学家则更关注于发展基础理论,以理解已开发算法的机制、性质与能力,并将其推广到更复杂的模型。
这些研究群体之间的交互促进了 NMF/NTF 与 NTD 的跨学科研究,推动了实质性进展,并使各群体相互受益。 围绕 NMF、NTF 与 NTD 的理论已非常庞大,应用也极为广泛,因此我们不可能覆盖所有方向。本书的选材与处理方式反映了我们的研究背景与近五年的研究兴趣与成果。 本书系统覆盖了非负矩阵分解与张量分解的模型与算法,从理论与实践两个方面展开。核心目标是推导并在 MATLAB 中实现高效且相对简单的迭代算法,使其能够在真实世界数据上取得良好效果。事实上,本书所介绍的几乎所有算法都已经在 MATLAB 中实现并经过充分测试。我们尽可能以一般化与灵活的形式介绍概念、模型与算法,旨在激发读者的创造性,探索新的方法,并将这些算法应用于其特定需求与应用场景。 本书的主要章节安排如下: * 第 1 章:介绍基本的 NMF 模型及其扩展,讨论多向数组(张量)的基本性质与操作,提出基本的线性与多线性模型,为后续问题求解奠定分析框架。特别强调了稀疏表示的 NMF 算法及其扩展,如多层 NMF、半 NMF、稀疏 NMF、三因子 NMF、对称 NMF、正交 NMF、非平滑 NMF(nsNMF)、重叠 NMF、卷积 NMF(CNMF)与大规模 NMF。 * 第 2 章:综述并讨论一大类广义散度与相似度度量,为新型 NMF 与 NTF 算法的设计提供代价函数。这些散度涵盖了相对熵、广义 KL 散度、Hellinger 距离、Jensen-Shannon 散度、χ² 散度等,广泛应用于信号处理、模式识别、信息论、金融与经济等领域。 * 第 3–6 章:分别介绍乘法更新算法、交替最小二乘(ALS)算法、投影梯度(PG)算法以及二阶近似学习算法,重点讨论如何在稀疏性、平滑性、正交性等约束下改进性能与收敛性,尤其关注大规模问题。 * 第 7 章:推广前述结果到 NTF 与 NTD,重点介绍带非负性/半非负性约束的 PARAFAC 与 Tucker 模型,以及多层分层结构(HALS)算法,并展示其在去噪、压缩、特征提取、聚类、EEG 数据分析、脑机接口与视频跟踪中的应用。 * 第 8 章:选取若干实际应用,展示 NMF 与张量分解在数据聚类、文本挖掘、邮件监测、乐器分类、人脸识别、手写数字识别、纹理分类、光谱分析、高光谱成像以及基因表达分类中的应用。
本书既是一部教材,也是一部研究专著:作为教材,它系统介绍了非负与稀疏矩阵/张量分解的基本模型与算法;作为专著,它收录了许多新成果、新方法与新思想,并首次汇集于此。本书的双重特性使其对研究生与博士生,以及在生物医学工程、数据分析、数据挖掘、多维数据可视化、信号/图像处理、数学、计算机科学、金融、经济、优化、地球物理与神经计算等领域工作的科研人员都具有重要价值。此外,由于书中涵盖了众多可推广的成果与概念,本书也可能对其他科学领域的研究者有所裨益。读者既可以顺序通读全书,也可以单独阅读各章节,因为每章都尽量自成体系,交叉引用较少,因此浏览式阅读同样受到鼓励。