来自西安交通大学的谢琦博士论文,入选2022年度“CCF优秀博士学位论文奖”初评名单!
https://www.ccf.org.cn/Focus/2022-12-08/781244.shtml
随着信息获取与处理技术飞速发展,图像数据处理与分析技术已经与人类生活息 息相关。在这个过程中,图像结构的数学表示与建模发挥着十分重要的作用。现阶段, 对灰度图像的二维空间结构的建模已有较多研究,然而不同场景下的图像数据往往有 着较大的差异,现有的建模方法并不能满足不同场景的特异化需求。因此,在针对特定 场景构建图像数据模型时,合理应用场景独特的领域知识有着十分重要的意义。本论文主要研究几种典型图像处理与分析场景下的领域知识建模方法,既涉及无 监督学习框架,也涉及有监督学习框架。其中无监督学习的场景包括高阶数据的稀疏 性先验建模、彩色图像的非局部相似性建模以及低剂量 CT 图像的噪声建模三个应用;有监督学习的场景包括高光谱图像融合、眼底视网膜病灶检测两个应用。所取得的主 要成果包括➀:
(1) 提出了一种新型的高阶稀疏性度量。目前,张量 (高阶数组) 数据的合理稀疏性 度量构造,仍未形成统一的解决方案。本文针对这一问题,基于张量的 Kronecker 基表 示构造了一种新型张量稀疏性度量。相比传统度量,所提张量稀疏性度量不仅充分编 码了对于两种经典张量分解方式(Tucker 分解与 CP 分解)的稀疏性内涵,而且具有与 传统的向量/矩阵稀疏性度量的一致性,同时蕴含显著的物理意义,即表达张量需要的 1 秩 Kronecker 基个数。所提度量在几种高维图像数据处理问题上都取得了良好的应用 效果。
(2) 提出了一种具有旋转与颜色不变性的彩色图像非局部自相似性建模方法。非局 部自相似性是图像处理中最常用也最有效的图像先验,然而,现有方法忽略了结构相 似但颜色与纹理方向不同的图像块之间的强相似性。本文首次用图像先验分布的形式 建模了具有旋转与颜色不变性的非局部自相似性,更准确地刻画了彩色图像的非局部 自相似结构,并将其应用到彩色图像去噪问题中,取得了优于现有基于非局部自相似 性去噪方法的效果。
(3) 提出了一种噪声生成机制嵌入的 CT 弦图去噪方法。本文充分考虑了低剂量 CT 中两个本征噪声源的统计特性,即 X 射线的量子随机性和背景电噪声,将低剂量 CT 弦 图预处理问题标准化为最大后验概率(MAP)估计问题。同时,针对 CT 弦图独特的分 片线性特征,提出了一种新的 CT 弦图先验分布,能合理地建模 CT 弦图的特性。与传 统的弦图去噪方法相比,所提模型的似然(损失)项和先验(正则)项都得到了更准确 的改进,更符合 CT 弦图生成机制的统计本质,因而可获得更优的 CT 弦图去噪效果。 (4) 提出了一种物理机制嵌入的深度高光谱融合网络。本文将低分辨率图像的生成 模型和高光谱图像的低秩先验知识结合,提出一种新的高光谱融合模型,并将模型的 求解过程融入深度网络的设计,构建了一个新的高光谱融合网络——MHF-net。由于模 型和算法的精心设计,所提网络的基本模块不仅具有清晰的可解释性,而且很好地嵌入了低分辨率图像的内在生成机制。大量实验上说明,所提方法相比传统深度网络有 着本质的泛化性提升。
(5) 提出了一种领域知识嵌入的深度视网膜眼底病灶分割网络。首先,本文充分考 虑了前景(病灶)和背景(视网膜底版图像)特征,以前景背景分离的方式对视网膜眼 底图像进行建模。然后,本文为所提模型设计了有效的 EM 求解算法,并据此构建了一 种与算法的求解过程一致的新型视网膜眼底病灶分割网络,称为 EM-Net。相比于传统 视网膜眼底病灶分割网络,所提方法能够将视网膜眼底图像与病灶的结构信息合理地 嵌入网络的设计中,从而得到了超越现有方法的效果。