【博士论文】基于深度学习的图像处理算法研究

基于深度学习的图像处理算法研究

随着智能手机和微单相机的普及,拍照已经变成人们日常生活中不可缺少的一部分,图像也已成为人类社会的重要信息媒介。然而受到拍照环境、设备和技术的影响,图像中难免会出现退化现象,如何从图像处理的角度提升拍摄照片的质量具有重要的研究意义与应用价值。近年来,深度学习技术得到了巨大的发展,并广泛应用于图像处理领域。相对于许多传统算法,深度学习技术从海量的训练数据中学习到的先验知识具有更强的泛化能力和更复杂的参数化表达,且无需调节算法参数以适应不同的应用场景。得益于上述优势,深度学习技术已经广泛应用于图像处理领域,如何利用深度学习算法提升图像处理的效果也变成了一个重要的研究方向。

尽管深度学习技术显著促进了图像处理领域的发展,但是受限于其对训练数据的敏感性,在面对无标签、仅有弱标签或者合成伪标签的数据时,深度学习技术的优势难以充分体现。本学位论文针对以上挑战,重点研究了缺失完整数据标签的经典图像处理问题,包括图像平滑、反光去除和本征图像分解等。本文通过将上述问题抽象为对图像结构敏感的图像分解问题,将显著的目标边缘信息通过优化或者滤波的方式编码进深度学习的算法设计中。根据图像处理问题中数据标签的类型和数量不同,本文依次提出了基于无监督学习、弱监督学习和多标签联合训练的深度学习解决方案。本文的最后提出了解耦学习框架,通过对10种不同图像处理问题的联合训练,提炼出了图像处理问题的核心解空间。该算法对于理解深度学习技术在图像处理领域的应用有重要的研究价值和意义。本文的创新点和贡献包括以下几个方面:

(1) 一种基于无监督学习的空间自适应图像平滑算法

该算法通过使用卷积神经网络,以无监督的方式从无标签数据中学习图像平滑的优化过程,并实现可灵活调节的图像平滑效果。该算法提出了一个由边缘保持项和空间自适应平滑项构成的能量函数,前者用于保持重要但易破坏的图像结构,后者用于将多种形式的正则器(Lp范数)施加至图像的不同区域。由于缺乏平滑图像的真值数据,本文采用一个无监督学习的能量优化框架,用来实现多种基于图像平滑的视觉应用,譬如图像抽象化、铅笔素描、细节增强、纹理去除和基于内容的图像处理等。实验结果表明,该基于无监督学习的空间自适应图像平滑算法获得了更好的视觉结果。

(2) 一种基于弱监督学习的图像反光去除算法

该算法提出了一个多阶段卷积神经网络,用以解决图像分解领域中经典的反光去除问题。本算法框架由两个结构相似的卷积神经网络串联而成,前者预测目标图像的边缘结构,后者依据预测边缘信息的引导重建目标图像;整个过程既不需要任何人工设计,也不依赖于其他图像处理应用。通过从真实反光图像观察得到的图像亮度和结构先验,该算法设计了一种针对模糊强反光的反光图像合成算法;通过将合成数据以弱监督信号的形式融入到多阶段神经网络训练中,该算法获得了在真实反光图像上的良好泛化性能。实验结果表明,该基于弱监督学习的图像反光去除算法在不同程度的反光场景中均获得更优的视觉效果。

(3) 一种基于多标签联合训练的本征图像分解算法

本征图像分解往往存在数据集冗杂、数据标签不一致等问题。为解决该问题,本文提出了一个通用的核心神经网络,用以在不同类型的数据标签中共享本征图像形成过程的稀疏先验。该神经网络由三个不同的基础模块组成:直接本征图像估计网络、导向网络和域滤波器;其中,直接本征图像估计网络通过对本征图像的直接监督获得初始的预测结果,导向网络负责生成稀疏的反射结构先验,并引导域滤波器获得干净的反射估计。该算法设计了一个灵活的能量损失层以实现多标签数据联合训练的目的。实验结果表明,该本征图像分解算法在所有的主流基准数据集上都获得了更高的精确度。

(4) 一种基于解耦学习的实时参数化图像处理框架

传统的深度学习算法在面对不同的图像处理应用时,需要重复地训练神经网络。为了解决这个问题,该算法提出了由基础网络和权重学习网络组成的解耦学习框架,其中前者用来实现具体的图像处理应用,后者用来学习基础网络的权重。该算法通过对基础网络的结构和权重进行解耦,达到根据图像处理应用的变化实时动态调整基础网络权重的效果,并因此实现了利用单一神经网络融合多种图像处理应用的目的。实验结果表明,该解耦学习框架成功应用在10种不同的参数化图像算子中,并减少了网络参数的存储空间。

成为VIP会员查看完整内容