学会“成果速览”系列文章旨在将图像图形领域会议期刊重要成果进行传播,通过短篇文章让读者用母语快速了解相关学术动态,欢迎关注和投稿~
◆ ◆ ◆ ◆
泛化边缘保持和结构保持图像平滑模型
通讯作者:杨杰,黄晓霖
◆ ◆ ◆ ◆
图 1 我们的算法可以应用于(a)图像细节增强,(b)卡通图压缩伪影去除,(c)引导深度图超分辨,(d)图像去纹理。这些任务需要不同甚至相对立的平滑特性。
图像平滑滤波在计算机视觉以及图形图像学领域有着广泛的应用,同时不同的应用任务往往对平滑滤波特性有着不同的需求。然而当前大部分滤波器其内在平滑特性往往是固定的,因此只能适用于部分任务,同时当前大部分算法并没有对应用任务作出明确分类,因此其应用场景并不是很明确。为此,我们首先将大部分应用任务分为以下四类。
第一类主要任务包括图像细节增强,高动态图像压缩等任务。这类任务要求能够平滑掉细节同时保留显著性边界。显著性边界既不能被模糊也不能被锐化,但是其幅值可以被压缩。显著性边界被模糊会引起晕轮现象(halos),而锐化会引起梯度翻转现象(gradient reversals)。
第二类任务包括卡通图压缩伪影去除,图像抽象画,仿铅笔画素描生成。这类任务要求能够去除细小结构的同时锐化显著图像边界,同时显著性边界的幅值不能被压缩。图1(b)展示了示例。
第三类为引导图像滤波,包括引导深度图超分辨和闪光/非闪光图像滤波等。这类任务的主要难点问题是对目标图和引导图结构不一致问题的鲁棒性,因为结构不一致会导致平滑后的图像存在纹理拷贝或者模糊边界的问题。同时由于目标图中往往含有噪音,因此这类任务还需要平滑后的图像边界能够被锐化,如图1(c)所示。
第四类任务主要为结构保持滤波任务,如图像去纹理。这类算法要求保持显著性结构即使其对应的边界很弱,同时平滑掉小的结构即使其对应的边界很强。这种平滑特性要求与前三类任务完全不同,前三类任务要求保持显著性边界,而第四类任务要求保持显著性结构。
为了更为详细的区分不同的平滑任务,我们将第一到第三类旨在保留边缘的任务归为保边平滑的范畴,而将第四种集中于保留结构的任务定义为结构保持的平滑。针对于这两种图像平滑,研究人员们提出了一系列平滑操作,但它们都是针对特定任务设计,能进行的平滑处理也相对固定,但目前几乎没有能同时处理以上四种平滑需求的操作。
为了提高平滑算法的适应性,我们提出了一种基于非凸非平滑的优化框架,可以实现多种不同功能的平滑,为上述四类平滑需求提供了统一的解决方案。并在各种任务中取得当前最好的实验结果。
截断Huber惩罚函数
Huber惩罚函数的定义如下,可以看到在
而截断Huber则引入了一个新的参数 b 来对 x>b 的区域进行饱和处理,所有超过的值都将被限制在 b-a/2 的数值上:
截断Huber在不同的参数设置下可以灵活的表现出不同的特性。假设输入图像的强度范围在
图 2 不同参数下的截断Huber惩罚函数
模型
通过使用截断Huber惩罚函数的高度灵活性,我们可以有效构建一个高效的目标函数来实现多功能的平滑处理。在给定输入图像f和引导图像 g 的前提下,输出图像 u 是下列目标函数的解:
其中
其中 g 表示引导图像,可以为输入图像f,
通过对
我们模型不同模态下的平滑特性在一维信号中的示意图如图3。具体分析可参考我们的文章第3.4章节。
图 3 我们的模型不同模态一维信号平滑示意图以及与当前最好算法对比
我们将所提出的模型应用于所提出的四类任务。在第一类任务中,我们应用于图像细节增强和高动态图像压缩,实验结果如图4和图5所示。可以看出我们算法在抑制该类应用中的晕轮和梯度翻转挑战问题中有着很好的表现。
图 4 图像细节增强实验结果及对比
图 5 高动态图像压缩实验结果及对比
对于第二类任务,我们将算法应用于卡通图去压缩伪影,实验结果如图6所示。从结果中可以看出我们的算法对于锐化强边界和保持弱边界方面都有着很好的表现。
图 6 去卡通图压缩伪影实验结果及对比
对于第三类任务,我们将算法应用于引导深度图超分辨,实验结果及对比如图7所示,同时下列表格中展示了量化对比。可以看出我们的算法取得了当前最好的实验结果。
图 7 引导深度图超分辨实验结果及对比
对于第四类任务,我们将算法应用于图像去纹理,实验结果及对比如图8所示。可以看出我们的算法在去除强边界的小纹理结构和保持弱边界的大纹理结构方面有着优于其他算法的表现。
图 8 图像去纹理实验结果及对比
在本文章中,我们提出了一种可用于边缘保持和结构保持的平滑滤波算法。我们首先引入了截断Huber惩罚函数,该惩罚函数具有高度灵活性,在不同参数下具有不同的惩罚特性。基于该灵活性,我们进一步提出了高度泛化的图像平滑算法。该算法可用于不同任务,实现不同的平滑特性,这与以往提出的图像平滑算法是截然不同的。我们的算法甚至能够实现之前算法无法实现的平滑特性,因此我们的算法可以处理更具挑战性的任务。同时我们提出的求解算法能够高效的优化所提出的非凸非光滑优化问题。通过大量实验,我们对所提出的算法的有效性进行了充分的验证。
[1] Z. Farbman, R. Fattal, D. Lischinski, and R. Szeliski, “Edgepreserving decompositions for multi-scale tone and detail manipulation,” in ACM Transactions on Graphics (TOG), vol. 27, no. 3. ACM, 2008, p. 67.
[2] K. He, J. Sun, and X. Tang, “Guided image filtering,” IEEE Transactions on Pattern Analysis and Machine Intelligence (TPAMI), vol. 35, no. 6, pp. 1397–1409, 2013.
[3] L. Xu, C. Lu, Y. Xu, and J. Jia, “Image smoothing via l 0 gradient minimization,” in ACM Transactions on Graphics (TOG), vol. 30, no. 6. ACM, 2011, p. 174.
[4] B. Ham, M. Cho, and J. Ponce, “Robust guided image filtering using nonconvex potentials,” IEEE Transactions on Pattern Analysis and Machine Intelligence (TPAMI), vol. 40, no. 1, pp. 291–307, 2018.
[5] L. Xu, Q. Yan, Y. Xia, and J. Jia, “Structure extraction from texture via relative total variation,” ACM Transactions on Graphics (TOG), vol. 31, no. 6, p. 139, 2012.