扩散模型(DMs)代表了图像超分辨率(SR)领域的重大进步,使技术图像质量更加符合人类偏好,并扩展了SR应用。DMs解决了先前方法的关键局限性,提高了SR图像的整体真实感和细节。然而,DMs存在颜色偏移问题,且高计算成本要求高效采样替代方案,这凸显了平衡计算效率和图像质量的挑战。这篇综述概述了将DMs应用于图像SR的情况,并提供了一项详细分析,强调了该领域内独特的特征和方法论,与该领域更广泛的现有综述截然不同。它呈现了DM基础知识的统一视角,并探索了研究方向,包括替代输入域、条件策略、引导、腐败空间和零样本方法。这篇综述提供了关于DMs在图像SR领域演化的见解,涵盖了当前趋势、挑战和这个快速发展领域的未来方向。

在不断发展的计算机视觉领域中,超分辨率(SR)——将低分辨率(LR)图像增强为高分辨率(HR)图像——一直是一个长期而仍然令人困惑的挑战,这归因于其本质上不适定的特性:由于亮度和颜色等多种因素,任何给定的LR图像都可以对应多个有效的HR图像【1】。SR的应用范围从自然【2】【3】到先进的卫星【4】和医学成像【5】,其进展得益于深度学习的快速发展。最近,扩散模型(DMs)作为一种主要的生成模型家族崭露头角,挑战着生成对抗网络(GANs)长期以来的主导地位【6】【7】【8】【9】。虽然早期的生成模型展示了令人印象深刻的图像生成能力,但它们存在内在的局限性。例如,自回归模型在生成HR图像时可能成本过高【10】【11】【12】。另一方面,NFs和VAEs通常生成的样本质量不理想。此外,GANs需要精心设计的正则化和优化策略来管理优化不稳定性并防止模式崩溃【13】。尽管如此,这些模型对SR领域的贡献仍然显著。 DMs的出现标志着生成模型的新时代,并深刻影响了生成式AI领域,再次为图像SR领域注入活力。然而,随着关于DMs的研究量持续增长,对于那些新入此领域的人来说,跟上最新发展变得越来越具有挑战性。这一研究领域的广度可能会掩盖主要趋势,并可能阻碍进一步研究的进展。我们通过提供对图像SR中DMs当前研究的全面概述来解决这些问题。 这篇综述是在我们之前的作品《超分辨率领域的搭车旅行指南》【14】的基础上建立的,该作品对图像SR领域进行了广泛的概述。我们旨在为那些新入DMs在图像SR领域的人提供一个有价值的切入点,同时为那些已有经验的人提供更广阔的视角。

本文的结构如下所述: 第2节 - 超分辨率基础:这一节提供了基本定义,并介绍了评估图像质量时常用的标准数据集、方法和度量,这些都是图像SR出版物中常用的。 第3节 - 扩散模型基础:介绍了扩散模型(DMs)的原理和各种形式,包括去噪扩散概率模型(DDPMs)、基于评分的生成模型(SGMs)和随机微分方程(SDEs)。这一节还探讨了DMs与其他生成模型的关系。 第4节 - 扩散模型的改进:常见的增强DMs的实践,重点是高效采样技术和改进的似然估计。 第5节 - 图像SR中的扩散模型:介绍了DMs在SR中的具体实现,探讨了替代领域(潜在空间和小波域),讨论了架构设计和多任务Null-Space模型,并研究了替代腐败空间。 第6节 - 领域特定应用:基于DM的SR应用,特别是医学成像、盲目面部恢复、面部SR中的大气湍流以及遥感。 第7节 - 讨论和未来工作:图像SR中DMs的常见问题和值得注意的DMs在图像SR中的研究途径。 第8节 - 结论:总结了这项调查。

成为VIP会员查看完整内容
22

相关内容

扩散模型是近年来快速发展并得到广泛关注的生成模型。它通过一系列的加噪和去噪过程,在复杂的图像分布和高斯分布之间建立联系,使得模型最终能将随机采样的高斯噪声逐步去噪得到一张图像。
大型语言模型图表示学习:技术的全面综述
专知会员服务
42+阅读 · 2月14日
《多模态大模型少样本自适应》综述
专知会员服务
81+阅读 · 1月4日
中科大等最新《基于扩散模型的图像恢复和增强》综述
专知会员服务
34+阅读 · 2023年8月22日
【ICML2023】无消息传递的transformer图归纳偏差
专知会员服务
24+阅读 · 2023年6月1日
Transformer推理的全栈优化综述
专知会员服务
82+阅读 · 2023年3月4日
视觉的有效扩散模型综述
专知会员服务
87+阅读 · 2022年10月20日
专知会员服务
36+阅读 · 2021年6月19日
【WWW2021】归一化硬样本挖掘的双重注意匹配网络
专知会员服务
17+阅读 · 2021年3月31日
时空数据挖掘:综述
专知
22+阅读 · 2022年6月30日
关于GANs在医学图像领域应用的总结
人工智能前沿讲习班
31+阅读 · 2019年6月4日
再谈人脸识别损失函数综述
人工智能前沿讲习班
14+阅读 · 2019年5月7日
CVPR 2019 | 无监督领域特定单图像去模糊
PaperWeekly
14+阅读 · 2019年3月20日
基于Tacotron模型的语音合成实践
深度学习每日摘要
15+阅读 · 2018年12月25日
深度学习与计算机视觉任务应用综述
深度学习与NLP
49+阅读 · 2018年12月18日
国家自然科学基金
1+阅读 · 2015年12月31日
国家自然科学基金
0+阅读 · 2015年12月31日
国家自然科学基金
0+阅读 · 2015年12月31日
国家自然科学基金
4+阅读 · 2015年12月31日
国家自然科学基金
0+阅读 · 2015年12月31日
国家自然科学基金
0+阅读 · 2015年12月31日
国家自然科学基金
1+阅读 · 2015年12月31日
国家自然科学基金
0+阅读 · 2014年12月31日
国家自然科学基金
1+阅读 · 2014年12月31日
Arxiv
142+阅读 · 2023年4月20日
A Survey of Large Language Models
Arxiv
349+阅读 · 2023年3月31日
VIP会员
相关VIP内容
大型语言模型图表示学习:技术的全面综述
专知会员服务
42+阅读 · 2月14日
《多模态大模型少样本自适应》综述
专知会员服务
81+阅读 · 1月4日
中科大等最新《基于扩散模型的图像恢复和增强》综述
专知会员服务
34+阅读 · 2023年8月22日
【ICML2023】无消息传递的transformer图归纳偏差
专知会员服务
24+阅读 · 2023年6月1日
Transformer推理的全栈优化综述
专知会员服务
82+阅读 · 2023年3月4日
视觉的有效扩散模型综述
专知会员服务
87+阅读 · 2022年10月20日
专知会员服务
36+阅读 · 2021年6月19日
【WWW2021】归一化硬样本挖掘的双重注意匹配网络
专知会员服务
17+阅读 · 2021年3月31日
相关资讯
时空数据挖掘:综述
专知
22+阅读 · 2022年6月30日
关于GANs在医学图像领域应用的总结
人工智能前沿讲习班
31+阅读 · 2019年6月4日
再谈人脸识别损失函数综述
人工智能前沿讲习班
14+阅读 · 2019年5月7日
CVPR 2019 | 无监督领域特定单图像去模糊
PaperWeekly
14+阅读 · 2019年3月20日
基于Tacotron模型的语音合成实践
深度学习每日摘要
15+阅读 · 2018年12月25日
深度学习与计算机视觉任务应用综述
深度学习与NLP
49+阅读 · 2018年12月18日
相关基金
国家自然科学基金
1+阅读 · 2015年12月31日
国家自然科学基金
0+阅读 · 2015年12月31日
国家自然科学基金
0+阅读 · 2015年12月31日
国家自然科学基金
4+阅读 · 2015年12月31日
国家自然科学基金
0+阅读 · 2015年12月31日
国家自然科学基金
0+阅读 · 2015年12月31日
国家自然科学基金
1+阅读 · 2015年12月31日
国家自然科学基金
0+阅读 · 2014年12月31日
国家自然科学基金
1+阅读 · 2014年12月31日
微信扫码咨询专知VIP会员