Diffusion Model是近年来快速发展并得到广泛关注的生成模型。它通过一系列的加噪和去噪过程,在复杂的图像分布和高斯分布之间建立联系,使得模型最终能将随机采样的高斯噪声逐步去噪得到一张图像。在生成效果上,diffusion model可以媲美广受欢迎的GAN的方法,并且相比GAN,diffusion model是基于最大似然的生成模型,在训练时不会遇到模式崩塌和不稳定的情况。此外GAN的discriminator的判别能力限制了GAN的生成多样性,而diffusion model的多样性更为丰富,并且在有条件生成任务中,由于diffusion model是从随机的噪声开始采样,即使对于同一张参考,diffusion model也可以给出理论上无限多的采样结果。这一特征在实际应用中颇为重要,目前已有不少工作将有条件生成的diffusion model运用在文字/分割图/简笔画到图像生成、图像编辑、超分辨率等任务中,取得不少成果。