扩散模型(DM)已成为一类强大的生成性人工智能模型,在异常检测(AD)任务中展现了显著的潜力,广泛应用于网络安全、欺诈检测、医疗健康和制造业等多个领域。这两个领域的交叉,被称为基于扩散模型的异常检测(DMAD),为在日益复杂和高维数据中识别偏差提供了有前景的解决方案。在本综述中,我们回顾了DMAD研究的最新进展。我们首先介绍了异常检测(AD)和扩散模型(DM)的基本概念,接着对经典的DM架构进行全面分析,包括DDPMs、DDIMs和Score SDEs。进一步地,我们将现有的DMAD方法分为基于重建的、基于密度的和混合方法,并对它们的方法创新进行了详细考察。我们还探讨了不同数据模态下的多样化任务,包括图像、时间序列、视频和多模态数据分析。此外,我们讨论了关键挑战和新兴研究方向,包括计算效率、模型可解释性、鲁棒性增强、边缘-云协作以及与大语言模型的集成。DMAD相关的研究论文和资源可以在 https://github.com/fdjingliu/DMAD 找到。
数据的体量、速度和多样性不断增加,给异常检测(AD)带来了机遇与挑战。在网络安全领域,实时威胁检测至关重要,因为网络流量和日志的不断涌入[刘等,2024b]。类似地,对于处理海量交易数据的金融机构而言,强大的欺诈检测系统是必不可少的[王等,2023a]。医疗健康和制造业也在不同程度上依赖数据进行早期疾病诊断和预测性维护[张等,2023]。这些应用凸显了在复杂数据集中高效识别异常值的自动化AD方法日益重要。然而,传统的技术,通常基于统计方法或规则系统,在面对现代数据的规模和复杂性时表现不佳[加藤等,2024]。具体来说,这些方法通常需要大量的手工特征工程,并且难以适应不断变化的数据分布。此外,庞大的数据量可能使传统方法无法处理,导致它们在实时应用中的计算不可行。因此,亟需更为复杂和可扩展的AD方法。例如,弱监督方法通过利用有限的标注数据来提高性能[刘等,2024c],推动了能够应对这些基本挑战的可扩展深度学习架构的创新。扩散模型(DM)作为一类强大的生成模型,已经成为合成跨越不同数据模态样本的有效工具[王等,2023c]。与生成对抗网络(GANs)和变分自编码器(VAEs)不同,后者可能会表现出训练不稳定或生成的样本不够精细[刀等,2024],扩散模型通过逐步去噪过程生成更加清晰、真实的样本[陈等,2024b]。因此,扩散模型在捕捉数据分布方面优于生成对抗网络[怀亚特等,2022],特别适用于异常检测,因为它们扩展了模型的模式覆盖,能够精确建模正常模式并随之识别分布异常点[李等,2024]。近年来,复杂和多维数据的增长为异常检测方法带来了新的挑战。在这种背景下,扩散模型因其与密度估计的内在联系而成为一种有前景的解决方案[乐兰和丁,2021]。扩散模型通过迭代去噪学习正常数据的概率分布。借助其卓越的生成能力,扩散模型准确重建正常模式,同时捕捉潜在的流形结构,通过重建误差分析和概率密度估计来实现异常检测[胡和金,2023]。例如,AnoDDPM[怀亚特等,2022]利用扩散模型通过重建误差进行异常检测,而ODD[王等,2023b]通过先进的生成建模来处理高维数据,进一步增强了这一方法。此外,学习到的得分函数,表示对数概率密度的梯度,可以直接用作异常得分,正如扩散时间估计中所示[利弗诺什等,2023]。
尽管现有的综述分别回顾了异常检测[刘等,2024b;刘等,2024c]和扩散模型[罗,2023;杨等,2024b],但它们要么仅关注传统的深度学习方法而未考虑扩散模型的最新角色,要么仅将异常检测视为扩散模型的众多应用之一,并未进行深入分析。基于扩散模型的异常检测(DMAD)领域仍缺乏一个系统的、全面的综述,专门探讨扩散模型如何提升异常检测能力,这也是我们开展本研究并提供DMAD的全面和及时概述的动机,旨在捕捉该领域的现状和未来发展。
本综述的主要贡献有四个方面: