扩散模型(DM)已成为一类强大的生成性人工智能模型,在异常检测(AD)任务中展现了显著的潜力,广泛应用于网络安全、欺诈检测、医疗健康和制造业等多个领域。这两个领域的交叉,被称为基于扩散模型的异常检测(DMAD),为在日益复杂和高维数据中识别偏差提供了有前景的解决方案。在本综述中,我们回顾了DMAD研究的最新进展。我们首先介绍了异常检测(AD)和扩散模型(DM)的基本概念,接着对经典的DM架构进行全面分析,包括DDPMs、DDIMs和Score SDEs。进一步地,我们将现有的DMAD方法分为基于重建的、基于密度的和混合方法,并对它们的方法创新进行了详细考察。我们还探讨了不同数据模态下的多样化任务,包括图像、时间序列、视频和多模态数据分析。此外,我们讨论了关键挑战和新兴研究方向,包括计算效率、模型可解释性、鲁棒性增强、边缘-云协作以及与大语言模型的集成。DMAD相关的研究论文和资源可以在 https://github.com/fdjingliu/DMAD 找到。

1 引言

数据的体量、速度和多样性不断增加,给异常检测(AD)带来了机遇与挑战。在网络安全领域,实时威胁检测至关重要,因为网络流量和日志的不断涌入[刘等,2024b]。类似地,对于处理海量交易数据的金融机构而言,强大的欺诈检测系统是必不可少的[王等,2023a]。医疗健康和制造业也在不同程度上依赖数据进行早期疾病诊断和预测性维护[张等,2023]。这些应用凸显了在复杂数据集中高效识别异常值的自动化AD方法日益重要。然而,传统的技术,通常基于统计方法或规则系统,在面对现代数据的规模和复杂性时表现不佳[加藤等,2024]。具体来说,这些方法通常需要大量的手工特征工程,并且难以适应不断变化的数据分布。此外,庞大的数据量可能使传统方法无法处理,导致它们在实时应用中的计算不可行。因此,亟需更为复杂和可扩展的AD方法。例如,弱监督方法通过利用有限的标注数据来提高性能[刘等,2024c],推动了能够应对这些基本挑战的可扩展深度学习架构的创新。扩散模型(DM)作为一类强大的生成模型,已经成为合成跨越不同数据模态样本的有效工具[王等,2023c]。与生成对抗网络(GANs)和变分自编码器(VAEs)不同,后者可能会表现出训练不稳定或生成的样本不够精细[刀等,2024],扩散模型通过逐步去噪过程生成更加清晰、真实的样本[陈等,2024b]。因此,扩散模型在捕捉数据分布方面优于生成对抗网络[怀亚特等,2022],特别适用于异常检测,因为它们扩展了模型的模式覆盖,能够精确建模正常模式并随之识别分布异常点[李等,2024]。近年来,复杂和多维数据的增长为异常检测方法带来了新的挑战。在这种背景下,扩散模型因其与密度估计的内在联系而成为一种有前景的解决方案[乐兰和丁,2021]。扩散模型通过迭代去噪学习正常数据的概率分布。借助其卓越的生成能力,扩散模型准确重建正常模式,同时捕捉潜在的流形结构,通过重建误差分析和概率密度估计来实现异常检测[胡和金,2023]。例如,AnoDDPM[怀亚特等,2022]利用扩散模型通过重建误差进行异常检测,而ODD[王等,2023b]通过先进的生成建模来处理高维数据,进一步增强了这一方法。此外,学习到的得分函数,表示对数概率密度的梯度,可以直接用作异常得分,正如扩散时间估计中所示[利弗诺什等,2023]。

动机

尽管现有的综述分别回顾了异常检测[刘等,2024b;刘等,2024c]和扩散模型[罗,2023;杨等,2024b],但它们要么仅关注传统的深度学习方法而未考虑扩散模型的最新角色,要么仅将异常检测视为扩散模型的众多应用之一,并未进行深入分析。基于扩散模型的异常检测(DMAD)领域仍缺乏一个系统的、全面的综述,专门探讨扩散模型如何提升异常检测能力,这也是我们开展本研究并提供DMAD的全面和及时概述的动机,旨在捕捉该领域的现状和未来发展。

贡献

本综述的主要贡献有四个方面:

  1. 系统的分类法。我们首次提出了基于扩散模型的异常检测(DMAD)的全面分类法(如图1所示),将现有方法分类为基于重建、基于密度和混合方法,为理解这一新兴领域提供了结构化框架。
  2. 全面的回顾。基于所提出的分类法,我们系统地分析了DMAD在不同任务中的应用,包括图像异常检测(IAD)、时间序列异常检测(TSAD)、视频异常检测(VAD)和多模态异常检测(MAD),讨论了它们的方法、优缺点。
  3. 技术挑战与未来方向。我们识别并讨论了DMAD中的关键挑战,包括计算成本、可解释性、对抗攻击的鲁棒性、复杂数据分布、边缘-云协作以及与大语言模型(LLMs)的集成,同时提出了潜在的解决方案和未来研究方向。
  4. 资源与基准。我们提供了不同任务的代表性方法、实现、数据集和评估指标的全面收集,为研究人员和实践者提供了宝贵的资源。
成为VIP会员查看完整内容
23

相关内容

扩散模型是近年来快速发展并得到广泛关注的生成模型。它通过一系列的加噪和去噪过程,在复杂的图像分布和高斯分布之间建立联系,使得模型最终能将随机采样的高斯噪声逐步去噪得到一张图像。
工业机器视觉中的生成式人工智能综述
专知会员服务
44+阅读 · 2024年9月1日
基于Transformer模型的数据模态转换综述
专知会员服务
35+阅读 · 2024年8月17日
面向强化学习的可解释性研究综述
专知会员服务
42+阅读 · 2024年7月30日
时间序列和时空数据扩散模型综述
专知会员服务
58+阅读 · 2024年5月1日
基于人工反馈的强化学习综述
专知会员服务
64+阅读 · 2023年12月25日
专知会员服务
92+阅读 · 2021年8月29日
基于深度学习的视频目标检测综述
专知会员服务
83+阅读 · 2021年5月19日
专知会员服务
124+阅读 · 2021年4月29日
对抗样本生成技术综述
专知会员服务
65+阅读 · 2020年7月21日
生成式对抗网络GAN异常检测
专知会员服务
117+阅读 · 2019年10月13日
数据受限条件下的多模态处理技术综述
专知
17+阅读 · 2022年7月16日
基于模型的强化学习综述
专知
34+阅读 · 2022年7月13日
综述| 当图神经网络遇上强化学习
图与推荐
31+阅读 · 2022年7月1日
时空数据挖掘:综述
专知
26+阅读 · 2022年6月30日
零样本图像识别综述论文
专知
22+阅读 · 2020年4月4日
基于深度学习的目标检测算法综述
AI研习社
14+阅读 · 2018年4月25日
深度学习时代的目标检测算法
炼数成金订阅号
39+阅读 · 2018年3月19日
基于注意力机制的图卷积网络
科技创新与创业
73+阅读 · 2017年11月8日
国家自然科学基金
4+阅读 · 2015年12月31日
国家自然科学基金
1+阅读 · 2015年12月31日
国家自然科学基金
1+阅读 · 2015年12月31日
国家自然科学基金
1+阅读 · 2015年12月31日
国家自然科学基金
0+阅读 · 2015年12月31日
国家自然科学基金
1+阅读 · 2015年12月31日
国家自然科学基金
8+阅读 · 2015年12月31日
国家自然科学基金
2+阅读 · 2014年12月31日
国家自然科学基金
0+阅读 · 2014年12月31日
国家自然科学基金
15+阅读 · 2013年12月31日
Arxiv
165+阅读 · 2023年4月20日
A Survey of Large Language Models
Arxiv
431+阅读 · 2023年3月31日
Arxiv
72+阅读 · 2023年3月26日
Arxiv
157+阅读 · 2023年3月24日
Arxiv
22+阅读 · 2023年3月17日
VIP会员
相关VIP内容
工业机器视觉中的生成式人工智能综述
专知会员服务
44+阅读 · 2024年9月1日
基于Transformer模型的数据模态转换综述
专知会员服务
35+阅读 · 2024年8月17日
面向强化学习的可解释性研究综述
专知会员服务
42+阅读 · 2024年7月30日
时间序列和时空数据扩散模型综述
专知会员服务
58+阅读 · 2024年5月1日
基于人工反馈的强化学习综述
专知会员服务
64+阅读 · 2023年12月25日
专知会员服务
92+阅读 · 2021年8月29日
基于深度学习的视频目标检测综述
专知会员服务
83+阅读 · 2021年5月19日
专知会员服务
124+阅读 · 2021年4月29日
对抗样本生成技术综述
专知会员服务
65+阅读 · 2020年7月21日
生成式对抗网络GAN异常检测
专知会员服务
117+阅读 · 2019年10月13日
相关资讯
数据受限条件下的多模态处理技术综述
专知
17+阅读 · 2022年7月16日
基于模型的强化学习综述
专知
34+阅读 · 2022年7月13日
综述| 当图神经网络遇上强化学习
图与推荐
31+阅读 · 2022年7月1日
时空数据挖掘:综述
专知
26+阅读 · 2022年6月30日
零样本图像识别综述论文
专知
22+阅读 · 2020年4月4日
基于深度学习的目标检测算法综述
AI研习社
14+阅读 · 2018年4月25日
深度学习时代的目标检测算法
炼数成金订阅号
39+阅读 · 2018年3月19日
基于注意力机制的图卷积网络
科技创新与创业
73+阅读 · 2017年11月8日
相关基金
国家自然科学基金
4+阅读 · 2015年12月31日
国家自然科学基金
1+阅读 · 2015年12月31日
国家自然科学基金
1+阅读 · 2015年12月31日
国家自然科学基金
1+阅读 · 2015年12月31日
国家自然科学基金
0+阅读 · 2015年12月31日
国家自然科学基金
1+阅读 · 2015年12月31日
国家自然科学基金
8+阅读 · 2015年12月31日
国家自然科学基金
2+阅读 · 2014年12月31日
国家自然科学基金
0+阅读 · 2014年12月31日
国家自然科学基金
15+阅读 · 2013年12月31日
微信扫码咨询专知VIP会员