GNN如何异常检测？首篇《图神经网络异常检测》综述来啦

2022 年 10 月 11 日 图与推荐

图被广泛用于复杂系统的建模，检测图中的异常是复杂系统分析中的一项重要任务。图异常是指图中的模式不符合图的属性和/或结构所期望的正常模式。近年来，图神经网络(GNNs)得到了广泛的研究，并成功地完成了节点分类、链接预测和图分类等困难的机器学习任务，这得益于在有效学习图表示中通过消息传递实现的高度表达能力。为了解决图异常检测问题，基于GNN的方法利用关于图属性(或特征)和/或结构的信息来学习对异常进行适当的评分。在这篇综述中，我们回顾了使用GNN模型检测图异常的最新进展。具体而言，我们根据图类型(即静态和动态)、异常类型(即节点、边、子图和全图)和网络架构(如图自动编码器、图卷积网络)对基于GNN的方法进行了总结。据我们所知，这次综述是第一次全面回顾基于GNN的图异常检测方法。

图形是一种有效的数据结构，可以有效地表示和提取复杂的数据模式，广泛应用于社交媒体、电子商务、生物学、学术和通信等众多领域。图中表示的数据对象是相互关联的，对象通常表示为节点，它们的关系表示为节点之间的边。图的结构指的是节点如何通过单独的边相互关联，并且可以有效地表示节点之间甚至深远的关系。此外，通过使用节点和/或边的属性来增强图的结构表示，图可以在语义上得到丰富。

异常检测是识别明显偏离通常观察到的模式的异常模式的过程。这是一项重要的任务，因为在各个领域的需求和应用不断增加。自从Grubbs等人[1]首次引入异常(或离群值)的概念以来，人们对异常检测进行了大量的研究。此后，随着近年来图挖掘技术的发展，图异常检测备受关注[2]，[3]。图异常检测的早期工作很大程度上依赖于领域知识和统计方法，其中检测异常的特征大多是手工制作的。这种手工制作的检测任务自然非常耗时和费力。此外，真实的图通常包含大量的节点和标记有大量属性的边，因此是大规模和高维的。为了克服早期工作的局限性，最近深度学习方法在从图[4]中检测异常时受到了相当多的关注。深度学习具有非线性的多层结构，可以对大规模高维数据进行检测，并从数据中提取模式，从而获得令人满意的性能，而无需手工制作特征[5]、[6]。

最近，图神经网络(GNN)通过学习图表示(例如[7]，[8])中的消息传递机制具有高度的表达能力，因此被用于高效、直观地检测图中的异常。使用GNN，从图中学习和提取异常模式，即使是那些具有高度复杂结构或属性的图，也相对简单，因为GNN本身处理的图具有属性作为输入数据[9]。最先进的图异常检测方法[7]、[10]将GNN与现有的深度学习方法相结合，其中GNN捕获图的特征，而深度学习捕获其他类型的信息(如时间)。图1给出了用GNN进行图异常检测的一个例子。假设节点(A)和(C)根据节点属性被检测到异常，节点(A)和(B)根据图拓扑被检测到异常。那么，如果同时考虑节点属性和图拓扑作为异常因素，则只检测到节点(A)异常。GNN模型使我们能够通过同时检查图拓扑和节点属性来检测这种异常。

在本综述中，我们概述了基于GNN的图异常检测方法，并主要从图的类型(即静态图和动态图)进行了综述。与其他调研相关的话题——图异常检测(一般)[2],[3],图像异常检测具体使用深度学习[11],[12],和一般的异常检测使用深度学习[13],[14],本调研旨在涉及的独特角度图使用GNN异常检测模型。鉴于GNN在图异常检测中的重要意义和正在进行的积极研究工作，我们相信，对这一特定主题的全面调研是及时的，对研究社区是有益的。图2为调研方法的时间轴。第三节中的调研是根据其他图异常检测调研[3]、[2]、[11]、[12]所使用的分类框架组织的。这一领域仍然是新的，尽管研究主题的分布似乎倾向于静态图中的节点异常，但已发表的方法覆盖了广泛的图(静态与动态、普通与属性)和异常类型(结构、节点、边、子图)。此外，在第四节中，我们分享了关于使用GNN进行图异常检测的几个有前途的机遇和挑战的观点。

基于GNN的图异常检测

A.基于GNN的静态图异常检测

静态图异常检测的大部分研究都是针对节点异常，只有少数研究是针对边缘异常和子图异常。

1) 异常节点检测:

使用GNNs检测异常节点主要在属性图中进行。每一种基于GNN的方法都从静态属性图中提取节点属性信息和结构信息，并使用一定的评分算法评估节点的异常评分。人们提出了各种基于GNN的方法来有效地从属性图中提取必要的特征。我们根据这些方法的网络架构对它们进行分类，然后简要描述每种方法背后的关键思想。根据结构信息，异常节点可进一步划分为三类:全局异常、结构异常和群体异常[12]。全局异常称为图中的偏离节点属性;结构异常在图中称为偏离的结构信息;团体异常是指同一团体中节点属性的偏差和结构信息的偏差。请注意，相当数量的基于gnn的方法是建立在用GCN或GAT实例化的图形自动编码器(GAE)框架之上的。对于静态图中的异常节点检测，我们回顾了基于GNN的GAE方法以及独立GNN方法。

2) 异常边缘检测:

异常边缘通常表示图中节点之间不同的或非典型的相互作用。在静态图中这种异常边缘检测的研究相对有限。Duan等人[48]提出了异常感知网络嵌入(AANE)，该网络为平面图设计，并使用基于gcn的GAE框架实现。该方法调整了拟合损失和“异常感知”损失，包括偏差损失和去除损失。损失函数的概率是一个优势的得分。概率较低的边更有可能是异常边。Song等人[50]提出了用于欺诈检测的基于子图的框架(SubGNN)。提取靠近目标边缘的子图并重新标记以保证实体独立性。提出的关系图同构网络(R-GIN)学习特征，用于精确的欺诈检测。Zhang等人[49]提出了一种基于竞争图神经网络(CGNN)的欺诈检测系统(eFraudCom)，用于检测电子商务平台上的欺诈行为。CGNN是一种基于gcn的GAE系统。eFraudCom系统由一个数据处理器和一个欺诈检测器组成。具体而言，在数据处理器中对有代表性的法向数据进行采样，生成包含采样的法向数据和其余数据的异构图;在欺诈检测器中，对图中的邻居进行采样，并通过CGNN检测异常边缘。

3)异常子图检测: 异常子图检测比异常节点或边缘检测更具挑战性。值得注意的一点是，异常子图中的节点和边本身可以被认为是正常的。此外，子图的结构和大小可以非常多样化。大概是由于这一挑战，文献中只有有限的研究。我们发现了一种GCN方法和一种基于gat的GAE方法。

B.基于GNN的动态图异常检测

与静态图不同，动态图的结构或属性会随时间变化，时间性是动态图的一个重要因素。最近，基于图社区、压缩、分解、距离度量和图特征[2]的概率建模，提出了各种检测随时间变化或演化的图异常的方法。针对动态图提出了几种方法，将GCN与适合于时间处理的深度学习方法相结合，如循环神经网络(RNN)、门控循环单元(GRU)和transformer。一些研究解决了在动态图的边或节点中检测异常的问题。目前还没有关于异常子图检测的研究。

登录查看更多

相关内容

异常检测

关注 0

在数据挖掘中，异常检测（英语：anomaly detection）对不符合预期模式或数据集中其他项目的项目、事件或观测值的识别。通常异常项目会转变成银行欺诈、结构缺陷、医疗问题、文本错误等类型的问题。异常也被称为离群值、新奇、噪声、偏差和例外。特别是在检测滥用与网络入侵时，有趣性对象往往不是罕见对象，但却是超出预料的突发活动。这种模式不遵循通常统计定义中把异常点看作是罕见对象，于是许多异常检测方法（特别是无监督的方法）将对此类数据失效，除非进行了合适的聚集。相反，聚类分析算法可能可以检测出这些模式形成的微聚类。有三大类异常检测方法。[1] 在假设数据集中大多数实例都是正常的前提下，无监督异常检测方法能通过寻找与其他数据最不匹配的实例来检测出未标记测试数据的异常。监督式异常检测方法需要一个已经被标记“正常”与“异常”的数据集，并涉及到训练分类器（与许多其他的统计分类问题的关键区别是异常检测的内在不均衡性）。半监督式异常检测方法根据一个给定的正常训练数据集创建一个表示正常行为的模型，然后检测由学习模型生成的测试实例的可能性。

GNN如何异常检测？首篇《图神经网络图异常检测》综述全面阐述GNN图异常检测方法体系

专知会员服务

86+阅读 · 2022年10月3日

图嵌入模型综述

专知会员服务

93+阅读 · 2022年1月17日

「大规模图神经网络系统」最新2022综述：从算法到系统

专知会员服务

115+阅读 · 2022年1月14日

基于深度学习的图异常检测技术综述

专知会员服务

86+阅读 · 2021年7月28日