图神经网络为根据特定任务将真实世界的图嵌入低维空间提供了一个强大的工具包。到目前为止,已经有一些关于这个主题的综述。然而,它们往往侧重于不同的角度,使读者看不到图神经网络的全貌。本论文旨在克服这一局限性,并对图神经网络进行了全面的综述。首先,我们提出了一种新的图神经网络分类方法,然后参考了近400篇相关文献,全面展示了图神经网络的全貌。它们都被分类到相应的类别中。为了推动图神经网络进入一个新的阶段,我们总结了未来的四个研究方向,以克服所面临的挑战。希望有越来越多的学者能够理解和开发图神经网络,并将其应用到自己的研究领域。
导论
图作为一种复杂的数据结构,由节点(或顶点)和边(或链接)组成。它可以用于建模现实世界中的许多复杂系统,如社会网络、蛋白质相互作用网络、大脑网络、道路网络、物理相互作用网络和知识图等。因此,分析复杂网络成为一个有趣的研究前沿。随着深度学习技术的快速发展,许多学者采用深度学习体系结构来处理图形。图神经网络(GNN)就是在这种情况下出现的。到目前为止,GNN已经发展成为一种流行和强大的计算框架,用于处理不规则数据,如图形和流形。
GNN可以通过层次迭代算子学习任务特定的节点/边/图表示,从而利用传统的机器学习方法执行与图相关的学习任务,如节点分类、图分类、链路预测和聚类等。尽管GNNs在图形相关学习任务上取得了很大的成功,但他们仍然面临着巨大的挑战。首先,图数据结构的复杂性给大型图数据带来了昂贵的计算代价。其次,扰动图结构和/或初始特征会导致性能急剧下降。第三,wesfeiller - leman (WL)图同构检验阻碍了GNNs的性能提升。最后,GNN的黑盒工作机制阻碍了将其安全部署到实际应用中。
本文将传统的深度体系结构推广到非欧氏域,总结了图神经网络的体系结构、扩展和应用、基准和评估缺陷以及未来的研究方向。到目前为止,已经对GNN进行了几次调查。然而,他们通常从不同的角度、不同的侧重点来讨论GNN模型。据我们所知,关于GNN的第一次调查是由Michael M. Bronstein等人进行的。Peng Cui等[2]从三个方面综述了应用于图形的各种深度学习模型: 包括图卷积神经网络在内的半监督学习方法,包括图自动编码器在内的非监督学习方法,以及包括图循环神经网络和图强化学习在内的最新进展。本研究侧重于半监督学习模型,即空间图和光谱图卷积神经网络,而对其他两个方面的研究相对较少。由于篇幅有限,本调查只列出了GNNs的几个关键应用,但忽略了应用的多样性。孙茂松等人[3]从图类型、传播步骤和训练方法三个方面详细回顾了光谱和空间图卷积神经网络,并将其应用分为结构场景、非结构场景和其他场景三种场景。然而,这篇文章没有涉及其他GNN架构,如图形自动编码器,图形循环神经网络和图形生成网络。Philip S. Yu等人[4]对图神经网络进行了全面的调查,并调查了可用的数据集、开源实现和实际应用。然而,对于每个研究主题,他们只列出了少量的核心文献。Davide Bacciu等人[367]温和地介绍了图形数据的深度学习领域。本文的目的是介绍为图数据构造神经网络的主要概念和构建模块,因此它没有对最近的图神经网络工作进行阐述。
值得注意的是,上述所有调研都不涉及GNN的能力和可解释性、概率推理和GNN的组合以及对图的对抗攻击。本文从架构、扩展和应用、基准测试和评估缺陷、未来研究方向四个方面为读者提供了GNN的全景图,如图1所示。对于GNNs的结构,我们研究了图卷积神经网络(GCNNs)、图池算子、图注意机制和图循环神经网络(GRNNs)等方面的研究。通过对上述体系结构的集成,实现了GNNs的扩展和应用,展示了一些值得关注的研究课题。具体来说,这一视角包括深度图表示学习、深度图生成模型、概率推理(PI)和gnn的组合、GNN的对抗攻击、图神经结构搜索和图强化学习和应用。综上所述,本文对GNNs进行了完整的分类,并对GNNs的研究现状和发展趋势进行了全面的综述。这些是我们与上述调查的主要不同之处。
我们的主要贡献可以归结为以下三个方面。
我们提出了一种新的GNN分类方法,它有三个层次。第一个包括架构、基准测试和评估缺陷以及应用程序。体系结构分为9类,基准测试和评估缺陷分为2类,应用程序分为10类。此外,图卷积神经网络作为一种经典的GNN体系结构,又被分为6类。
我们提供了GNN的全面回顾。所有的文献都属于相应的类别。希望读者通过阅读本概览,不仅了解GNNs的全貌,而且了解GNNs的基本原理和各种计算模块。
3.根据目前GNNs所面临的挑战,我们总结了未来四个研究方向,其中大部分在其他研究中没有提及。希望通过克服这些挑战,使GNNs的研究进入一个新的阶段
未来研究方向:
尽管GNNs在许多领域取得了巨大的成功,但仍存在一些有待解决的问题。本节总结了GNNs未来的研究方向。
高度可伸缩的GNN。现实世界的图通常包含数亿个节点和边,并具有动态演化的特征。事实证明,现有的GNN架构很难扩展到巨大的真实世界图。这促使我们设计高度可伸缩的GNN架构,能够高效和有效地学习节点/边/图表示为巨大的动态演化图。
健壮的GNN。现有的GNN架构容易受到对抗性攻击。也就是说,一旦输入图的结构和/或初始特征受到攻击,GNN模型的性能就会急剧下降。因此,我们应该将攻击防御机制整合到GNN体系结构中,即构建健壮的GNN体系结构,以增强其对抗攻击的能力。
GNNs超过WL测试。空间广义网格网络的性能受单WL的限制,而高阶WL检验的计算代价昂贵。因此,在适当的条件下,两个非同构图将产生相同的节点/边/图表示。这促使我们开发一个超越WL测试的新的GNN框架,或者设计一个优雅的高阶GNN架构来对应高阶WL测试。
可解释的GNN。现有的GNN在一个黑盒中工作。我们不明白为什么它们在节点分类任务、图分类任务和图嵌入任务等方面都能达到如此先进的性能。可解释性已经成为将GNNs应用于现实问题的一个主要障碍。虽然已有一些研究对某些特定的GNN模型进行了解释,但它们不能解释一般的GNN模型。这促使我们为gnn构建一个统一的可解释框架。