图神经网络(GNNs)最近在人工智能领域变得越来越受欢迎,这是因为它们具有提取相对非结构化数据类型作为输入数据的独特能力。尽管GNN体系结构的一些元素在操作上与传统神经网络(以及神经网络变体)的概念相似,但其他元素则不同于传统的深度学习技术。本教程通过整理和呈现最常见类型的GNNs的动机、概念、数学和应用的详细信息,向一般深度学习爱好者展示了GNNs的强大功能和新颖之处。重要的是,我们以介绍性的速度简要地介绍了本教程,并提供了理解和使用GNNs的实用和可访问的指南。
摘要:
当代人工智能(AI),或者更具体地说,深度学习(DL)近年来被称为神经网络(NN)的学习架构所主导。NN变体被设计用于提高某些问题领域的性能;卷积神经网络(CNN)在基于图像的任务环境中表现突出,而递归神经网络(RNN)在自然语言处理和时间序列分析空间中表现突出。神经网络也被用作复合DL框架的组件——它们在生成对抗网络(GANs)中被用作可训练的生成器和判别器,在transformers [46]中被用作编码器和解码器。虽然在计算机视觉中作为输入的图像和在自然语言处理中作为输入的句子看起来是不相关的,但是它们都可以用一个单一的、通用的数据结构来表示:图(见图1)。
形式上,图是一组不同的顶点(表示项目或实体),这些顶点通过边(表示关系)选择性地连接在一起。被设计来处理这些图的学习架构是有名称的图神经网络(GNN)。输入图之间的顶点和边的数量可以改变。通过这种方式,GNNs可以处理非结构化的、非欧几里得数据[4],这一特性使得它们在图形数据丰富的特定问题域中具有价值。相反,基于NN的算法通常需要对具有严格定义维数的结构化输入进行操作。例如,构建一个用于在MNIST数据集上进行分类的CNN,其输入层必须为28×28个神经元,后续输入给它的所有图像大小必须为28×28像素,才能符合这个严格的维数要求[27]。
图作为数据编码方法的表达性,以及GNNs相对于非结构化输入的灵活性,推动了它们的研究和开发。它们代表了一种探索相对通用的深度学习方法的新方法,并且它们促进了深度学习方法对数据集的应用,直到最近,这些数据集还不能使用传统的神经网络或其他此类算法。
本篇内容结构:
https://deepai.org/publication/a-practical-guide-to-graph-neural-networks