消息传递图神经网络(MPNNs)已成为图机器学习的主要方法,近年来吸引了广泛关注。尽管大量研究探索了MPNNs的表达能力,即其区分图和近似函数的能力,但相对较少的研究关注其泛化能力,即在训练数据之外做出有意义预测的能力。本文系统性地回顾了关于MPNNs泛化能力的现有文献。我们分析了这些领域中各种研究的优势和局限性,提供了对其方法和发现的深入见解。此外,我们指出了未来研究的潜在方向,旨在深化对MPNNs泛化能力的理解。

1. 引言

图模型在生命科学、自然科学和形式科学中用于描述实体之间的交互关系,例如原子系统 [Duval et al., 2023, Zhang et al., 2023] 或社交网络 [Easley and Kleinberg, 2010, Lovász, 2012],这凸显了机器学习方法处理图结构数据的必要性。因此,专为图结构数据设计的神经网络,主要是消息传递图神经网络(MPNNs)[Merkwirth and Lengauer, 2005, Gori et al., 2005, Hamilton et al., 2017, Kipf and Welling, 2017, Gilmer et al., 2017, Scarselli et al., 2009],在机器学习社区中获得了广泛关注,并在多个领域展示了显著成果 [Corso et al., 2024],涵盖药物设计 [Wong et al., 2023]、全球中程天气预报 [Lam et al., 2023] 和组合优化 [Cappart et al., 2021, Gasse et al., 2019, Qian et al., 2023]。 尽管MPNNs在实践中取得了成功并产生了实际影响,但其理论性质的研究相对较少 [Morris et al., 2024]。目前,MPNNs的表达能力已得到一定程度的理解。MPNNs的表达能力主要通过两种数学方法建模:与一维Weisfeiler-Leman算法(1-WL)的算法对齐和通用逼近定理 [Azizian and Lelarge, 2021, Böker et al., 2023, Chen et al., 2019, Geerts and Reutter, 2022, Maehara and NT, 2019, Rauchwerger et al., 2024]。其中,1-WL [Weisfeiler and Leman, 1968, Weisfeiler, 1976, Morris et al., 2021] 是图同构问题中一种被广泛研究的启发式算法。具体而言,Morris et al. [2019a] 和 Xu et al. [2019a] 表明,1-WL限制了任何可能的MPNN架构在区分非同构图方面的表达能力。 相比之下,关于MPNNs在训练数据之外做出有意义预测的能力,研究较少。更准确地说,MPNNs的泛化能力评估了架构在适应来自训练集相同分布的新图数据时的有效性。此外,外推或分布外泛化涉及从与训练集(略微)不同的分布中抽取的未见图数据。目前,已有多种理论框架用于分析MPNNs的泛化能力,例如Vapnik-Chervonenkis维度(VC维度)[Morris et al., 2023, Scarselli et al., 2018]、Rademacher平均值 [Garg et al., 2020] 及相关形式化方法。然而,由于不同的假设、MPNN架构和参数,这些结果往往难以直接比较。

1.1 贡献

本文综述了关于MPNNs泛化能力的理论结果,旨在使不同结果之间的比较更加容易,并帮助读者快速进入该领域。我们基于VC维度、Rademacher复杂度、覆盖数界限、基于稳定性的泛化界限和PAC-Bayesian分析,综述了泛化结果。此外,我们还探讨了使用图论理论的泛化分析以及节点级预测任务和分布外泛化的泛化理论。我们的讨论涵盖了用于建立这些界限的数学工具及其依赖的理论基础。本综述的主要目标是为读者提供关于MPNNs泛化能力的全面概述,并为扩展当前理论以填补文献空白提供见解。此外,我们提出了该领域的开放问题和未来挑战,以促进未来的研究工作。

成为VIP会员查看完整内容
20

相关内容

图神经网络 (GNN) 是一种连接模型,它通过图的节点之间的消息传递来捕捉图的依赖关系。与标准神经网络不同的是,图神经网络保留了一种状态,可以表示来自其邻域的具有任意深度的信息。近年来,图神经网络(GNN)在社交网络、知识图、推荐系统、问答系统甚至生命科学等各个领域得到了越来越广泛的应用。

知识荟萃

精品入门和进阶教程、论文和代码整理等

更多

查看相关VIP内容、论文、资讯等
几何图神经网络综述:数据结构、模型与应用
专知会员服务
52+阅读 · 2024年3月4日
图时卷积神经网络:架构与理论分析
专知会员服务
25+阅读 · 2022年7月3日
AAAI 2022 | ProtGNN:自解释图神经网络
专知会员服务
40+阅读 · 2022年2月28日
专知会员服务
33+阅读 · 2021年10月8日
专知会员服务
42+阅读 · 2021年6月2日
专知会员服务
140+阅读 · 2021年3月30日
专知会员服务
24+阅读 · 2020年9月15日
图神经网络表达能力的研究综述,41页pdf
专知会员服务
172+阅读 · 2020年3月10日
AAAI 2022 | ProtGNN:自解释图神经网络
专知
10+阅读 · 2022年2月28日
多模态视觉语言表征学习研究综述
专知
27+阅读 · 2020年12月3日
【KDD2020】图神经网络:基础与应用,322页ppt
实体关系抽取方法研究综述
专知
11+阅读 · 2020年7月19日
【ICML2020】图神经网络谱聚类
专知
10+阅读 · 2020年7月7日
【KDD2020】图神经网络生成式预训练
专知
22+阅读 · 2020年7月3日
图神经网络综述:模型与应用
PaperWeekly
198+阅读 · 2018年12月26日
国家自然科学基金
2+阅读 · 2016年12月31日
国家自然科学基金
2+阅读 · 2015年12月31日
国家自然科学基金
0+阅读 · 2015年12月31日
国家自然科学基金
8+阅读 · 2015年12月31日
国家自然科学基金
3+阅读 · 2015年12月31日
国家自然科学基金
5+阅读 · 2015年12月31日
国家自然科学基金
4+阅读 · 2014年12月31日
国家自然科学基金
1+阅读 · 2014年12月31日
国家自然科学基金
0+阅读 · 2014年12月31日
A Survey of Large Language Models
Arxiv
459+阅读 · 2023年3月31日
Arxiv
10+阅读 · 2020年11月26日
VIP会员
相关VIP内容
几何图神经网络综述:数据结构、模型与应用
专知会员服务
52+阅读 · 2024年3月4日
图时卷积神经网络:架构与理论分析
专知会员服务
25+阅读 · 2022年7月3日
AAAI 2022 | ProtGNN:自解释图神经网络
专知会员服务
40+阅读 · 2022年2月28日
专知会员服务
33+阅读 · 2021年10月8日
专知会员服务
42+阅读 · 2021年6月2日
专知会员服务
140+阅读 · 2021年3月30日
专知会员服务
24+阅读 · 2020年9月15日
图神经网络表达能力的研究综述,41页pdf
专知会员服务
172+阅读 · 2020年3月10日
相关资讯
AAAI 2022 | ProtGNN:自解释图神经网络
专知
10+阅读 · 2022年2月28日
多模态视觉语言表征学习研究综述
专知
27+阅读 · 2020年12月3日
【KDD2020】图神经网络:基础与应用,322页ppt
实体关系抽取方法研究综述
专知
11+阅读 · 2020年7月19日
【ICML2020】图神经网络谱聚类
专知
10+阅读 · 2020年7月7日
【KDD2020】图神经网络生成式预训练
专知
22+阅读 · 2020年7月3日
图神经网络综述:模型与应用
PaperWeekly
198+阅读 · 2018年12月26日
相关基金
国家自然科学基金
2+阅读 · 2016年12月31日
国家自然科学基金
2+阅读 · 2015年12月31日
国家自然科学基金
0+阅读 · 2015年12月31日
国家自然科学基金
8+阅读 · 2015年12月31日
国家自然科学基金
3+阅读 · 2015年12月31日
国家自然科学基金
5+阅读 · 2015年12月31日
国家自然科学基金
4+阅读 · 2014年12月31日
国家自然科学基金
1+阅读 · 2014年12月31日
国家自然科学基金
0+阅读 · 2014年12月31日
微信扫码咨询专知VIP会员