近年来,时空图神经网络(GNNs)因其能够捕捉变量之间以及时间点之间的依赖关系,而在时间序列分析领域引起了广泛关注。因此,本系统文献综述的目的是提供 GNNs 在时间序列分类和预测中的各种建模方法和应用领域的全面概览。我们进行了数据库检索,筛选出 150 多篇期刊论文,以详细审查该领域当前的最先进成果。本综述旨在向读者提供一个全面的模型集合,包含相关源代码链接、可用数据集、基准模型和拟合结果。希望这些信息能够为未来的研究提供帮助。据我们所知,这是首个系统文献综述,详细比较了当前时空 GNN 模型在不同领域的研究结果。此外,本综述的最后部分讨论了时空 GNN 应用中的当前局限性和挑战,例如可比性、可复现性、可解释性、信息容量不足和可扩展性。
近年来,图神经网络(GNNs)作为处理图结构数据的强大人工神经网络模型类别,受到了广泛关注。GNNs 尤其适用于数据自然表示为图结构的广泛实践和工程应用,如交通网络、图像分析和自然语言处理等应用。这一方法背后的直观概念是,图中的节点可以对应于对象或概念,而边则表示它们之间的相互关系。GNN 模型能够一次性处理这些量的数据。GNNs 可用于三类问题:图级问题、边级问题和节点级问题。在图级问题中,目标是基于图的整体结构预测其属性,而不是单独的节点或边。例如,一个样本中的分子可以表示为一个图,其整体结构可以提供关于该分子的全球属性信息。在边级问题中,目标是预测节点对之间边的存在或缺失。例如,该任务可用于推荐系统,根据过去的交互预测用户和项目之间的潜在连接。在节点级问题中,目标是预测图中每个节点的身份或角色,以解决分类或回归任务。值得注意的是,回归任务可以是“自回归”,即它们可以包含时间。 本综述进一步考察了 GNN 在时间序列相关任务中的具体应用,特别关注时间序列分类和预测。使用 GNNs 进行时间序列问题的核心思想是,GNNs 能够同时捕捉复杂的关系,包括变量间关系(多变量序列内不同变量之间的连接)和时间间关系(不同时间点之间的依赖性)。这构成了一个时空 GNN 方法,其中空间维度与多变量框架相关,时间维度与数据的时间特性相关。即,时空 GNNs 是一种旨在同时处理空间和时间维度数据的 GNN 模型。在这种情况下,时空图中的每个节点或边的数据可以随时间演变,挑战在于建模这些随时间动态变化的相互作用。 尽管这一领域潜力巨大,但据我们所知,尚缺乏关于时间序列应用的时空 GNN 模型的系统文献综述(SLR)。现有的综述大多不是系统文献综述,要么不够新,要么只关注有限的应用领域。个别近期综述集中在算法特征 [9], [132], [200], [18]、GNN 特性 [199]、特定领域 [80] 和分布式训练 [125], [162]。唯一一篇关于时空 GNNs 的 SLR 是 Zeghina 等人 [223] 最近发布的,但由于搜索查询限制,它仅涵盖了 52 篇文献。 本 SLR 的意图是提供关于时空 GNN 在不同领域的时间序列分类和预测应用的广泛而全面的概览。本 SLR 还旨在评估时空 GNN 模型当前流行的原因是否确实源于其有效性,并评估其在不同领域中的效率和准确性。此外,它收集了结果和基准,以便通过综合 GNN 应用的现有文献帮助研究人员。据我们所知,这是首个提供全面表格并汇总各种模型和基准在高度分散文献中结果的综述。希望这些整理和提炼的知识能够成为研究人员的宝贵资源和参考。 在本综述中,我们将提出两组问题。第一组问题旨在提供该领域出版物的总体概览,而第二组问题则关注提出的 GNN 模型的具体方面。 总体概览问题(GQs)如下:
具体问题(SQs)如下:
对总体问题和具体问题的回答将在随后的讨论中整合,以提供时空 GNN 模型当前状态的全面概述。通过突出不同领域方法的相似性和差异,将汇总 GNN 模型的一般概况。然而,若读者需要更详细地分析某一特定学科或 GNN 模型的其他方面,可参考前述的专门综述文献([9], [132], [200], [18], [199], [80], [125], [162])。 本文的结构如下:在引言之后,第 2 节阐述了文献收集的方法。第 3 节提供了所选论文的总体概览。第 4 节介绍了时空 GNN 模型的基本定义和概念,并讨论其分类和图结构的确定。第 5 节是本综述的核心,探讨了在所选文献中提出的时空 GNN 模型的不同应用领域。第 6 节提供了对研究问题的讨论及回答。最后,第 7 节讨论了限制、挑战和未来研究方向。第 8 节是综述的结论。附录 A 列出了本 SLR 所涵盖的所有期刊论文,包括发表年份、所属研究小组、案例研究和任务性质(如分类或预测)。