图是连接数据网络结构的一种常用表示形式。图数据可以在广泛的应用领域中找到,如社会系统、生态系统、生物网络、知识图谱和信息系统。随着人工智能技术的不断渗透发展,图学习(即对图进行机器学习)越来越受到研究者和实践者的关注。图学习对许多任务都非常有效,如分类,链接预测和匹配。图学习方法通常是利用机器学习算法提取图的相关特征。在这个综述中,我们提出了一个关于图学习最全面的概述。特别关注四类现有的图学习方法,包括图信号处理、矩阵分解、随机游走和深度学习。分别回顾了这些类别下的主要模型和算法。我们研究了诸如文本、图像、科学、知识图谱和组合优化等领域的图学习应用。此外,我们还讨论了该领域几个有前景的研究方向。

真实的智能系统通常依赖于机器学习算法处理各种类型的数据。尽管图数据无处不在,但由于其固有的复杂性,给机器学习带来了前所未有的挑战。与文本、音频和图像不同,图数据嵌入在一个不规则的领域,使得现有机器学习算法的一些基本操作不适用。许多图学习模型和算法已经被开发出来解决这些挑战。本文系统地综述了目前最先进的图学习方法及其潜在的应用。这篇论文有多种用途。首先,它作为不同领域(如社会计算、信息检索、计算机视觉、生物信息学、经济学和电子商务)的研究人员和从业者提供图学习的快速参考。其次,它提供了对该领域的开放研究领域的见解。第三,它的目的是激发新的研究思路和更多的兴趣在图学习。

图,又称网络,可以从现实世界中丰富的实体之间的各种关系中提取。一些常见的图表已经被广泛用于表达不同的关系,如社会网络、生物网络、专利网络、交通网络、引文网络和通信网络[1]-[3]。图通常由两个集合定义,即顶点集和边集。顶点表示图形中的实体,而边表示这些实体之间的关系。由于图学习在数据挖掘、知识发现等领域的广泛应用,引起了人们的广泛关注。由于图利用了顶点[4],[5]之间的本质和相关关系,在捕获复杂关系方面,图学习方法变得越来越流行。例如,在微博网络中,通过检测信息级联,可以跟踪谣言的传播轨迹。在生物网络中,通过推测蛋白质的相互作用可以发现治疗疑难疾病的新方法。在交通网络中,通过分析不同时间戳[6]的共现现象,可以预测人类的移动模式。对这些网络的有效分析很大程度上取决于网络的表示方式。

一般来说,图学习是指对图进行机器学习。图学习方法将图的特征映射到嵌入空间中具有相同维数的特征向量。图学习模型或算法直接将图数据转换为图学习体系结构的输出,而不将图投影到低维空间。由于深度学习技术可以将图数据编码并表示为向量,所以大多数图学习方法都是基于或从深度学习技术推广而来的。图学习的输出向量在连续空间中。图学习的目标是提取图的期望特征。因此,图的表示可以很容易地用于下游任务,如节点分类和链接预测,而无需显式的嵌入过程。因此,图学习是一种更强大、更有意义的图分析技术。

在这篇综述论文中,我们试图以全面的方式检验图机器学习方法。如图1所示,我们关注现有以下四类方法:基于图信号处理(GSP)的方法、基于矩阵分解的方法、基于随机游走的方法和基于深度学习的方法。大致来说,GSP处理图的采样和恢复,并从数据中学习拓扑结构。矩阵分解可分为图拉普拉斯矩阵分解和顶点接近矩阵分解。基于随机游动的方法包括基于结构的随机游动、基于结构和节点信息的随机游动、异构网络中的随机游动和时变网络中的随机游动。基于深度学习的方法包括图卷积网络、图注意力网络、图自编码器、图生成网络和图时空网络。基本上,这些方法/技术的模型架构是不同的。本文对目前最先进的图学习技术进行了广泛的回顾。

传统上,研究人员采用邻接矩阵来表示一个图,它只能捕捉相邻两个顶点之间的关系。然而,许多复杂和不规则的结构不能被这种简单的表示捕获。当我们分析大规模网络时,传统的方法在计算上是昂贵的,并且很难在现实应用中实现。因此,有效地表示这些网络是解决[4]的首要问题。近年来提出的网络表示学习(NRL)可以学习低维表示[7]-[9]的网络顶点潜在特征。当新的表示被学习后,可以使用以前的机器学习方法来分析图数据,并发现数据中隐藏的关系。

当复杂网络被嵌入到一个潜在的、低维的空间中时,结构信息和顶点属性可以被保留[4]。因此,网络的顶点可以用低维向量表示。在以往的机器学习方法中,这些向量可以看作是输入的特征。图学习方法为新的表示空间中的图分析铺平了道路,许多图分析任务,如链接预测、推荐和分类,都可以有效地解决[10],[11]。网络的图形化表现方式揭示了社会生活的各个方面,如交流模式、社区结构和信息扩散[12],[13]。根据顶点、边和子图的属性,可以将图学习任务分为基于顶点、基于边和基于子图三类。图中顶点之间的关系可以用于分类、风险识别、聚类和社区检测[14]。通过判断图中两个顶点之间的边的存在,我们可以进行推荐和知识推理。基于子图[15]的分类,该图可用于聚合物分类、三维可视化分类等。对于GSP,设计合适的图形采样方法以保持原始图形的特征,从而有效地恢复原始图形[16]具有重要意义。在存在不完整数据[17]的情况下,可以使用图恢复方法构造原始图。然后利用图学习从图数据中学习拓扑结构。综上所述,利用图学习可以解决传统的图分析方法[18]难以解决的以下挑战。

成为VIP会员查看完整内容
123

相关内容

图机器学习(Machine Learning on Graphs)是一项重要且普遍存在的任务,其应用范围从药物设计到社交网络中的友情推荐。这个领域的主要挑战是找到一种表示或编码图结构的方法,以便机器学习模型能够轻松地利用它。

知识荟萃

精品入门和进阶教程、论文和代码整理等

更多

查看相关VIP内容、论文、资讯等
麦克瑞大学最新「深度学习社区检测」综述论文,28页pdf
最新「图机器学习药物发现」综述论文,22页pdf245篇文献
最新《知识图谱:构建到应用》2020大综述论文,261页pdf
专知会员服务
216+阅读 · 2020年10月6日
最新【图神经网络计算】2020综述论文,23页PDF
专知会员服务
174+阅读 · 2020年10月3日
最新《深度持续学习》综述论文,32页pdf
专知会员服务
144+阅读 · 2020年9月7日
专知会员服务
86+阅读 · 2020年7月20日
最新《动态网络嵌入》综述论文,25页pdf
专知会员服务
123+阅读 · 2020年6月17日
最新《深度多模态数据分析》综述论文,26页pdf
专知会员服务
235+阅读 · 2020年6月16日
最新《图嵌入组合优化》综述论文,40页pdf
最新《动态网络嵌入》综述论文,25页pdf
专知
25+阅读 · 2020年6月17日
图表示学习Graph Embedding综述
图与推荐
7+阅读 · 2020年3月23日
图神经网络(Graph Neural Networks,GNN)综述
极市平台
85+阅读 · 2019年11月27日
图数据表示学习综述论文
专知
36+阅读 · 2019年6月10日
图嵌入(Graph embedding)综述
人工智能前沿讲习班
437+阅读 · 2019年4月30日
Arxiv
42+阅读 · 2021年5月3日
Arxiv
84+阅读 · 2020年2月28日
Signed Graph Attention Networks
Arxiv
7+阅读 · 2019年9月5日
Arxiv
16+阅读 · 2019年3月28日
Arxiv
8+阅读 · 2019年2月19日
A Comprehensive Survey on Graph Neural Networks
Arxiv
18+阅读 · 2019年1月3日
Arxiv
4+阅读 · 2017年4月12日
VIP会员
相关VIP内容
麦克瑞大学最新「深度学习社区检测」综述论文,28页pdf
最新「图机器学习药物发现」综述论文,22页pdf245篇文献
最新《知识图谱:构建到应用》2020大综述论文,261页pdf
专知会员服务
216+阅读 · 2020年10月6日
最新【图神经网络计算】2020综述论文,23页PDF
专知会员服务
174+阅读 · 2020年10月3日
最新《深度持续学习》综述论文,32页pdf
专知会员服务
144+阅读 · 2020年9月7日
专知会员服务
86+阅读 · 2020年7月20日
最新《动态网络嵌入》综述论文,25页pdf
专知会员服务
123+阅读 · 2020年6月17日
最新《深度多模态数据分析》综述论文,26页pdf
专知会员服务
235+阅读 · 2020年6月16日
相关资讯
最新《图嵌入组合优化》综述论文,40页pdf
最新《动态网络嵌入》综述论文,25页pdf
专知
25+阅读 · 2020年6月17日
图表示学习Graph Embedding综述
图与推荐
7+阅读 · 2020年3月23日
图神经网络(Graph Neural Networks,GNN)综述
极市平台
85+阅读 · 2019年11月27日
图数据表示学习综述论文
专知
36+阅读 · 2019年6月10日
图嵌入(Graph embedding)综述
人工智能前沿讲习班
437+阅读 · 2019年4月30日
相关论文
Arxiv
42+阅读 · 2021年5月3日
Arxiv
84+阅读 · 2020年2月28日
Signed Graph Attention Networks
Arxiv
7+阅读 · 2019年9月5日
Arxiv
16+阅读 · 2019年3月28日
Arxiv
8+阅读 · 2019年2月19日
A Comprehensive Survey on Graph Neural Networks
Arxiv
18+阅读 · 2019年1月3日
Arxiv
4+阅读 · 2017年4月12日
微信扫码咨询专知VIP会员