图深度学习：成果、挑战和未来

编译：McGL
公众号：PyVision

图深度学习是近期的研究热点。Michael教授带你了解目前最新成果及未来挑战。

Deep learning on graphs: successes, challenges, and next steps by Michael Bronstein

https://towardsdatascience.com/deep-learning-on-graphs-successes-challenges-and-next-steps-7d9ec220ba8

这是系列文章的第一篇，我将讨论图深度学习（deep learning on graphs）领域的演变和未来趋势。

图深度学习，也称为几何深度学习(Geometric deep learning or GDL) ，图表示学习(Graph representation learning or GRL) ，或关系归纳偏差（relational inductive biases）[2] ，最近已经成为机器学习中最热门的话题之一。虽然图学习的早期工作至少可以追溯到十年前，但毫无疑问，正是过去几年的进步使得这些方法从一个小众领域成为机器学习社区乃至流行科学出版社的焦点(《量子杂志（Quanta Magazine）》发表了一系列关于几何深度学习的优秀文章，包含流形学（manifolds）、药物发现, 和蛋白质科学的研究)。

图是强大的数学抽象，可以描述从生物学和高能物理学到社会科学和经济学等领域的复杂关系和相互作用系统。由于如今在某些领域产生的图结构化数据数量巨大(最突出的例子是 Twitter 和 Facebook 等社交网络) ，尝试应用在其它数据丰富的环境中非常成功的深度学习技术是非常诱人的。

图学习问题有多种类型，这些问题很大程度上依赖于应用程序。有不同的两种（dichotomy）是逐节点（node-wise）或逐图（graph-wise），前者试图预测图中单个节点的性质(例如识别社交网络中的恶意用户) ，而后者试图预测整个图（例如预测分子的溶解度（solubility））。此外，像传统的机器学习问题一样，我们可以区分为有监督和无监督(或自监督)设置，以及直推（transductive）和归纳（inductive）问题。

与图像分析和计算机视觉中使用的卷积神经网络类似，高效图学习的关键是设计具有共享权重的局部操作，在每个节点和它的邻居之间进行消息传递[5]。与处理网格结构数据的经典深度神经网络的一个主要区别是，在图上这种操作是排列不变的（permutation-invariant），即与邻近节点的顺序无关，因为通常没有对它们进行排序的规范方法。

尽管它们的前景和一系列图表示学习的成功案例(其中我有私心的列出 Twitter 收购的基于图的假新闻检测创业公司 Fabula AI，这是我和我的学生一起创立的) ，我们至今还没有见证过任何类似于计算机视觉领域卷积网络的成功案例。下面，我将尝试概述我对可能的原因和未来几年该领域如何发展的看法。

像 ImageNet 这样的标准化benchmarks无疑是深度学习在计算机视觉领域取得成功的关键因素之一，有些人甚至认为，在深度学习革命中，数据比算法更重要。在图学习社区中，我们在规模和复杂性方面还没有类似于 ImageNet 的东西。 2019年推出的Open Graph Benchmark可能是首次尝试在有趣的真实世界图结构数据集上引入具有挑战性的图学习任务。其中一个障碍是，那些根据用户活动制作各种丰富图的科技公司，由于担心诸如 GDPR 之类的隐私法，不愿意分享这些数据。一个值得注意的例外是 Twitter，作为RecSys Challenge的一部分，它在一定的隐私保护限制下，向研究社区提供了1.6亿条推文的数据集，其中包括相应的用户参与图。我希望将来很多公司也会这样做。

在公开领域可用的软件库在“民主化”深度学习和使其成为流行工具方面发挥了至关重要的作用。直到最近，图学习实现主要是一些编写糟糕和很少测试的代码的集合。现在有一些库，如 PyTorch Geometric 或 Deep Graph Library (DGL) ，在行业赞助的帮助下，由专业人员编写和维护。在一个新的图深度学习架构出现在 arxiv 上几周后出现它的实现并不罕见。

可扩展性（Scalability）是限制工业应用程序的关键因素之一，这些应用程序通常需要处理非常大的图(想想 Twitter 社交网络，它有数亿个节点和数十亿条边)和低延迟约束。学术界直到最近几乎忽视了这一方面，文献中描述的许多模型完全不适合大规模场景。此外，图硬件(GPU)与经典的深度学习架构的完美结合是驱动它们共同成功的主要力量之一，但它并不一定是图结构数据的最佳选择。长远来看，我们可能需要针对图的专门硬件[7]。

动态图是文献中很少涉及的另一个方面。虽然图是建立复杂系统模型的常用方法，但这样的抽象通常过于简单，因为现实世界的系统是动态的，并且随着时间不断演化。有时正是时间行为提供了关于系统的重要见解。尽管近年来取得了一些进展，但是设计能够有效地处理表示为节点或边事件流的连续时间图神经网络模型仍然是一个有待研究的问题。

高阶结构，如motifs、graphlets或单纯复合体在复杂网络中非常重要，例如描述蛋白质相互作用在生物学中的应用。然而，大多数图神经网络仅限于节点和边。将这些结构整合到消息传递机制中可以为基于图的模型带来更强的表达能力。

对图神经网络表达性的理论认识是相当有限的。在某些情况下，使用图神经网络能够显著提高性能，而在其它情况下几乎没有差别，这种情况很常见。目前还不完全清楚图神经网络何时以及为什么工作良好或失败。这个问题很困难，因为我们必须同时考虑底层图的结构和上面的数据。对于仅涉及图连通性的图分类问题，最近的工作表明，图神经网络等价于 Weisfeiler-Lehman 图同构测试（Weisfeiler-Lehman graph isomorphism test）[8](一种用于解决图论中一个经典问题的启发式方法，即确定两个图的排列是否完全相同)。这种形式阐明了为什么，例如，图神经网络在这个简单测试不能区分的非同构图实例上失败。超越Weisfeiler-Lehman测试的层次结构，同时保持低线性复杂度，使图神经网络变得极具吸引力，这是一个开放的研究问题。

图神经网络在存在噪声数据或遭受对抗性（adversarial）攻击时的鲁棒性和性能保证是另一个有趣且很大程度上还是一个全新的研究领域。

应用可能是这一领域最令人满意的部分。从事图学习工作多年以来，我与粒子物理学家[10]、临床医生[11]、生物学家和化学家[12]交了朋友。如果我们没有研究各自领域的应用，我不太可能遇到这些人。如果要我打赌哪一个领域，图深度学习可以在未来几年产生最大的影响，我会说是结构生物学和化学。在这些领域，基于图的模型既可以用作分子的低层模型[5] ，也可以用作它们之间相互作用的高层模型[13,11]。结合这些因素可能是达到对制药业有用的水平的关键——我们看到了这方面的初步迹象，今年早些时候，利用图神经网络发现了一类新的抗生素[14]，或者预测了蛋白质之间的相互作用[12]。如果图深度学习能够实现它的承诺，那么传统上非常漫长和昂贵的发现、开发和测试新药的过程可能会完全不一样了。

[1] M. M. Bronstein et al. Geometric deep learning: going beyond Euclidean data (2017), IEEE Signal Processing Magazine 34(4):18–42.

[2] P. Battaglia et al., Relational inductive biases, deep learning, and graph networks (2018), arXiv:1806.01261.

[3] F. Scarselli et al. The graph neural network model (2008), IEEE Transactions on Neural Networks 20(1):61–80.

[4] A. Küchler, C. Goller (1996). Inductive learning in symbolic domains using structure-driven recurrent neural networks (1996), Proc. Künstliche Intelligenz.

[5] J. Gilmer et al., Neural message passing for quantum chemistry (2017), ICML.

[6] A. Wissner-Gross, Datasets over algorithms (2016).

[7] C.-Y. Gui et al.. A survey on Graph Processing accelerators: Challenges and Opportunities (2019), arXiv:1902.10130.

[8] K. Xu et al. How powerful are graph neural networks? (2019), ICLR.

[9] D. Zügner et al., Adversarial attacks on neural networks for graph data (2018), Proc. KDD.

[10] N. Choma et al. Graph neural networks for IceCube signal classification (2018), Proc. ICMLA.

[11] K. Veselkov et al. HyperFoods: Machine intelligent mapping of cancer-beating molecules in foods (2019), Scientific Reports 9.

[12] P. Gainza et al. Deciphering interaction fingerprints from protein molecular surfaces using geometric deep learning (2020), Nature Methods 17:184–192.

[13] M. Zitnik et al. Modeling polypharmacy side effects with graph convolutional networks (2018), Bioinformatics 34(13):457–466.

[14] J. Stokes et al. A deep learning approach to antibiotic discovery (2020), Cell, 180(4).

编辑于 2020-06-25 10:00

深度学习（Deep Learning）

图神经网络（GNN）

图卷积神经网络 (GCN)