WWW 2020 开源论文 | 异构图Transformer

会员服务 ·

WWW 2020 开源论文 | 异构图Transformer

2020 年 4 月 3 日 PaperWeekly

论文标题：Heterogeneous Graph Transformer

论文来源：WWW 2020

论文链接：https://arxiv.org/pdf/2003.01332.pdf

代码链接：https://github.com/acbull/pyHGT

简介

近年来，图神经网络（GNNs）在图数据分析领域取得了巨大的成功。然而，大多数的 GNN 都是针对同构图设计的。在同构图中，所有的节点和边都属于同一种类型。

然而实际生活中，我们可能会处理更复杂的图数据，其节点与边会有不同的类别，学术界称这类图数据为异构图。

比如学术网络、知识图谱，乃至物联网等。例如，下图中的开放学术网络包含五种类型的节点:论文、作者、机构、会议和领域，以及它们之间不同类型的关系。

在这篇论文中，我们提出了一种处理异构图的 GNN 模型，Heterogeneous Graph Transformer (HGT)。该模型可以对亿数量级节点的异构动态图进行建模。

模型

为了处理图的异构性，我们将每条边的模型参数分解为三个矩阵相乘。其分解根据每条边的三元组 <初始节点类型，边类型，目标节点类型>来定义。具体来说，我们使用这些三元组来对权重矩阵参数化，以计算每条边上的注意力以及信息传递。

因此，HGT不需要手动设计元路径 (meta path) ，也可以自动、隐式地学习和提取对不同下游任务重要的元路径。在此分解基础上，整体的计算仿照Transformer，因此相较于传统图模型有更强的表征能力。

为了处理图数据的动态特性，我们引入了相对时间编码（Relative Temporal Encoding）。相较于传统做法，即根据不同的时间戳把初始图分割成若干个图，我们采用将发生在不同时间的边全部放在一个图里。

我们计算两两节点相互之间的时间差，并对每一个时间差以一个编码，加在初始节点表征上。这样，在学习过程中，HGT 可以学习出图中的时间依赖关系，同时发生在不同时间的节点间也可以进行信息传递。

为了处理网络规模的图形数据，我们设计了针对异构图的采样算法 HGSampling。它的主要思想是样本异构子图中不同类型的节点以相同的比例，并利用重要性采样降低采样中的信息损失。

通过 HGSampling，所有的 GNN 模型，包括我们提出的 HGT，都可以在任意大小的异构图上进行训练和推理。

实验

我们在开放学术图谱（OAG）上进行试验。该数据集包含 1.79 亿个节点和 20 亿个边组成，时间跨度从 1900 年到 2019 年。实验结果表明，与传统的 GNNs 和异构图模型相比，在下游任务中 HGT 可以显著提高 9-21%。

同时，利用我们提出的相对时间编码（RTE），我们可以动态地计算出任意一个年份的节点标准。例如，我们可以观测出每个会议在不同时间其相似会议的变化。如下图所示，WWW 在 2020 年与一些网络、数据库的会议更接近，而在 2020 年却与一些数据挖掘的会议更接近。

同时，我们还验证了 HGT 可以隐性地抽取出对下游任务重要的元路径，而不需要人为定义。例如下图中的 <paper, is_published_at, venue, is_published_at-1, paper> 路径就有着最高的重要性。

点击以下标题查看更多往期内容：

🔍

现在，在「知乎」也能找到我们了

进入知乎首页搜索「PaperWeekly」

点击「关注」订阅我们的专栏吧

关于PaperWeekly

PaperWeekly 是一个推荐、解读、讨论、报道人工智能前沿论文成果的学术平台。如果你研究或从事 AI 领域，欢迎在公众号后台点击「交流群」，小助手将把你带入 PaperWeekly 的交流群里。

登录查看更多

相关内容

异构图

关注 8

【WWW 2019】异质图注意力网络，Heterogeneous Graph Attention Network

专知会员服务

75+阅读 · 2020年6月14日

近期必读的5篇顶会WWW 2020【知识图谱+图神经网络（KG+GNN）】相关论文

专知会员服务

151+阅读 · 2020年4月21日

【CVPR2020】图神经网络中的几何原理连接

专知会员服务

57+阅读 · 2020年4月8日

【ICLR2020-哥伦比亚大学】多关系图神经网络CompGCN

专知会员服务

50+阅读 · 2020年4月2日

近期必读的5篇顶会WWW 2020【图神经网络（GNN）】相关论文-Part2

专知会员服务

72+阅读 · 2020年3月11日

【UCLA-微软-WWW2020】异构图Transformer，Heterogeneous Graph Transformer

专知会员服务

137+阅读 · 2020年3月8日

【ICLR2020-】基于记忆的图网络，MEMORY-BASED GRAPH NETWORKS

专知会员服务

110+阅读 · 2020年2月22日

【WWW2020-香港中文大学】MAGNN:异构图嵌入的集合图神经网络

专知会员服务

112+阅读 · 2020年2月13日

【WWW2020-MAGNN】异质图嵌入的集合图神经网络 MAGNN: Metapath Aggregated Graph Neural Network for Heterogeneous Graph Embedding

专知会员服务

116+阅读 · 2020年2月10日

【NeurIPS2019】图变换网络：Graph Transformer Network

专知会员服务

112+阅读 · 2019年11月25日

近期必读的5篇顶会WWW 2020【图神经网络（GNN）】相关论文-Part2

专知

58+阅读 · 2020年3月11日

【论文笔记】通过自注意力网络的动态图表示学习

专知

89+阅读 · 2019年12月2日

【NeurIPS2019】图变换网络：Graph Transformer Network

专知

245+阅读 · 2019年11月18日

【论文笔记】自注意力图池化

专知

82+阅读 · 2019年11月18日

ACL 2019开源论文 | 基于Attention的知识图谱关系预测

PaperWeekly

49+阅读 · 2019年11月14日

KDD 2019开源论文 | 基于异质图神经网络的用户意图推荐

PaperWeekly

31+阅读 · 2019年11月2日

EMNLP 2019开源论文：针对短文本分类的异质图注意力网络

PaperWeekly

31+阅读 · 2019年10月22日

论文浅尝 | 基于知识图谱中图卷积神经网络的推荐系统

开放知识图谱

67+阅读 · 2019年8月27日

送你200+篇论文，学习图或图神经网络必读！（附下载）

数据派THU

19+阅读 · 2019年7月23日

NLP领域近期有哪些值得读的开源论文？（附下载）

数据派THU

8+阅读 · 2019年7月20日

Heterogeneous Graph Transformer

Arxiv

27+阅读 · 2020年3月3日

Hyper-SAGNN: a self-attention based graph neural network for hypergraphs

Arxiv

17+阅读 · 2019年11月6日

Span-based Joint Entity and Relation Extraction with Transformer Pre-training

Arxiv

7+阅读 · 2019年9月17日

Self-Attention Graph Pooling

Arxiv

13+阅读 · 2019年6月13日

Text Generation from Knowledge Graphs with Graph Transformers

Arxiv

35+阅读 · 2019年4月4日

Universal Transformers

Arxiv

5+阅读 · 2019年3月5日

Star-Transformer

Arxiv

5+阅读 · 2019年2月28日

Music Transformer

Arxiv

5+阅读 · 2018年12月12日

Explainable Reasoning over Knowledge Graphs for Recommendation

Arxiv

11+阅读 · 2018年11月12日

Reversible Recurrent Neural Networks

Arxiv

3+阅读 · 2018年10月25日

VIP会员