【KDD2020-UCLA-微软】GPT-GNN：图神经网络的预训练 - 专知VIP

会员服务 ·

6

图神经网络 · 预训练模型 · 生成式学习 ·

2020 年 8 月 19 日

【KDD2020-UCLA-微软】GPT-GNN：图神经网络的预训练

专知会员服务

专知，提供专业可信的知识分发服务，让认知协作更快更好！

简介

本文研究如何利用图生成作为自监督任务来预训练GNN。我们将图的生成概率分解成两个模块：1）节点特征生成；2）图结构生成。通过对这两个模块建模，GPT-GNN可以捕捉图任务里特征与结构之间的关联，从而不需要很多的标注数据就可达到很高的泛化性能。

背景：预训练

机器学习的成功很大程度上取决于数据。但是，高质量的标记数据通常很昂贵且难以获得，尤其是对于希望训练参数较多的模型。而相对应的，我们却可以很容易地获取大量的无标记数据，其数量可以是标记数据的数千倍。例如，在社交网络上进行异常检测时，恶意帐户的标注需要依赖于专家知识，数量较小，而整个网络的规模却可以达到十亿规模。

为了解决标注数据较少，尽可能利用其无标注数据，一个常规的做法是自监督的预训练(self-supervisedpre-training)。其目标是设计合理的自监督任务，从而使模型能从无标注数据里学得数据的信息，作为初始化迁移到下游任务中。由于目标任务中很多的知识已经在预训练中学到，因此通过预训练，我们只需要非常少量的标注数据，就能得到较好的泛化性能。

在NLP领域，BERT及其变种的取得了巨大的成功，证明了语言模型作为一个自监督任务，可以帮助训练非常深的Transformer模型，以捕捉语言的底层知识，如语法、句法、词义等。同样，在CV领域，最近的工作如SimCLR也显示出通过对比学习(Contrastive Learning) 对ResNet进行预训练也可以显著提升泛化性能。这些成功表明，无标注数据本身包含丰富的语义知识，因此如果通过预训练可以使模型能捕捉无标注数据的分布，就能作为初始化帮助一系列下游任务。

受到这些工作的启发，我们思考能否将预训练的想法运用到图数据分析中。本工作就致力于预训练图神经网络，以期GNN能够学习到图数据的结构和特征信息，从而能帮助标注数据较少的下游任务。

GPT-GNN模型

要在图数据上做预训练，第一个问题是：如何设计合适的无监督学习任务？

本工作提出用生成模型来对图分布进行建模，即逐步预测出一个图中一个新节点会有哪些特征、会和图中哪些节点相连。

由于我们想同时捕获属性和结构信息，因此需要将每个节点的条件生成概率分解为两项，特征生成与图结构生成。对每一个节点，我们会先掩盖其特征及部分边，仅提供剩下的部分作为已经观测到的边。

在第一步中，我们将通过已经观测到的边，预测该节点的特征，

在第二步中，我们将通过已经观测到的边，以及预测出的特征，来预测剩下的边。

我们可以写出对应的分解表达式。从理论上，这个目标的期望等同于整个图的生成概率。

为了并行高效地计算每个节点的loss，避免信息泄露（如节点特征预测的时候如何避免看到该节点自己的输入特征），以及处理大图和增加负样本采样的准确性，我们做了很多的模型设计。详见文章。

实验

我们在两个大规模异构网络和一个同构网络上进行了实验。

第一个异构图是MicrosoftAcademic Graph（OAG），其中包含超过2亿个节点和23亿条边。另一个是AmazonRecommendation数据集。

总体而言，我们提出的GPT-GNN在不同的实验设定下显著提高下游任务的性能，平均能达到9.1％的性能提升。

我们还评估了在不同百分比的标记数据下，GPT-GNN是否依然能取得提升。我们可以看到，使用GPT预训练时，仅使用20％标签数据的模型性能就会比使用100％数据进行直接监督学习的模型性能更高。这显示了预训练的有效性，尤其是在标签稀缺时。

成为VIP会员查看完整内容

63

相关内容

图神经网络

图神经网络

图神经网络 (GNN) 是一种连接模型，它通过图的节点之间的消息传递来捕捉图的依赖关系。与标准神经网络不同的是，图神经网络保留了一种状态，可以表示来自其邻域的具有任意深度的信息。近年来，图神经网络(GNN)在社交网络、知识图、推荐系统、问答系统甚至生命科学等各个领域得到了越来越广泛的应用。

知识荟萃

精品入门和进阶教程、论文和代码整理等

更多

查看相关VIP内容、论文、资讯等

【EMNLP2020】低资源域适应的多阶段预训练

专知会员服务

19+阅读 · 2020年10月13日

微软东昱晓《图表示学习: 嵌入，GNNs与预训练》2020教程，100页ppt

微软东昱晓《图表示学习: 嵌入，GNNs与预训练》2020教程，100页ppt

专知会员服务

131+阅读 · 2020年9月29日

【KDD2020】深度图神经网络专题论文解读

专知会员服务

48+阅读 · 2020年9月20日

【ICML2020】统一预训练伪掩码语言模型

【ICML2020】统一预训练伪掩码语言模型

专知会员服务

27+阅读 · 2020年7月23日

注意力图神经网络的小样本学习

注意力图神经网络的小样本学习

专知会员服务

192+阅读 · 2020年7月16日

【KDD2020】图神经网络生成式预训练，GPT-GNN: Generative Pre-Training of Graph Neural Networks

【KDD2020】图神经网络生成式预训练，GPT-GNN: Generative Pre-Training of Graph Neural Networks

专知会员服务

99+阅读 · 2020年7月3日

【KDD2020-清华大学】图对比编码的图神经网络预训练

【KDD2020-清华大学】图对比编码的图神经网络预训练

专知会员服务

46+阅读 · 2020年6月18日

近期必读的五篇数据挖掘顶会KDD 2020【图神经网络 (GNN) 】相关论文

近期必读的五篇数据挖掘顶会KDD 2020【图神经网络 (GNN) 】相关论文

专知会员服务

93+阅读 · 2020年5月26日

【微软】大型神经语言模型的对抗性训练，Adversarial Training for Large Neural Language Models

【微软】大型神经语言模型的对抗性训练，Adversarial Training for Large Neural Language Models

专知会员服务

51+阅读 · 2020年5月3日

【斯坦福大学-ICLR2020】图神经网络预训练的策略，Strategies for Pre-training Graph Neural Networks

【斯坦福大学-ICLR2020】图神经网络预训练的策略，Strategies for Pre-training Graph Neural Networks

专知会员服务

78+阅读 · 2020年3月1日

【KDD2020】图神经网络生成式预训练

【KDD2020】图神经网络生成式预训练

专知

22+阅读 · 2020年7月3日

ICML2020 图神经网络的预训练

ICML2020 图神经网络的预训练

图与推荐

12+阅读 · 2020年4月4日

【微软ICLR2020提交论文】多模态预训练表示UNITER：通用图像-文本语言表示学习

【微软ICLR2020提交论文】多模态预训练表示UNITER：通用图像-文本语言表示学习

专知

50+阅读 · 2019年10月20日

微软亚研提出VL-BERT：通用的视觉-语言预训练模型

微软亚研提出VL-BERT：通用的视觉-语言预训练模型

机器之心

15+阅读 · 2019年9月3日

超越 BERT 和 GPT，微软亚洲研究院开源新模型 MASS！

超越 BERT 和 GPT，微软亚洲研究院开源新模型 MASS！

雷锋网

10+阅读 · 2019年6月27日

ICML 2019：序列到序列自然语言生成任务超越BERT、GPT！微软提出通用预训练模型MASS | 技术头条

ICML 2019：序列到序列自然语言生成任务超越BERT、GPT！微软提出通用预训练模型MASS | 技术头条

AI100

5+阅读 · 2019年5月10日

超越BERT、GPT，微软提出通用预训练模型MASS

超越BERT、GPT，微软提出通用预训练模型MASS

机器之心

4+阅读 · 2019年5月10日

【ICML 2019】微软最新通用预训练模型MASS，超越BERT、GPT！

【ICML 2019】微软最新通用预训练模型MASS，超越BERT、GPT！

新智元

6+阅读 · 2019年5月10日

ICML 2019 | 序列到序列自然语言生成任务超越BERT、GPT！微软提出通用预训练模型MASS

ICML 2019 | 序列到序列自然语言生成任务超越BERT、GPT！微软提出通用预训练模型MASS

微软研究院AI头条

5+阅读 · 2019年5月9日

NLP领域的ImageNet时代到来：词嵌入「已死」，语言模型当立

NLP领域的ImageNet时代到来：词嵌入「已死」，语言模型当立

云头条

8+阅读 · 2018年7月9日

Graph Neural Networks: Architectures, Stability and Transferability

Arxiv

13+阅读 · 2020年8月4日

Generating Rationales in Visual Question Answering

Generating Rationales in Visual Question Answering

Arxiv

5+阅读 · 2020年4月4日

Video2Commonsense: Generating Commonsense Descriptions to Enrich Video Captioning

Video2Commonsense: Generating Commonsense Descriptions to Enrich Video Captioning

Arxiv

3+阅读 · 2020年3月17日

Understanding Attention and Generalization in Graph Neural Networks

Arxiv

4+阅读 · 2019年10月28日

Improving Few-shot Text Classification via Pretrained Language Representations

Arxiv

3+阅读 · 2019年8月22日

DocBERT: BERT for Document Classification

Arxiv

6+阅读 · 2019年8月22日

Improving Question Answering by Commonsense-Based Pre-Training

Arxiv

4+阅读 · 2019年3月1日

Rethinking ImageNet Pre-training

Arxiv

8+阅读 · 2018年11月21日

Learning Conditioned Graph Structures for Interpretable Visual Question Answering

Learning Conditioned Graph Structures for Interpretable Visual Question Answering

Arxiv

5+阅读 · 2018年7月5日

Interpretable R-CNN

Arxiv

4+阅读 · 2017年11月14日

VIP会员

相关主题

图神经网络

预训练模型

生成式学习

相关VIP内容

【EMNLP2020】低资源域适应的多阶段预训练

专知会员服务

19+阅读 · 2020年10月13日

微软东昱晓《图表示学习: 嵌入，GNNs与预训练》2020教程，100页ppt

微软东昱晓《图表示学习: 嵌入，GNNs与预训练》2020教程，100页ppt

专知会员服务

131+阅读 · 2020年9月29日

【KDD2020】深度图神经网络专题论文解读

专知会员服务

48+阅读 · 2020年9月20日

【ICML2020】统一预训练伪掩码语言模型

【ICML2020】统一预训练伪掩码语言模型

专知会员服务

27+阅读 · 2020年7月23日

注意力图神经网络的小样本学习

注意力图神经网络的小样本学习

专知会员服务

192+阅读 · 2020年7月16日

【KDD2020】图神经网络生成式预训练，GPT-GNN: Generative Pre-Training of Graph Neural Networks

【KDD2020】图神经网络生成式预训练，GPT-GNN: Generative Pre-Training of Graph Neural Networks

专知会员服务

99+阅读 · 2020年7月3日

【KDD2020-清华大学】图对比编码的图神经网络预训练

【KDD2020-清华大学】图对比编码的图神经网络预训练

专知会员服务

46+阅读 · 2020年6月18日

近期必读的五篇数据挖掘顶会KDD 2020【图神经网络 (GNN) 】相关论文

近期必读的五篇数据挖掘顶会KDD 2020【图神经网络 (GNN) 】相关论文

专知会员服务

93+阅读 · 2020年5月26日

【微软】大型神经语言模型的对抗性训练，Adversarial Training for Large Neural Language Models

【微软】大型神经语言模型的对抗性训练，Adversarial Training for Large Neural Language Models

专知会员服务

51+阅读 · 2020年5月3日

【斯坦福大学-ICLR2020】图神经网络预训练的策略，Strategies for Pre-training Graph Neural Networks

【斯坦福大学-ICLR2020】图神经网络预训练的策略，Strategies for Pre-training Graph Neural Networks

专知会员服务

78+阅读 · 2020年3月1日

热门VIP内容

开通专知VIP会员享更多权益服务

《使用量化测量将传感器节点关联到融合中心的算法设计》171页

军事前沿模型

提升军事训练能力的最佳人工智能模拟工具

《社交媒体信息作战》最新48页技术报告

相关资讯

【KDD2020】图神经网络生成式预训练

【KDD2020】图神经网络生成式预训练

专知

22+阅读 · 2020年7月3日

ICML2020 图神经网络的预训练

ICML2020 图神经网络的预训练

图与推荐

12+阅读 · 2020年4月4日

【微软ICLR2020提交论文】多模态预训练表示UNITER：通用图像-文本语言表示学习

【微软ICLR2020提交论文】多模态预训练表示UNITER：通用图像-文本语言表示学习

专知

50+阅读 · 2019年10月20日

微软亚研提出VL-BERT：通用的视觉-语言预训练模型

微软亚研提出VL-BERT：通用的视觉-语言预训练模型

机器之心

15+阅读 · 2019年9月3日

超越 BERT 和 GPT，微软亚洲研究院开源新模型 MASS！

超越 BERT 和 GPT，微软亚洲研究院开源新模型 MASS！

雷锋网

10+阅读 · 2019年6月27日

ICML 2019：序列到序列自然语言生成任务超越BERT、GPT！微软提出通用预训练模型MASS | 技术头条

ICML 2019：序列到序列自然语言生成任务超越BERT、GPT！微软提出通用预训练模型MASS | 技术头条

AI100

5+阅读 · 2019年5月10日

超越BERT、GPT，微软提出通用预训练模型MASS

超越BERT、GPT，微软提出通用预训练模型MASS

机器之心

4+阅读 · 2019年5月10日

【ICML 2019】微软最新通用预训练模型MASS，超越BERT、GPT！

【ICML 2019】微软最新通用预训练模型MASS，超越BERT、GPT！

新智元

6+阅读 · 2019年5月10日

ICML 2019 | 序列到序列自然语言生成任务超越BERT、GPT！微软提出通用预训练模型MASS

ICML 2019 | 序列到序列自然语言生成任务超越BERT、GPT！微软提出通用预训练模型MASS

微软研究院AI头条

5+阅读 · 2019年5月9日

NLP领域的ImageNet时代到来：词嵌入「已死」，语言模型当立

NLP领域的ImageNet时代到来：词嵌入「已死」，语言模型当立

云头条

8+阅读 · 2018年7月9日

相关论文

Graph Neural Networks: Architectures, Stability and Transferability

Arxiv

13+阅读 · 2020年8月4日

Generating Rationales in Visual Question Answering

Generating Rationales in Visual Question Answering

Arxiv

5+阅读 · 2020年4月4日

Video2Commonsense: Generating Commonsense Descriptions to Enrich Video Captioning

Video2Commonsense: Generating Commonsense Descriptions to Enrich Video Captioning

Arxiv

3+阅读 · 2020年3月17日

Understanding Attention and Generalization in Graph Neural Networks

Arxiv

4+阅读 · 2019年10月28日

Improving Few-shot Text Classification via Pretrained Language Representations

Arxiv

3+阅读 · 2019年8月22日

DocBERT: BERT for Document Classification

Arxiv

6+阅读 · 2019年8月22日

Improving Question Answering by Commonsense-Based Pre-Training

Arxiv

4+阅读 · 2019年3月1日

Rethinking ImageNet Pre-training

Arxiv

8+阅读 · 2018年11月21日

Learning Conditioned Graph Structures for Interpretable Visual Question Answering

Learning Conditioned Graph Structures for Interpretable Visual Question Answering

Arxiv

5+阅读 · 2018年7月5日

Interpretable R-CNN

Arxiv

4+阅读 · 2017年11月14日

微信扫码咨询专知VIP会员