【KDD2021】大规模异质图上的预训练框架 - 专知VIP

会员服务 ·

3

异质网络 · 自监督学习 · 预训练 ·

2021 年 6 月 20 日

【KDD2021】大规模异质图上的预训练框架

专知会员服务

专知，提供专业可信的知识分发服务，让认知协作更快更好！

在图数据挖掘任务中，对于特定任务，有标签的数据通常十分稀少，然而现实中存在着大量无标签的数据。

因此，如何通过预训练从这些标签数据中获取有用的先验知识，从而提升下游任务的表现成为了一个有价值的问题。我们本篇工作提出了一种在大规模异质图上进行高效预训练的框架。

近年来，图神经网络作为图结构数据学习的重要方法，可以通过递归的从邻居聚合消息（特征和节点表示）来学习到有效的图表示。但是图神经网络通常需要大量的有标签数据来取得令人满意的表现。为了解决标签稀疏的问题，一些工作提出了基于自监督的方法来从无标签的数据中提取先验知识。然而，现有的预训练框架都是基于同质图的，但现实生活中的交互系统通常都是有多种类型节点和边的大规模的异质图。因此，在我们设计预训练模型的时候遇到了如下两个挑战。

如何捕捉异质图的语义和结构性质相比同质图，异质图具有更丰富的语义和结构信息。不同类型的节点通常有不同的图结构性质（例如会议节点的度要普遍高于其他类型的节点）。不同类型的连边通常有不同的语义关系。因此为了有效的预训练，我们需要捕捉这些信息。

如何在大规模异质图上高效预训练一个 GNN

现实生活中的异质图可以拥有数十亿的节点和边。为了可以在这样这样大规模的图上进行预训练，我们需要设计一种加速策略来保证我们在大规模异质图上的预训练效率。

为了解决上述的两个问题，我们提出了 PTHGNN 来进行大规模异质图上的预训练。对于第一个挑战，基于对比学习，我们提出了节点级别和网络模式级别的预训练任务来捕捉异质图的语义和结构信息。对于第二个挑战，我们提出了基于 personalized pagerank 的边稀疏化方法，从而来提高我们进行大规模预训练的效率。

成为VIP会员查看完整内容

46

相关内容

异质网络

【KDD2021】TUTA: 通用表格预训练的树结构Transformer

专知会员服务

25+阅读 · 2021年8月22日

【KDD2021 】基于协同对比学习的自监督异质图神经网络

专知会员服务

38+阅读 · 2021年5月28日

【WWW2021】大规模组合K推荐

【WWW2021】大规模组合K推荐

专知会员服务

44+阅读 · 2021年5月3日

【WWW2021】自监督学习上下文嵌入的异构网络链接预测

【WWW2021】自监督学习上下文嵌入的异构网络链接预测

专知会员服务

40+阅读 · 2021年2月10日

【AAAI2021】预训练用户表示提升推荐

【AAAI2021】预训练用户表示提升推荐

专知会员服务

44+阅读 · 2021年2月8日

AAAI2021 | 学习预训练图神经网络

AAAI2021 | 学习预训练图神经网络

专知会员服务

116+阅读 · 2021年1月28日

微软东昱晓《图表示学习: 嵌入，GNNs与预训练》2020教程，100页ppt

微软东昱晓《图表示学习: 嵌入，GNNs与预训练》2020教程，100页ppt

专知会员服务

131+阅读 · 2020年9月29日

CIKM 2020 | 序列推荐预训练：基于互信息最大化的自监督学习

专知会员服务

46+阅读 · 2020年9月17日

【KDD2020-UCLA-微软】GPT-GNN：图神经网络的预训练

【KDD2020-UCLA-微软】GPT-GNN：图神经网络的预训练

专知会员服务

63+阅读 · 2020年8月19日

【KDD2020】图神经网络生成式预训练，GPT-GNN: Generative Pre-Training of Graph Neural Networks

【KDD2020】图神经网络生成式预训练，GPT-GNN: Generative Pre-Training of Graph Neural Networks

专知会员服务

99+阅读 · 2020年7月3日

IJCAI20 | 保持网络模式的异质信息网络表示学习

IJCAI20 | 保持网络模式的异质信息网络表示学习

专知

8+阅读 · 2020年8月24日

【KDD2020】图神经网络生成式预训练

【KDD2020】图神经网络生成式预训练

专知

22+阅读 · 2020年7月3日

ICLR 2020丨克服“邻点爆炸式增长”，开启新视角下的通用训练框架

ICLR 2020丨克服“邻点爆炸式增长”，开启新视角下的通用训练框架

AI科技评论

5+阅读 · 2020年5月1日

ICML2020 图神经网络的预训练

ICML2020 图神经网络的预训练

图与推荐

12+阅读 · 2020年4月4日

WWW 2020 开源论文 | 异构图Transformer

WWW 2020 开源论文 | 异构图Transformer

PaperWeekly

13+阅读 · 2020年4月3日

EMNLP 2019开源论文：针对短文本分类的异质图注意力网络

EMNLP 2019开源论文：针对短文本分类的异质图注意力网络

PaperWeekly

31+阅读 · 2019年10月22日

ACL 2019 | 基于知识增强的语言表示模型，多项NLP任务表现超越BERT

ACL 2019 | 基于知识增强的语言表示模型，多项NLP任务表现超越BERT

PaperWeekly

8+阅读 · 2019年6月3日

HAN：基于双层注意力机制的异质图深度神经网络

HAN：基于双层注意力机制的异质图深度神经网络

黑龙江大学自然语言处理实验室

20+阅读 · 2019年5月7日

阿里开源大规模分布式图学习框架：专为Graph嵌入，无缝对接TF/PyTorch

阿里开源大规模分布式图学习框架：专为Graph嵌入，无缝对接TF/PyTorch

新智元

9+阅读 · 2019年1月17日

【CQA论文笔记】基于异构社交网络学习的社区问答方法，同时建模问题、回答和回答者

【CQA论文笔记】基于异构社交网络学习的社区问答方法，同时建模问题、回答和回答者

专知

7+阅读 · 2018年3月22日

Topology Distillation for Recommender System

Arxiv

9+阅读 · 2021年6月16日

Interest-aware Message-Passing GCN for Recommendation

Interest-aware Message-Passing GCN for Recommendation

Arxiv

12+阅读 · 2021年2月19日

Scalable Graph Neural Networks via Bidirectional Propagation

Arxiv

16+阅读 · 2020年10月29日

Heterogeneous Graph Transformer

Heterogeneous Graph Transformer

Arxiv

27+阅读 · 2020年3月3日

Graph Neural News Recommendation with Long-term and Short-term Interest Modeling

Graph Neural News Recommendation with Long-term and Short-term Interest Modeling

Arxiv

4+阅读 · 2019年11月8日

Multi-Task Learning for Conversational Question Answering over a Large-Scale Knowledge Base

Arxiv

3+阅读 · 2019年10月11日

Centroid Networks for Few-Shot Clustering and Unsupervised Few-Shot Classification

Arxiv

3+阅读 · 2019年2月22日

Logic Attention Based Neighborhood Aggregation for Inductive Knowledge Graph Embedding

Arxiv

7+阅读 · 2018年11月4日

Convolutional 2D Knowledge Graph Embeddings

Arxiv

29+阅读 · 2018年4月6日

Neural Attentive Session-based Recommendation

Arxiv

5+阅读 · 2017年11月13日

VIP会员

相关主题

自监督学习

相关VIP内容

【KDD2021】TUTA: 通用表格预训练的树结构Transformer

专知会员服务

25+阅读 · 2021年8月22日

【KDD2021 】基于协同对比学习的自监督异质图神经网络

专知会员服务

38+阅读 · 2021年5月28日

【WWW2021】大规模组合K推荐

【WWW2021】大规模组合K推荐

专知会员服务

44+阅读 · 2021年5月3日

【WWW2021】自监督学习上下文嵌入的异构网络链接预测

【WWW2021】自监督学习上下文嵌入的异构网络链接预测

专知会员服务

40+阅读 · 2021年2月10日

【AAAI2021】预训练用户表示提升推荐

【AAAI2021】预训练用户表示提升推荐

专知会员服务

44+阅读 · 2021年2月8日

AAAI2021 | 学习预训练图神经网络

AAAI2021 | 学习预训练图神经网络

专知会员服务

116+阅读 · 2021年1月28日

微软东昱晓《图表示学习: 嵌入，GNNs与预训练》2020教程，100页ppt

微软东昱晓《图表示学习: 嵌入，GNNs与预训练》2020教程，100页ppt

专知会员服务

131+阅读 · 2020年9月29日

CIKM 2020 | 序列推荐预训练：基于互信息最大化的自监督学习

专知会员服务

46+阅读 · 2020年9月17日

【KDD2020-UCLA-微软】GPT-GNN：图神经网络的预训练

【KDD2020-UCLA-微软】GPT-GNN：图神经网络的预训练

专知会员服务

63+阅读 · 2020年8月19日

【KDD2020】图神经网络生成式预训练，GPT-GNN: Generative Pre-Training of Graph Neural Networks

【KDD2020】图神经网络生成式预训练，GPT-GNN: Generative Pre-Training of Graph Neural Networks

专知会员服务

99+阅读 · 2020年7月3日

热门VIP内容

开通专知VIP会员享更多权益服务

《多智能体不确定环境追逃博弈研究》216页

美智库最新发布《解放军"人机编组协同作战"发展路径：理论与实践》53页

现代战争"杀伤区"理论：空间尺度与结构特征、控制手段与毁伤机制、生存策略与战线转移

《俄军无人机创新技术或已在乌克兰达成"战场空中封锁"作战效果》最新18页报告

相关资讯

IJCAI20 | 保持网络模式的异质信息网络表示学习

IJCAI20 | 保持网络模式的异质信息网络表示学习

专知

8+阅读 · 2020年8月24日

【KDD2020】图神经网络生成式预训练

【KDD2020】图神经网络生成式预训练

专知

22+阅读 · 2020年7月3日

ICLR 2020丨克服“邻点爆炸式增长”，开启新视角下的通用训练框架

ICLR 2020丨克服“邻点爆炸式增长”，开启新视角下的通用训练框架

AI科技评论

5+阅读 · 2020年5月1日

ICML2020 图神经网络的预训练

ICML2020 图神经网络的预训练

图与推荐

12+阅读 · 2020年4月4日

WWW 2020 开源论文 | 异构图Transformer

WWW 2020 开源论文 | 异构图Transformer

PaperWeekly

13+阅读 · 2020年4月3日

EMNLP 2019开源论文：针对短文本分类的异质图注意力网络

EMNLP 2019开源论文：针对短文本分类的异质图注意力网络

PaperWeekly

31+阅读 · 2019年10月22日

ACL 2019 | 基于知识增强的语言表示模型，多项NLP任务表现超越BERT

ACL 2019 | 基于知识增强的语言表示模型，多项NLP任务表现超越BERT

PaperWeekly

8+阅读 · 2019年6月3日

HAN：基于双层注意力机制的异质图深度神经网络

HAN：基于双层注意力机制的异质图深度神经网络

黑龙江大学自然语言处理实验室

20+阅读 · 2019年5月7日

阿里开源大规模分布式图学习框架：专为Graph嵌入，无缝对接TF/PyTorch

阿里开源大规模分布式图学习框架：专为Graph嵌入，无缝对接TF/PyTorch

新智元

9+阅读 · 2019年1月17日

【CQA论文笔记】基于异构社交网络学习的社区问答方法，同时建模问题、回答和回答者

【CQA论文笔记】基于异构社交网络学习的社区问答方法，同时建模问题、回答和回答者

专知

7+阅读 · 2018年3月22日

相关论文

Topology Distillation for Recommender System

Arxiv

9+阅读 · 2021年6月16日

Interest-aware Message-Passing GCN for Recommendation

Interest-aware Message-Passing GCN for Recommendation

Arxiv

12+阅读 · 2021年2月19日

Scalable Graph Neural Networks via Bidirectional Propagation

Arxiv

16+阅读 · 2020年10月29日

Heterogeneous Graph Transformer

Heterogeneous Graph Transformer

Arxiv

27+阅读 · 2020年3月3日

Graph Neural News Recommendation with Long-term and Short-term Interest Modeling

Graph Neural News Recommendation with Long-term and Short-term Interest Modeling

Arxiv

4+阅读 · 2019年11月8日

Multi-Task Learning for Conversational Question Answering over a Large-Scale Knowledge Base

Arxiv

3+阅读 · 2019年10月11日

Centroid Networks for Few-Shot Clustering and Unsupervised Few-Shot Classification

Arxiv

3+阅读 · 2019年2月22日

Logic Attention Based Neighborhood Aggregation for Inductive Knowledge Graph Embedding

Arxiv

7+阅读 · 2018年11月4日

Convolutional 2D Knowledge Graph Embeddings

Arxiv

29+阅读 · 2018年4月6日

Neural Attentive Session-based Recommendation

Arxiv

5+阅读 · 2017年11月13日

微信扫码咨询专知VIP会员