本文介绍 IJCAI 2020 中 3 篇与异质信息网络相关的论文。分别为:
-
-
-
1. Network Schema Preserving Heterogeneous Information Network Embedding
现有的许多 HIN 嵌入方法都采用元路径引导的随机游走来保留不同类型节点之间的语义和结构相关性。然而,元路径的选择仍然是一个悬而未决的问题,它要么依赖于领域知识,要么是从标签信息中学习的。
网络模式全面包含了 HIN 的高阶结构以及丰富的语义。这篇文章首次对保留 HIN 嵌入的网络模式进行了研究,并提出了一种新的模型—— NSHE 模型。在 NSHE 中,
-
首先
提出一种网络模式采样方法来生成子图(即模式实例),
-
然后
构建多任务学习任务来保留每个模式实例的异构结构。
-
除了保留成对结构信息之外,NSHE 还能够
保留高阶结构(即网络模式)。
在三个真实数据集上的广泛实验表明,提出的模型NSHE的性能明显优于最先进的方法。
HIN 数据示例
NSHE 模型
实验结果
2. Heterogeneous Network Representation Learning
这篇综述考察和回顾了异质信息网络表示学习的问题。该问题的目标是自动地将输入异质网络中的对象(最常见的是顶点)投影到潜在嵌入空间中,使得可以对网络的结构和关系属性进行编码和保留。然后,嵌入(表示)可以用作机器学习算法的特征,用于处理相应的网络任务。
要学习具有代表性的嵌入,目前的研究进展可以分为两大类:浅层嵌入学习和图神经网络。在彻底回顾现有文献之后,文章确定了几个仍未解决的关键挑战,并讨论了未来的方向。最后建立了异质图 Benchmark,以便于对这一快速发展的主题进行开放式研究。
HIN Benchmark
https://github.com/HeterogeneousGraph
未来方向
-
A voiding Meta Path Design.
-
Multi-Sense Representations.
-
Pre-Training of (Heterogeneous) GNNs.
-
-
Dynamics and Scalability.
-
3. Domain Adaptive Classification on Heterogeneous Information Networks
虽然领域自适应(DA)技术在图像和文本中得到了广泛的应用,但异质信息网络(HIN)的异质性和复杂的语义对其上的领域自适应分类提出了特殊的挑战。
-
一方面,HINs 涉及多个层次的语义,因此需要在它们之间进行域对齐。
-
另一方面,必须在领域相似性和可区分性之间进行仔细的权衡,因为已经证明领域不变特征对于分类来说是信息不足的。
这篇文章提出了多空间域自适应分类算法 MuSDAC 来解决 HINs 上的 DA 问题。具体地说:
-
文章利用
多通道共享权重 GCNs,将 HINs 中的节点投影到多个空间,在那里进行成对对齐。
-
此外,文章还提出了一种
启发式采样算法,有效地选择了具有可区分性的通道组合,并提出了
移动平均加权投票方案来融合所选择的通道,从而最小化了迁移和分类损失。
在成对数据集上的大量实验不仅证实了模型在 HINs 上的领域自适应分类性能,而且给出了每个组件对应的效果。
模型图
数据集
分别从 ACM、AMiner 和 DBLP 中抽出结构不同的图对。表1列出了这些数据集的统计数据,因此显示了它们的结构差异。对于每对图,元路径边的密度彼此之间差别很大,这表明这些图对是域兼容的(即结构上不相似)。
节点分类任务实验结果
专知,专业可信的人工智能知识分发,让认知协作更快更好!欢迎注册登录专知www.zhuanzhi.ai,获取5000+AI主题干货知识资料!
欢迎微信扫一扫加入专知人工智能知识星球群,获取最新AI专业干货知识教程视频资料和与专家交流咨询!
点击“阅读原文”,了解使用专知,查看5000+AI主题知识资料