最近,异质图神经网络(HGNNs)在处理异质信息网络(HIN)方面展现了优越的能力。大部分的HGNNs都遵循半监督学习的设定,然而实际应用中标签信息往往很难获得。而自监督学习由于能够自发地从数据本身挖掘监督信号,已经成为无监督设定下很好的选择。作为一种典型的自监督机制,对比学习(contrastive learning)通过从数据中抽取出正负样本,同时最大化正例间的相似度以及最小化负例间相似度,能够学到判别性的表示。尽管对比学习在CV和NLP领域得到了广泛应用,如何将它和HIN结合却尚未解决。
通过认真考虑HIN以及对比学习的特性,我们总结了三个需要解决的本质问题:
1)如何设计异质对比机制 HIN中包含复杂结构,例如元路径(meta-path),需要利用跨视图的对比学习机制来综合刻画。
2)如何在HIN中选择合适的视图 对于视图的基本要求是,能够刻画网络的局部结构和高阶结构。网络模式(network schema)反应了节点间的直接连接情况,捕捉局部结构;元路径通常被用来抽取多跳关系。
3)如何设置困难的对比任务 简单的正负关系很容易被捕获,模型学到的信息有限。增加对比任务的难度,可通过增加两个视图间的差异,或者生成更高质量的负样本来实现。
在本篇文章中,我们提出了一个新的基于协同对比学习的异质图神经网络框架,简称HeCo。HeCo采用跨视图的对比机制,选择网络模式和元路径作为两个视图,结合视图掩盖机制,分别学得两个视图下的节点表示。之后,利用跨视图对比学习,使得两个视图协同监督。此外,我们还提出两个HeCo扩展,通过生成更高质量的负例,提升最终效果。