MoCL: Contrastive Learning on Molecular Graphs with Multi-level Domain Knowledge
Authors: Mengying Sun, Jing Xing, Huijun Wang, Bin Chen, Jiayu Zhou
近年来,利用图神经网络解决药物相关问题在生物医学领域得到了迅速发展。然而,就像任何其他深度架构一样,GNN是数据需求型的。虽然在现实世界中要求标签通常是昂贵的,但以一种无监督的方式对GNN进行预处理已经被积极地探索。其中,图对比学习通过最大化成对图增强之间的互信息,已被证明对各种下游任务是有效的。然而,目前的图对比学习框架有两个局限性。首先,增强是为一般图设计的,因此对于某些领域可能不够合适或不够强大。第二,对比方案只学习对局部扰动不变的表示,因此不考虑数据集的全局结构,这也可能对下游任务有用。因此,本文研究生物医学领域中存在分子图的图对比学习。我们提出了一个新的框架MoCL,利用领域知识在局部和全局水平上帮助表示学习。局部层次的领域知识指导扩展过程,这样在不改变图语义的情况下引入变体。全局层次的知识对整个数据集图之间的相似性信息进行编码,并帮助学习具有更丰富语义的表示。整个模型通过双对比目标学习。我们评估了在线性和半监督设置下的多种分子数据集上的MoCL,结果表明MoCL达到了最先进的性能。