分子表示学习有助于多种下游任务,如分子性质预测和药物设计。为了正确地表示分子,图对比学习是一个很有前途的范式,因为它利用了自监督信号,而且不需要人类注释。然而,以往的研究没有将基本的领域知识纳入图语义学中,从而忽略了具有共同属性但没有键直接连接的原子之间的关联。为了解决这些问题,我们构建了一个化学元素知识图谱(KG)来概括元素之间的微观关联,并提出了一种新的知识增强对比学习(KCL)框架来进行分子表示学习。KCL框架由三个模块组成。第一个模块是知识引导的图增强模块,对原有的基于化学元素KG的分子图进行扩充。第二个模块是知识感知图表示,对原始分子图使用通用图编码器提取分子表示,并使用知识感知消息传递神经网络(knowledge-aware Message Passing Neural Network, KMPNN)对增强分子图中的复杂信息进行编码。最后一个模块是一个对比目标,在这里我们最大化了分子图的这两种视图之间的一致性。大量实验表明,KCL在8个分子数据集上取得了优于先进基线的性能。可视化实验正确地解释了KCL从增广分子图中的原子和属性中学到的东西。我们的代码和数据有补充资料。
https://www.zhuanzhi.ai/paper/f5dde3a2bd3952b03c85b3a32edbd7d2