机器学习和数据挖掘中的许多重要问题,如知识库推理、个性化实体推荐、科学假设生成等,都可以归结为图数据结构上的学习和推理。这些问题代表了推进图学习的令人兴奋的机会,但也带来了重大挑战。由于图通常是稀疏的,并且由模式定义,因此它们通常不能完全捕获数据中潜在的复杂关系。将图与丰富的辅助文本模态相结合的模型具有更高的表达潜力,但联合处理这些不同的模态——即稀疏的结构化关系和密集的非结构化文本——并不是直接的。
本文考虑了通过结合结构和文本来改进图学习的重要问题。论文的第一部分考虑了关系知识表示和推理任务,展示了预训练上下文语言模型在为图结构知识库增加新的深度和丰富度方面的巨大潜力。论文的第二部分超越了知识库,通过对文档交互和内容进行联合建模,改进信息检索和推荐系统中出现的图学习任务。所提出的方法在单模态和跨模态基线上不断提高准确性,这表明,通过适当选择的归纳偏差和仔细的模型设计,可以充分利用结构和文本的独特互补方面。