知识图谱(KGs)已成为一种高效的知识组织和表示方式,通过存储实体之间的底层关系来实现。最近,大量研究工作致力于KG嵌入,旨在将KG中的实体和关系映射到低维连续向量空间中,以便快速推理。KG嵌入模型已广泛应用于KGs上的不同学习任务,例如,KG补全、多跳复杂推理和KG对齐。由于大多数结构化知识只在特定时间点或特定间隔内有效,因此许多大型KGs将时间信息加入三元事实中,以捕捉知识的时间动态,除了其多关系特性。最近,时间KGs的可用性催生了对能够建模时间感知四元事实的新KG嵌入方法的需求。本文旨在深入研究时间KG表示学习和推理。我们的动机是通过提出新的时间KG嵌入方法,提高嵌入模型在时间KGs上的性能。
在这项工作中,我们将静态KGs的三个基本学习任务扩展到时间KGs,即,时间KG补全、多跳时间KG推理和时间实体对齐。我们首先提出了三种新颖的时间KG嵌入模型,即ATiSE、TeRo、TGeomE,用于时间KG补全任务。具体来说,ATiSE使用多维加法时间序列分解来模拟实体/关系表示的时间演变,TeRo定义了实体嵌入在复数向量空间中随时间的旋转演变,而TGeomE通过来自多维几何代数的多向量嵌入对时间KG进行四阶张量分解,并考虑新的线性时间规则化。我们提出的时间KG补全模型在发布时实现了最新技术。为了解决多跳时间KG推理问题,我们从三个常见的时间KG基准中生成了三个时间查询数据集,并提出了一个基于向量逻辑的时间查询嵌入框架TFLEX。TFLEX是第一个能够同时处理一阶逻辑操作和时间逻辑操作,并在TKGs上回答多跳实体查询和时间戳查询的查询嵌入框架。
最后,我们引入了基于图神经网络的两个新的时间KG嵌入模型,TEA-GNN和TREA,用于时间KGs之间的实体对齐,并提出了三个新的时间KG数据集作为评估实体对齐方法的参考。TEA-GNN将时间戳视为实体间链接的关注特性,并使用时间感知的图自注意力机制有效地将时间信息整合到图神经网络中。在TEA-GNN的基础上,TREA具有更好的归纳学习能力来表示新出现的实体和时间戳,并在大规模时间KGs上具有更高的训练效率。我们实证证明,所提出的TEA模型显著优于现有的静态实体对齐方法和面向时间KG补全的时间KG嵌入模型。总的来说,这篇论文通过引入新的任务、指标、数据集和模型,解决了时间KG嵌入的不同挑战。实验结果表明,我们提出的方法成功地将时间信息整合到KGs的表示学习模型中。