知识图谱补全是近年来的研究热点,在下游应用中,如知识问答、推荐系统和智能搜索等都有着广泛的应用前景。然而,大部分补全方法忽略了知识图谱的动态特性,其中许多的事实都会随着时间的变化而发生改变。新兴的时序知识图谱补全方法考虑到了以往补全方法的局限性,在其中加入了时间信息,使得知识图谱随时间的动态变化也能很好地被捕获。针对时序知识图谱补全方法在社交网络、交通运输、金融贸易等动态变化且具有复杂时间依赖特性的研究领域所拥有的巨大潜力,梳理了时序知识图谱补全技术。根据模型主要使用原理的不同,总结了基于逻辑规则、张量分解、平移模型、神经网络、深度强化学习和语言模型的补全方法,归纳了现有方法的常用评价指标、公开数据集、核心思想、优缺点、适用场景以及在对应静态模型上的改进。最后,对时序知识图谱补全方法的未来研究方向进行了展望。近些年来,知识图谱技术及其应用受到了广大研究 人员的关注。知识图谱以图的形式描述了客观世界中 实体和概念以及它们之间的关系[1]。知识图谱的构建过 程非常接近于人脑对新事物的一个认知和学习的过程, 它通过存储各种各样的结构化知识,逐渐成为人工智能 的“大脑”,致力于解决认知智能中复杂的推理问题。因 此,知识图谱在各种应用中扮演着非常重要的角色,如 知识问答[2]、智能推荐[3]、语义搜索[4]等。知识图谱补全主要是对已经存在于图数据库中的 数据之间的潜在关系进行挖掘。当前,大多数知识图谱 补全方法都是在静态知识图谱上进行的,它们默认事实 是永恒不变的,没有考虑实体与概念以及关系之间的时 效性,由此补全的知识图谱在时效性强的领域准确性较 低。随着时间的变化,客观世界中的大部分事实也会发生变化。例如,(比尔盖茨,居住在,波士顿)和(比尔盖 茨,居住在,华盛顿)这两个三元组在静态知识图谱补全 中无法判断它们的正确性;在时序知识图谱中,这两个 三元组可以写成(比尔盖茨,居住在,波士顿,1973— 1975),(比尔盖茨,居住在,华盛顿,1979—)含有时间信 息的四元组形式,由于有了时间序列的引入,它们在图 数据库中并不属于矛盾的存在。这也说明时序知识图 谱能解决静态知识图谱中语义相似三元组之间的混淆, 减少知识图谱补全过程中的干扰项,并能在一定程度上 预测事件发生的时间范围[5]。时序知识图谱补全在下游应用中,例如军事、交通、 金融等领域都有着广泛的应用前景,是当前最热门研究 方向之一。从不同的视角,对时序知识图谱补全方法的 划分也不同。Cai等人[6]根据时间戳集成策略的不同,将 时序知识图谱补全分为包含时间戳的张量分解、基于时 间戳的转换、动态嵌入、从知识图快照中学习、历史背景 下推理的补全方法。徐涌鑫等人[5]根据对事实建模方法 的不同将时序知识图谱补全分为基于翻译模型、双线性 模型、旋转模型、时序点过程、概率分布、图神经网络以 及其他模型的补全方法。Jin 等人[7]根据知识补全的设 置将时序知识图谱补全分为插值和外推。插值是指 ∀t ∈ [t0 ,tT] ,时序知识图谱补全能在此范围内对四元组 进行链接预测,外推是指用历史知识来预测未来时间 t(t > tT) 的事实。Trivedi 等人[8]根据对时间戳的划分把 时序知识图谱分为离散时间法和连续时间法。离散时 间方法是将时序知识图谱的演变看作一段时间内静态 图谱快照的集合,连续时间方法是将时间演变以更精细 的时间粒度建模,以捕获更加丰富的时间信息。申宇铭 等人[9]根据对符号处理方式的不同把时序知识图谱补全 分为基于符号逻辑的方法和基于知识表示学习的方法。随着时序知识图谱的兴起,关于此方向补全模型的研究 越来越多,然而却缺乏总结当前时序知识图谱补全研究 进展的相关调查。为此,本文对时序知识图谱补全研究 进行了系统性的综述。本文参照文献[10-14]对静态知 识图谱推理方法的分类,根据模型主要使用的原理,将 时序知识图谱补全方法分为基于逻辑规则、张量分解、 平移模型、神经网络、深度强化学习和语言模型的方 法。此外,本文还总结了时序知识图谱补全中常用的评 价指标和公开数据集,对未来研究的趋势进行了展望。