:实体链接旨在将文本中的实体指称映射到知识库中相应的实体,是知识图谱问答、智能推荐等下游任务的 基础。近年来,深度神经网络和预训练语言模型的快速发展为实体链接方法研究提供了坚实基础,并取得了显著 性能提升。该文对近期实体链接模型与方法进行了系统性的综述,主要从四个方面进行:第一,介绍实体链接的一 般框架,包括候选实体生成、候选实体排序和不可链接指称预测;第二,分析低资源实体链接研究现状,包括跨语言 迁移方法和跨领域迁移方法;第三,探讨面向特定领域的实体链接研究方法,重点介绍生物医学和社交媒体领域; 第四,简述多模态实体链接相关成果。最后,该文分析了目前实体链接方法面临的技术挑战,并展望了未来的研究 趋势。
实体链接(EntityLinking,EL)也被称为命名 实体消歧(NamedEntityDisambiguation,NED), 其任务目标是将文本中的指称(Mention)映射到知识库(KnowledgeBase,KB)中的相应实体。作为 自然语言处理、知识图谱等研究方向中的一项基础 任务,实体链接已被广泛应用于信息抽取[1-2]、问答 系统[3-5]、推荐系统[6]等多个下游任务。 早期基于机器学习的实体链接方法主要依赖于 特征工程。这类方法需要人工提取文本特征,依赖 于专家经验,且难以全面捕获依赖和交互信息。同 时,该类方法对特定的知识库和领域知识依赖性较 强,难以将训练好的实体链接模型推广到其他知识 库或领域,泛化性有待提升。 近年来,深度神经网络相关技术的快速发展显 著提升了文本分类、实体关系抽取、机器阅读理解和 实体链接等任务的性能。与传统机器学习方法相 比,深度神经网络在自动学习特征、上下文语义理解等方面具有明显优势。具体体现在:①可以自动学 习给定上下文的分布式表示,无须人工定义特征; ②可以学习文本低维稠密的静态嵌入,也可以动态 编码文本上下文特征,有利于深层语义理解;③可 以进行跨语言、多模态和不同领域数据的联合建模, 提高针对复杂上下文的理解、推理和泛化能力。基 于深度神经网络的实体链接方法研究已成为当前主 流趋势。 目前,一些研究人员已梳理了实体链接研究的 相关工作。例如,Shen等人[7]从候选实体生成、候 选实体排序和不可链接指称预测三个模块分析实体 链接的主要方法,但该综述主要基于传统的机器学 习视角,未涉及深度神经网络相关方法。2021年, Shen等人[8]综述了基于深度学习的实体链接方法, 主要涉及嵌入、特征和算法三个方面。但该综述仅 关注 通 用 架 构,未 涉 及 低 资 源、特 定 领 域 等 方 面。 Sevgili等人[9]分析了基于深度学习的实体链接方 法,提出实体链接通用体系结构及其优化方法,但该 综述也尚未详细分析特定领域或多模态场景下的实 体链接方法研究。 由此可见,上述工作大多侧重于实体链接的通 用框架,未涉及低资源、特定领域和多模态实体链接 等任务场景。与之不同的是,本文首先对实体链接 一般框架进行简要回顾,然后对低资源实体链接方 法进行分析,同时介绍了生物医学和社交媒体领域 实体链接以及多模态实体链接方法。本文还探讨了 当前实体链接研究面临的技术挑战,并对其未来发 展方向进行了展望。