:实体链接旨在将文本中的实体指称映射到知识库中相应的实体,是知识图谱问答、智能推荐等下游任务的 基础。近年来,深度神经网络和预训练语言模型的快速发展为实体链接方法研究提供了坚实基础,并取得了显著 性能提升。该文对近期实体链接模型与方法进行了系统性的综述,主要从四个方面进行:第一,介绍实体链接的一 般框架,包括候选实体生成、候选实体排序和不可链接指称预测;第二,分析低资源实体链接研究现状,包括跨语言 迁移方法和跨领域迁移方法;第三,探讨面向特定领域的实体链接研究方法,重点介绍生物医学和社交媒体领域; 第四,简述多模态实体链接相关成果。最后,该文分析了目前实体链接方法面临的技术挑战,并展望了未来的研究 趋势。

实体链接(EntityLinking,EL)也被称为命名 实体消歧(NamedEntityDisambiguation,NED), 其任务目标是将文本中的指称(Mention)映射到知识库(KnowledgeBase,KB)中的相应实体。作为 自然语言处理、知识图谱等研究方向中的一项基础 任务,实体链接已被广泛应用于信息抽取[1-2]、问答 系统[3-5]、推荐系统[6]等多个下游任务。 早期基于机器学习的实体链接方法主要依赖于 特征工程。这类方法需要人工提取文本特征,依赖 于专家经验,且难以全面捕获依赖和交互信息。同 时,该类方法对特定的知识库和领域知识依赖性较 强,难以将训练好的实体链接模型推广到其他知识 库或领域,泛化性有待提升。 近年来,深度神经网络相关技术的快速发展显 著提升了文本分类、实体关系抽取、机器阅读理解和 实体链接等任务的性能。与传统机器学习方法相 比,深度神经网络在自动学习特征、上下文语义理解等方面具有明显优势。具体体现在:①可以自动学 习给定上下文的分布式表示,无须人工定义特征; ②可以学习文本低维稠密的静态嵌入,也可以动态 编码文本上下文特征,有利于深层语义理解;③可 以进行跨语言、多模态和不同领域数据的联合建模, 提高针对复杂上下文的理解、推理和泛化能力。基 于深度神经网络的实体链接方法研究已成为当前主 流趋势。 目前,一些研究人员已梳理了实体链接研究的 相关工作。例如,Shen等人[7]从候选实体生成、候 选实体排序和不可链接指称预测三个模块分析实体 链接的主要方法,但该综述主要基于传统的机器学 习视角,未涉及深度神经网络相关方法。2021年, Shen等人[8]综述了基于深度学习的实体链接方法, 主要涉及嵌入、特征和算法三个方面。但该综述仅 关注 通 用 架 构,未 涉 及 低 资 源、特 定 领 域 等 方 面。 Sevgili等人[9]分析了基于深度学习的实体链接方 法,提出实体链接通用体系结构及其优化方法,但该 综述也尚未详细分析特定领域或多模态场景下的实 体链接方法研究。 由此可见,上述工作大多侧重于实体链接的通 用框架,未涉及低资源、特定领域和多模态实体链接 等任务场景。与之不同的是,本文首先对实体链接 一般框架进行简要回顾,然后对低资源实体链接方 法进行分析,同时介绍了生物医学和社交媒体领域 实体链接以及多模态实体链接方法。本文还探讨了 当前实体链接研究面临的技术挑战,并对其未来发 展方向进行了展望。

成为VIP会员查看完整内容
14

相关内容

深度神经网络(DNN)是深度学习的一种框架,它是一种具备至少一个隐层的神经网络。与浅层神经网络类似,深度神经网络也能够为复杂非线性系统提供建模,但多出的层次为模型提供了更高的抽象层次,因而提高了模型的能力。
融合知识图谱的预训练模型研究综述
专知会员服务
44+阅读 · 3月31日
卷积神经网络的可解释性研究综述
专知会员服务
89+阅读 · 2023年6月5日
基于图学习的推荐系统研究综述
专知会员服务
88+阅读 · 2022年9月17日
城市大脑知识图谱构建及应用研究
专知会员服务
71+阅读 · 2022年6月28日
专知会员服务
36+阅读 · 2021年8月25日
专知会员服务
50+阅读 · 2021年8月13日
专知会员服务
120+阅读 · 2021年7月22日
专知会员服务
45+阅读 · 2021年3月24日
专知会员服务
45+阅读 · 2020年12月4日
基于小样本学习的图像分类技术综述
专知会员服务
148+阅读 · 2020年5月6日
「基于通信的多智能体强化学习」 进展综述
智能合约的形式化验证方法研究综述
专知
15+阅读 · 2021年5月8日
图像修复研究进展综述
专知
18+阅读 · 2021年3月9日
多模态情绪识别研究综述
专知
22+阅读 · 2020年12月21日
基于深度学习的数据融合方法研究综述
专知
31+阅读 · 2020年12月10日
时空序列预测方法综述
专知
20+阅读 · 2020年10月19日
基于图神经网络的知识图谱研究进展
AI科技评论
20+阅读 · 2020年8月31日
事件知识图谱构建技术与应用综述
专知
23+阅读 · 2020年8月6日
领域知识图谱研究综述
专知
15+阅读 · 2020年8月2日
国家自然科学基金
5+阅读 · 2017年12月31日
国家自然科学基金
0+阅读 · 2016年12月31日
国家自然科学基金
4+阅读 · 2015年12月31日
国家自然科学基金
5+阅读 · 2015年12月31日
国家自然科学基金
2+阅读 · 2015年12月31日
国家自然科学基金
1+阅读 · 2015年12月31日
国家自然科学基金
10+阅读 · 2015年12月31日
国家自然科学基金
1+阅读 · 2015年12月31日
国家自然科学基金
1+阅读 · 2015年12月31日
国家自然科学基金
0+阅读 · 2014年12月31日
Arxiv
149+阅读 · 2023年4月20日
A Survey of Large Language Models
Arxiv
384+阅读 · 2023年3月31日
Arxiv
64+阅读 · 2023年3月26日
Arxiv
133+阅读 · 2023年3月24日
Arxiv
19+阅读 · 2023年3月17日
VIP会员
相关VIP内容
融合知识图谱的预训练模型研究综述
专知会员服务
44+阅读 · 3月31日
卷积神经网络的可解释性研究综述
专知会员服务
89+阅读 · 2023年6月5日
基于图学习的推荐系统研究综述
专知会员服务
88+阅读 · 2022年9月17日
城市大脑知识图谱构建及应用研究
专知会员服务
71+阅读 · 2022年6月28日
专知会员服务
36+阅读 · 2021年8月25日
专知会员服务
50+阅读 · 2021年8月13日
专知会员服务
120+阅读 · 2021年7月22日
专知会员服务
45+阅读 · 2021年3月24日
专知会员服务
45+阅读 · 2020年12月4日
基于小样本学习的图像分类技术综述
专知会员服务
148+阅读 · 2020年5月6日
相关资讯
「基于通信的多智能体强化学习」 进展综述
智能合约的形式化验证方法研究综述
专知
15+阅读 · 2021年5月8日
图像修复研究进展综述
专知
18+阅读 · 2021年3月9日
多模态情绪识别研究综述
专知
22+阅读 · 2020年12月21日
基于深度学习的数据融合方法研究综述
专知
31+阅读 · 2020年12月10日
时空序列预测方法综述
专知
20+阅读 · 2020年10月19日
基于图神经网络的知识图谱研究进展
AI科技评论
20+阅读 · 2020年8月31日
事件知识图谱构建技术与应用综述
专知
23+阅读 · 2020年8月6日
领域知识图谱研究综述
专知
15+阅读 · 2020年8月2日
相关基金
国家自然科学基金
5+阅读 · 2017年12月31日
国家自然科学基金
0+阅读 · 2016年12月31日
国家自然科学基金
4+阅读 · 2015年12月31日
国家自然科学基金
5+阅读 · 2015年12月31日
国家自然科学基金
2+阅读 · 2015年12月31日
国家自然科学基金
1+阅读 · 2015年12月31日
国家自然科学基金
10+阅读 · 2015年12月31日
国家自然科学基金
1+阅读 · 2015年12月31日
国家自然科学基金
1+阅读 · 2015年12月31日
国家自然科学基金
0+阅读 · 2014年12月31日
微信扫码咨询专知VIP会员