在这项综述中,我们提供了一个在信息检索(IR)背景下的知识图谱(KGs)的文献综述。现代信息检索系统可以以多种方式从知识图谱中获益,不论知识图谱是公开的还是专有的。我们提供了构建利用KGs和使用我们讨论的面向任务的材料组织的IR系统所需的组件的概述。了解IR和KGs的交集对许多研究者和实践者有益,我们从两个互补的角度来考虑之前的工作: 利用KGs进行信息检索和利用IR技术丰富KGs。我们首先讨论如何使用KGs来支持IR任务,包括文档和实体检索。接下来,我们将描述如何使用IR和语言技术构建和完成KGs,包括实体识别、类型和关系提取等任务。我们讨论在我们考虑的任务中出现的常见问题,并确定解决这些问题的未来方向。我们还提供了数据集和其他资源的指南,应该是有用的新手和经验丰富的研究人员在该领域。
https://www.nowpublishers.com/article/Details/INR-063
摘要:
知识图谱(KG)是实体以及它们的关系和属性的存储库,这些实体用图表示。在现代信息获取方法中,KGs无处不在(Dalton和Dietz, 2013)。具体地说,在信息检索(IR)中,KGs有助于实现语义搜索。
有两种特征的语义搜索的信息检索IR背景: (1)超越“ten blue links”以返回任何相关的结果(比如直接答案,可操作的实体,或关系)和 (2)理解查询和文档,并改善它们之间的匹配和相关关系。理想情况下,搜索引擎能够直接回答用户的信息需求——或者至少生成通过查询表达的信息需求的可能解释。为了实现这一目标,需要各种面向实体的组件来解决信息检索管道中不同阶段的特定问题,包括标识查询中的实体、标识文档中的实体,以及利用实体和关系信息来帮助标识要检索的相关项的方法。尽管事实上,IR和KGs在现代网络和特定领域搜索引擎的背景下日益交织在一起,但文献中并没有从IR的角度对KGs进行广泛的处理,反之亦然。我们的目的是通过本综述提供这一领域以任务为导向的研究概述来填补这一空白。
目标
本调查的目的是建立现代信息获取的两个重要组成部分: IR和KGs之间的桥梁。我们总结了研究工作、群组相关方法,并讨论了IR和KGs的任务共享挑战。我们在本调查中的贡献可以概括如下: (1) 我们从IR的角度对KGs相关任务进行了广泛的概述;
(2) 对每一项任务进行全面综述;
(3) 我们就任务中的共同问题进行讨论。
专知便捷查看
便捷下载,请关注专知公众号(点击上方蓝色专知关注)
后台回复“KGIR” 可以获取《彭博新书《知识图谱: 一种信息检索视角》,156页pdf系统性阐述KG与IR之间的关系》专知下载链接索引