该书涵盖了面向实体的搜索的所有方面,其中“搜索”可以从最广泛的信息获取的意义上进行解释——从一个统一的观点出发,并提供了对该技术状态的连贯和全面概述。它代表了在这一广泛而迅速发展的领域的第一次综合研究。本课程将深入探讨相关议题,目标是建立基本技术与方法,作为未来研究与发展的基础。附加的主题只在调查的水平上处理,包含许多指向相关文献的指针。基于在此过程中发现的开放问题和挑战,为未来研究绘制路线图。
本书分为三个主要部分,在导论和结语章节之间。前两章向读者介绍基本概念,提供面向实体的搜索任务的概述,并呈现将在整本书中使用的各种类型和数据来源。第一部分处理实体排序的核心任务: 给定一个文本查询(可能添加了额外的元素或结构提示),返回一个经过排序的实体列表。使用结构化和非结构化数据集合以及许多查询公式,在许多不同的变体中检查这个核心任务。第二部分将介绍实体在桥接非结构化和结构化数据中的作用。第三部分探讨了实体如何使搜索引擎能够理解用户在搜索框中输入的查询背后的概念、含义和意图,以及它们如何提供丰富而有重点的响应(而不仅仅是文档列表)——这个过程称为语义搜索。最后一章通过讨论当前方法的局限性来总结这本书,并为未来的研究提出方向。
研究人员和研究生是这本书的主要目标受众。信息检索的一般背景足以遵循材料,包括了解基本的概率和统计概念,以及机器学习概念和监督学习算法的基本知识。