在过去十年中,深度学习与词嵌入在信息检索(IR)领域产生了深远影响,推动了基于神经网络和语言模型的技术发展。与此同时,神经信息检索(Neural IR)和对话式搜索等特定检索模式也逐渐流行起来。本书由国际学术界与工业界的专家撰写,通过深入探讨这些新兴方法与技术,全面更新了该领域的研究现状。全书分为三个部分:基础、适应与关注点,以及垂直领域。
在基础篇中,我们探讨构成现代信息检索系统基本结构的核心主题,包括推荐系统。这些新技术的开发旨在增强索引、检索与排序能力。本部分内容涵盖神经信息检索、推荐系统、评估方法、查询驱动功能与知识图谱等。
信息检索系统需要能够适应用户的特定特征与偏好,而几年前还被认为过于小众的技术,如今已成为系统设计的重要考量。适应与关注点篇讨论以下主题:对话式搜索、跨语言检索、时间信息抽取与检索、检索系统中的偏见问题,以及搜索过程中的隐私保护。
尽管网络搜索引擎仍是最常见的信息获取途径,但在某些情况下,特定的垂直领域在内容和相关性方面能提供更优质的体验。本书在此部分介绍了多个典型应用场景,包括电子商务、专业搜索、个人收藏、音乐检索与生物医学等。