大模型如何做检索?WWW2024教程《生成式信息检索》附115页ppt
生成式检索(Generative Retrieval,GR)已经成为信息检索(Information Retrieval,IR)领域的一个高度活跃的研究方向,并且最近取得了显著的发展。与传统的“索引-检索-再排序”流程相比,GR范式旨在将语料库中的所有信息整合到一个单一模型中。通常情况下,训练一个序列到序列模型,以直接将查询映射到其相关的文档标识符(即docids)。本教程介绍了GR范式的核心概念,并全面概述了其基础和应用方面的最新进展。
我们首先提供了涵盖GR基础方面和问题表述的初步信息。接着,我们将重点转向docid设计、训练方法、推理策略和GR应用的最新进展。最后,我们概述了尚存的挑战并呼吁未来的GR研究。本教程旨在对有兴趣开发新型GR解决方案或在实际场景中应用GR的研究人员和行业从业者有所帮助。