概率排序原则(Probability Ranking Principle, PRP)是排序的基本原则,它假定每个文档都有一个独特的、独立的概率来满足特定的信息需求。以往,传统的启发式特征和众所周知的学习排序方法都是按照PRP原则设计的。此外,最近的深度学习增强排名模型,也称为“深度文本匹配”,也遵循PRP原则。然而,PRP并不是最优的排序方法,因为在许多最近的排序任务中,如伪相关性反馈、交互式信息检索等,每个文档都不是独立的。为了解决这一问题,排序模型的一个新趋势是对文档之间的依赖关系进行建模。
在本教程中,我们旨在对排名模型超越PRP原则的最新进展进行全面的调研。我们的教程提供一种视角,因为我们试图根据它们的内在假设进行分类,并将标准问题形式化。这样,我们期待着研究者们对这一领域的关注,从而使信息检索技术有一个长足的进步。本教程主要由三部分组成。首先,我们介绍了排序问题和众所周知的概率排序原理。其次,我们提出了PRP原则下的传统方法。最后,我们说明了PRP原则的局限性,并介绍了以顺序方式和全局方式对文档之间的依赖关系建模的最新工作。