在文本信息检索停滞多年之后,经过训练的transformer网络在性能上有了很大的提升,从而得到了非常好的搜索结果。然而,到目前为止,这些方法需要大量的训练数据,而这些数据对于许多用例来说很少可用。在这次演讲中,我将从不同的神经搜索方法的概述开始。然后,我将介绍BEIR,这是一个在域外设置中测试神经搜索方法的基准测试。正如基准测试所揭示的那样,许多体系结构对领域迁移很敏感,这限制了它们对许多实际单词应用的用处。为了克服这一缺点,我们创建了生成式伪标记(GPL),这是一种将知识从缓慢但稳健的架构转移到快速但领域敏感的方法,从而大大提高了搜索质量。