查询理解是信息检索中的一个基本问题,在过去的几十年里一直受到人们的关注。为了理解用户的搜索查询,人们提出了许多不同的任务,例如查询分类或查询聚类。然而,在意图类/集群级别上理解搜索查询并不那么精确,因为会丢失许多详细信息。正如我们在许多基准数据集(例如TREC和SemEval)中发现的那样,查询通常与人类注释者提供的详细描述相关联,这些描述清楚地描述了查询的意图,以帮助评估文档的相关性。如果一个系统能够为搜索查询自动生成详细而精确的意图描述,就像人类注释器一样,这将表明更好的查询理解已经实现。因此,在本文中,我们提出了一种新的查询到意图描述(Q2ID)任务来进行查询理解。与那些利用查询及其描述来计算文档相关性的现有排序任务不同,Q2ID是一个反向任务,旨在基于给定查询的相关和不相关文档生成自然语言意图描述。为了解决这一问题,我们提出了一种新的对比生成模型,即CtrsGen(简称CtrsGen),该模型通过对比给定查询的相关文档和不相关文档来生成意图描述。我们通过与几种最先进的生成模型在Q2ID任务上的比较,证明了我们的模型的有效性。我们将通过一个示例应用程序讨论这种Q2ID技术的潜在用法。
https://www.zhuanzhi.ai/paper/d34ba15f09003b2b2c17a7a415b8b026