生成检索通过使用序列到序列的架构,以端到端的方式生成相关文档的标识符来响应给定查询。生成检索与其他检索方法,尤其是基于密集检索模型中的匹配方法之间的关系,尚未完全理解。先前的工作表明,使用原子标识符的生成检索等同于单向量密集检索。因此,当使用层次化语义标识符时,生成检索展示出类似于在密集检索的树索引中进行层次化搜索的行为。然而,之前的研究仅关注检索阶段,没有考虑生成检索解码器中的深层交互。 在本文中,我们通过展示生成检索和多向量密集检索共享相同的框架来衡量文档对查询的相关性来填补这一空白。具体来说,我们检查了生成检索的注意力层和预测头,揭示了生成检索可以被理解为多向量密集检索的一个特例。这两种方法都将相关性计算为查询和文档向量及其对齐矩阵的乘积之和。然后,我们探讨了生成检索如何应用这一框架,采用不同的策略来计算文档令牌向量和对齐矩阵。我们进行了实验来验证我们的结论,并显示这两种范式在其对齐矩阵中展示了术语匹配的共性。 我们的发现适用于许多生成检索标识符设计,并提供了关于生成检索如何表达查询-文档相关性的可能解释。由于多向量密集检索是当前最先进的密集检索方法,理解生成检索与多向量密集检索之间的联系对于揭示生成检索的底层机制以及开发和理解新检索模型的潜力至关重要。

成为VIP会员查看完整内容
21

相关内容

【NeurIPS2023】半监督端到端对比学习用于时间序列分类
专知会员服务
34+阅读 · 2023年10月17日
【ICCV2023】保留模态结构改进多模态学习
专知会员服务
28+阅读 · 2023年8月28日
【AAAI2023】少样本无监督域适应中的高层语义特征
专知会员服务
15+阅读 · 2023年1月8日
【CIKM2022】基于双向Transformers对比学习的序列推荐
专知会员服务
20+阅读 · 2022年8月10日
【NAACL2022】自然语言处理的对比数据与学习
专知会员服务
45+阅读 · 2022年7月10日
专知会员服务
15+阅读 · 2021年8月13日
专知会员服务
15+阅读 · 2021年8月10日
专知会员服务
43+阅读 · 2021年7月6日
【CVPR2021】跨模态检索的概率嵌入
专知会员服务
19+阅读 · 2021年3月2日
专知会员服务
20+阅读 · 2020年9月11日
【ICML2021】因果匹配领域泛化
专知
12+阅读 · 2021年8月12日
【CVPR2021】跨模态检索的概率嵌入
专知
17+阅读 · 2021年3月2日
CNN 反向传播算法推导
统计学习与视觉计算组
30+阅读 · 2017年12月29日
国家自然科学基金
11+阅读 · 2017年12月31日
国家自然科学基金
0+阅读 · 2015年12月31日
国家自然科学基金
0+阅读 · 2015年12月31日
国家自然科学基金
1+阅读 · 2015年12月31日
国家自然科学基金
1+阅读 · 2015年12月31日
国家自然科学基金
4+阅读 · 2015年12月31日
国家自然科学基金
3+阅读 · 2015年12月31日
国家自然科学基金
4+阅读 · 2014年12月31日
国家自然科学基金
3+阅读 · 2014年12月31日
国家自然科学基金
9+阅读 · 2014年12月31日
A Survey of Large Language Models
Arxiv
398+阅读 · 2023年3月31日
Arxiv
68+阅读 · 2022年9月7日
Arxiv
18+阅读 · 2021年3月16日
A survey on deep hashing for image retrieval
Arxiv
14+阅读 · 2020年6月10日
Augmentation for small object detection
Arxiv
11+阅读 · 2019年2月19日
Arxiv
10+阅读 · 2018年3月22日
Arxiv
26+阅读 · 2018年2月27日
VIP会员
相关VIP内容
【NeurIPS2023】半监督端到端对比学习用于时间序列分类
专知会员服务
34+阅读 · 2023年10月17日
【ICCV2023】保留模态结构改进多模态学习
专知会员服务
28+阅读 · 2023年8月28日
【AAAI2023】少样本无监督域适应中的高层语义特征
专知会员服务
15+阅读 · 2023年1月8日
【CIKM2022】基于双向Transformers对比学习的序列推荐
专知会员服务
20+阅读 · 2022年8月10日
【NAACL2022】自然语言处理的对比数据与学习
专知会员服务
45+阅读 · 2022年7月10日
专知会员服务
15+阅读 · 2021年8月13日
专知会员服务
15+阅读 · 2021年8月10日
专知会员服务
43+阅读 · 2021年7月6日
【CVPR2021】跨模态检索的概率嵌入
专知会员服务
19+阅读 · 2021年3月2日
专知会员服务
20+阅读 · 2020年9月11日
相关基金
国家自然科学基金
11+阅读 · 2017年12月31日
国家自然科学基金
0+阅读 · 2015年12月31日
国家自然科学基金
0+阅读 · 2015年12月31日
国家自然科学基金
1+阅读 · 2015年12月31日
国家自然科学基金
1+阅读 · 2015年12月31日
国家自然科学基金
4+阅读 · 2015年12月31日
国家自然科学基金
3+阅读 · 2015年12月31日
国家自然科学基金
4+阅读 · 2014年12月31日
国家自然科学基金
3+阅读 · 2014年12月31日
国家自然科学基金
9+阅读 · 2014年12月31日
相关论文
A Survey of Large Language Models
Arxiv
398+阅读 · 2023年3月31日
Arxiv
68+阅读 · 2022年9月7日
Arxiv
18+阅读 · 2021年3月16日
A survey on deep hashing for image retrieval
Arxiv
14+阅读 · 2020年6月10日
Augmentation for small object detection
Arxiv
11+阅读 · 2019年2月19日
Arxiv
10+阅读 · 2018年3月22日
Arxiv
26+阅读 · 2018年2月27日
微信扫码咨询专知VIP会员