【SIGIR2024】生成检索作即多向量密集检索 - 专知VIP

会员服务 ·

13

SIGIR 2024 · 生成检索 · 多向量密集检索 ·

2024 年 4 月 5 日

【SIGIR2024】生成检索作即多向量密集检索

专知会员服务

专知，提供专业可信的知识分发服务，让认知协作更快更好！

生成检索通过使用序列到序列的架构，以端到端的方式生成相关文档的标识符来响应给定查询。生成检索与其他检索方法，尤其是基于密集检索模型中的匹配方法之间的关系，尚未完全理解。先前的工作表明，使用原子标识符的生成检索等同于单向量密集检索。因此，当使用层次化语义标识符时，生成检索展示出类似于在密集检索的树索引中进行层次化搜索的行为。然而，之前的研究仅关注检索阶段，没有考虑生成检索解码器中的深层交互。在本文中，我们通过展示生成检索和多向量密集检索共享相同的框架来衡量文档对查询的相关性来填补这一空白。具体来说，我们检查了生成检索的注意力层和预测头，揭示了生成检索可以被理解为多向量密集检索的一个特例。这两种方法都将相关性计算为查询和文档向量及其对齐矩阵的乘积之和。然后，我们探讨了生成检索如何应用这一框架，采用不同的策略来计算文档令牌向量和对齐矩阵。我们进行了实验来验证我们的结论，并显示这两种范式在其对齐矩阵中展示了术语匹配的共性。我们的发现适用于许多生成检索标识符设计，并提供了关于生成检索如何表达查询-文档相关性的可能解释。由于多向量密集检索是当前最先进的密集检索方法，理解生成检索与多向量密集检索之间的联系对于揭示生成检索的底层机制以及开发和理解新检索模型的潜力至关重要。

成为VIP会员查看完整内容

23

相关内容

SIGIR 2024

【ICCV2023】保留模态结构改进多模态学习

【ICCV2023】保留模态结构改进多模态学习

专知会员服务

31+阅读 · 2023年8月28日

【KDD2021】使用Wasserstein距离鉴别器的无监督图对齐

专知会员服务

16+阅读 · 2021年8月10日

【KDD2021】基于知识图谱的神经回答逻辑查询

专知会员服务

44+阅读 · 2021年7月6日

【CVPR2021】跨模态检索的概率嵌入

【CVPR2021】跨模态检索的概率嵌入

专知会员服务

20+阅读 · 2021年3月2日

【CIKM2020】通过意图描述生成进行查询理解

专知会员服务

21+阅读 · 2020年9月11日

【ICML2021】因果匹配领域泛化

【ICML2021】因果匹配领域泛化

专知

12+阅读 · 2021年8月12日

【CVPR2021】跨模态检索的概率嵌入

【CVPR2021】跨模态检索的概率嵌入

专知

17+阅读 · 2021年3月2日

【AAAI2021】知识图谱增强的预训练模型的生成式常识推理

【AAAI2021】知识图谱增强的预训练模型的生成式常识推理

专知

29+阅读 · 2021年1月25日

【阿里巴巴-WWW2020】对抗性多模态表示学习的点击率预测，Adversarial Multimodal RL

【阿里巴巴-WWW2020】对抗性多模态表示学习的点击率预测，Adversarial Multimodal RL

专知

11+阅读 · 2020年3月17日

CNN 反向传播算法推导

CNN 反向传播算法推导

统计学习与视觉计算组

30+阅读 · 2017年12月29日

基于上下文精化的并发对象活性的描述及验证

国家自然科学基金

1+阅读 · 2015年12月31日

基于径向基函数无网格离散的快速多水平算法

国家自然科学基金

0+阅读 · 2015年12月31日

半参数回归模型中随机误差分布的检验问题

国家自然科学基金

2+阅读 · 2015年12月31日

基于最大相关熵准则的支持向量机模型与算法研究

国家自然科学基金

3+阅读 · 2015年12月31日

高维复杂结构数据降维

国家自然科学基金

10+阅读 · 2014年12月31日

A Comprehensive Survey on Deep Graph Representation Learning

Arxiv

107+阅读 · 2023年4月11日

A Survey of Large Language Models

A Survey of Large Language Models

Arxiv

494+阅读 · 2023年3月31日

Geometric multimodal representation learning

Arxiv

69+阅读 · 2022年9月7日

A survey on deep hashing for image retrieval

A survey on deep hashing for image retrieval

Arxiv

15+阅读 · 2020年6月10日

Augmentation for small object detection

Augmentation for small object detection

Arxiv

13+阅读 · 2019年2月19日

VIP会员

相关主题

多向量密集检索

相关VIP内容

【ICCV2023】保留模态结构改进多模态学习

【ICCV2023】保留模态结构改进多模态学习

专知会员服务

31+阅读 · 2023年8月28日

【KDD2021】使用Wasserstein距离鉴别器的无监督图对齐

专知会员服务

16+阅读 · 2021年8月10日

【KDD2021】基于知识图谱的神经回答逻辑查询

专知会员服务

44+阅读 · 2021年7月6日

【CVPR2021】跨模态检索的概率嵌入

【CVPR2021】跨模态检索的概率嵌入

专知会员服务

20+阅读 · 2021年3月2日

【CIKM2020】通过意图描述生成进行查询理解

专知会员服务

21+阅读 · 2020年9月11日

热门VIP内容

开通专知VIP会员享更多权益服务

《利用人工智能对军事行动进行建模》

《利用人工智能学习、优化与推演美国海军作战部队的战略布局与分散（续文）》

机器人、无人机与实时影像：应对城市爆炸威胁的三大技术方案

《指挥官意图消息中关键概念自动提取》最新47页

相关资讯

【ICML2021】因果匹配领域泛化

【ICML2021】因果匹配领域泛化

专知

12+阅读 · 2021年8月12日

【CVPR2021】跨模态检索的概率嵌入

【CVPR2021】跨模态检索的概率嵌入

专知

17+阅读 · 2021年3月2日

【AAAI2021】知识图谱增强的预训练模型的生成式常识推理

【AAAI2021】知识图谱增强的预训练模型的生成式常识推理

专知

29+阅读 · 2021年1月25日

【阿里巴巴-WWW2020】对抗性多模态表示学习的点击率预测，Adversarial Multimodal RL

【阿里巴巴-WWW2020】对抗性多模态表示学习的点击率预测，Adversarial Multimodal RL

专知

11+阅读 · 2020年3月17日

CNN 反向传播算法推导

CNN 反向传播算法推导

统计学习与视觉计算组

30+阅读 · 2017年12月29日

相关基金

基于上下文精化的并发对象活性的描述及验证

国家自然科学基金

1+阅读 · 2015年12月31日

基于径向基函数无网格离散的快速多水平算法

国家自然科学基金

0+阅读 · 2015年12月31日

半参数回归模型中随机误差分布的检验问题

国家自然科学基金

2+阅读 · 2015年12月31日

基于最大相关熵准则的支持向量机模型与算法研究

国家自然科学基金

3+阅读 · 2015年12月31日

高维复杂结构数据降维

国家自然科学基金

10+阅读 · 2014年12月31日

相关论文

A Comprehensive Survey on Deep Graph Representation Learning

Arxiv

107+阅读 · 2023年4月11日

A Survey of Large Language Models

A Survey of Large Language Models

Arxiv

494+阅读 · 2023年3月31日

Geometric multimodal representation learning

Arxiv

69+阅读 · 2022年9月7日

A survey on deep hashing for image retrieval

A survey on deep hashing for image retrieval

Arxiv

15+阅读 · 2020年6月10日

Augmentation for small object detection

Augmentation for small object detection

Arxiv

13+阅读 · 2019年2月19日

微信扫码咨询专知VIP会员