论文概述:尽管向量检索(Dense Retrieval)已经取得了不错的排序性能,之前的相关研究通常采用暴力搜索。在实际的网页搜索场景中,暴力搜索会带来大量存储和时间开销,因此几乎是无法接受的。为了解决这样的问题,我们提出JPQ。JPQ使用乘积量化(Product Quantization)来压缩存储并提升检索速度。为了保证检索性能不因为量化而损失,JPQ端到端地联合优化查询编码器和乘积量化的参数。我们在两个公开的大规模检索数据集上评测JPQ。实验结果表明,在不同设置下,JPQ都显著优于现有的向量压缩方法。与之前使用暴力搜索的向量检索模型相比,JPQ几乎不会影响排序性能,并且把索引大小压缩了30倍,提高了10倍的CPU检索速度和2倍的GPU检索速度。

https://www.zhuanzhi.ai/paper/51bd03ce5ed783b843f6c5077dd28527

成为VIP会员查看完整内容
8

相关内容

专知会员服务
8+阅读 · 2021年9月22日
专知会员服务
16+阅读 · 2021年9月18日
专知会员服务
15+阅读 · 2021年8月13日
专知会员服务
6+阅读 · 2021年8月7日
专知会员服务
26+阅读 · 2021年4月22日
专知会员服务
11+阅读 · 2021年3月25日
【知乎】超越Lexical:用于文本搜索引擎的语义检索框架
专知会员服务
21+阅读 · 2020年8月28日
【SIGIR2021】使用难样本优化向量检索模型
专知
4+阅读 · 2021年4月22日
基于二进制哈希编码快速学习的快速图像检索
炼数成金订阅号
8+阅读 · 2018年5月17日
优化哈希策略
ImportNew
5+阅读 · 2018年1月17日
用线性规划去计算句子之间的相似度
AI研习社
9+阅读 · 2017年12月27日
Identity-aware Graph Neural Networks
Arxiv
14+阅读 · 2021年1月25日
Arxiv
7+阅读 · 2018年1月10日
VIP会员
相关VIP内容
专知会员服务
8+阅读 · 2021年9月22日
专知会员服务
16+阅读 · 2021年9月18日
专知会员服务
15+阅读 · 2021年8月13日
专知会员服务
6+阅读 · 2021年8月7日
专知会员服务
26+阅读 · 2021年4月22日
专知会员服务
11+阅读 · 2021年3月25日
【知乎】超越Lexical:用于文本搜索引擎的语义检索框架
专知会员服务
21+阅读 · 2020年8月28日
微信扫码咨询专知VIP会员