【CIKM2021】联合优化查询编码器和乘积量化提高检索性能 - 专知VIP

会员服务 ·

1

向量检索 · CIKM 2021 ·

2021 年 9 月 16 日

【CIKM2021】联合优化查询编码器和乘积量化提高检索性能

专知会员服务

专知，提供专业可信的知识分发服务，让认知协作更快更好！

论文概述：尽管向量检索（Dense Retrieval）已经取得了不错的排序性能，之前的相关研究通常采用暴力搜索。在实际的网页搜索场景中，暴力搜索会带来大量存储和时间开销，因此几乎是无法接受的。为了解决这样的问题，我们提出JPQ。JPQ使用乘积量化（Product Quantization）来压缩存储并提升检索速度。为了保证检索性能不因为量化而损失，JPQ端到端地联合优化查询编码器和乘积量化的参数。我们在两个公开的大规模检索数据集上评测JPQ。实验结果表明，在不同设置下，JPQ都显著优于现有的向量压缩方法。与之前使用暴力搜索的向量检索模型相比，JPQ几乎不会影响排序性能，并且把索引大小压缩了30倍，提高了10倍的CPU检索速度和2倍的GPU检索速度。

https://www.zhuanzhi.ai/paper/51bd03ce5ed783b843f6c5077dd28527

成为VIP会员查看完整内容

9

相关内容

向量检索

中科院计算所发布首篇「面向第一阶段检索的语义检索模型」综述论文，43页pdf242篇文献

中科院计算所发布首篇「面向第一阶段检索的语义检索模型」综述论文，43页pdf242篇文献

专知会员服务

25+阅读 · 2021年10月3日

【CIKM2021】基于等价共享内存的神经会话生成模型

专知会员服务

9+阅读 · 2021年9月22日

【CIKM2021】基于整合用户序列的搜索与推荐

专知会员服务

17+阅读 · 2021年9月18日

【KDD2021】检索交互机的表格数据预测

专知会员服务

16+阅读 · 2021年8月13日

【ACL2021】为密集检索生成伪查询嵌入来改进文档表示

专知会员服务

7+阅读 · 2021年8月7日

【KDD2021】基于神经结构搜索的任务无关与自适应BERT压缩

专知会员服务

9+阅读 · 2021年6月5日

【SIGIR2021】使用难样本优化向量检索模型

专知会员服务

27+阅读 · 2021年4月22日

【CVPR2021】神经结构搜索的相对论性评价

专知会员服务

12+阅读 · 2021年3月25日

【知乎】超越Lexical:用于文本搜索引擎的语义检索框架

【知乎】超越Lexical:用于文本搜索引擎的语义检索框架

专知会员服务

22+阅读 · 2020年8月28日

【Google AI新论文】REALM:检索增强语言模型预训练，QA的SOTA提升4-16%准确性

【Google AI新论文】REALM:检索增强语言模型预训练，QA的SOTA提升4-16%准确性

专知会员服务

45+阅读 · 2020年2月12日

【SIGIR2021】使用难样本优化向量检索模型

【SIGIR2021】使用难样本优化向量检索模型

专知

4+阅读 · 2021年4月22日

【NeurIPS 2020】通过双向传播的可扩展图神经网络

【NeurIPS 2020】通过双向传播的可扩展图神经网络

专知

12+阅读 · 2020年11月3日

【知乎】超越Lexical:用于文本搜索引擎的语义检索框架

【知乎】超越Lexical:用于文本搜索引擎的语义检索框架

专知

9+阅读 · 2020年8月28日

Sentence-BERT: 一种能快速计算句子相似度的孪生网络

Sentence-BERT: 一种能快速计算句子相似度的孪生网络

AINLP

5+阅读 · 2020年5月27日

【SIGIR2020-斯坦福大学】一种新的BERT类信息检索模型-又好又快的ColBERT

【SIGIR2020-斯坦福大学】一种新的BERT类信息检索模型-又好又快的ColBERT

专知

15+阅读 · 2020年4月28日

【CVPR2020】L2 ^GCN：图卷积网络的分层学习高效训练

【CVPR2020】L2 ^GCN：图卷积网络的分层学习高效训练

专知

12+阅读 · 2020年3月31日

ICLR 2018 | CMU&谷歌大脑提出新型问答模型QANet：仅使用卷积和自注意力，性能大大优于RNN

ICLR 2018 | CMU&谷歌大脑提出新型问答模型QANet：仅使用卷积和自注意力，性能大大优于RNN

机器之心

5+阅读 · 2018年5月21日

基于二进制哈希编码快速学习的快速图像检索

基于二进制哈希编码快速学习的快速图像检索

炼数成金订阅号

8+阅读 · 2018年5月17日

优化哈希策略

优化哈希策略

ImportNew

5+阅读 · 2018年1月17日

用线性规划去计算句子之间的相似度

用线性规划去计算句子之间的相似度

AI研习社

9+阅读 · 2017年12月27日

Jointly Optimizing Query Encoder and Product Quantization to Improve Retrieval Performance

Arxiv

6+阅读 · 2021年8月2日

Relative Positional Encoding for Transformers with Linear Complexity

Arxiv

8+阅读 · 2021年5月18日

Identity-aware Graph Neural Networks

Identity-aware Graph Neural Networks

Arxiv

14+阅读 · 2021年1月25日

PROP: Pre-training with Representative Words Prediction for Ad-hoc Retrieval

Arxiv

11+阅读 · 2020年10月20日

Entity-aware ELMo: Learning Contextual Entity Representation for Entity Disambiguation

Arxiv

3+阅读 · 2019年8月22日

Scalable Attentive Sentence-Pair Modeling via Distilled Sentence Embedding

Arxiv

3+阅读 · 2019年8月14日

A Context-Aware Citation Recommendation Model with BERT and Graph Convolutional Networks

A Context-Aware Citation Recommendation Model with BERT and Graph Convolutional Networks

Arxiv

9+阅读 · 2019年3月15日

ShuffleNet V2: Practical Guidelines for Efficient CNN Architecture Design

ShuffleNet V2: Practical Guidelines for Efficient CNN Architecture Design

Arxiv

4+阅读 · 2018年7月30日

Phrase-Indexed Question Answering: A New Challenge for Scalable Document Comprehension

Arxiv

3+阅读 · 2018年4月20日

Adaptive Graph Convolutional Neural Networks

Arxiv

7+阅读 · 2018年1月10日

VIP会员

相关主题

相关VIP内容

中科院计算所发布首篇「面向第一阶段检索的语义检索模型」综述论文，43页pdf242篇文献

中科院计算所发布首篇「面向第一阶段检索的语义检索模型」综述论文，43页pdf242篇文献

专知会员服务

25+阅读 · 2021年10月3日

【CIKM2021】基于等价共享内存的神经会话生成模型

专知会员服务

9+阅读 · 2021年9月22日

【CIKM2021】基于整合用户序列的搜索与推荐

专知会员服务

17+阅读 · 2021年9月18日

【KDD2021】检索交互机的表格数据预测

专知会员服务

16+阅读 · 2021年8月13日

【ACL2021】为密集检索生成伪查询嵌入来改进文档表示

专知会员服务

7+阅读 · 2021年8月7日

【KDD2021】基于神经结构搜索的任务无关与自适应BERT压缩

专知会员服务

9+阅读 · 2021年6月5日

【SIGIR2021】使用难样本优化向量检索模型

专知会员服务

27+阅读 · 2021年4月22日

【CVPR2021】神经结构搜索的相对论性评价

专知会员服务

12+阅读 · 2021年3月25日

【知乎】超越Lexical:用于文本搜索引擎的语义检索框架

【知乎】超越Lexical:用于文本搜索引擎的语义检索框架

专知会员服务

22+阅读 · 2020年8月28日

【Google AI新论文】REALM:检索增强语言模型预训练，QA的SOTA提升4-16%准确性

【Google AI新论文】REALM:检索增强语言模型预训练，QA的SOTA提升4-16%准确性

专知会员服务

45+阅读 · 2020年2月12日

热门VIP内容

开通专知VIP会员享更多权益服务

《步兵小单元山地严寒作战指南》美军最新条令200页

《联合作战概念的发展》最新报告

俄制无人机弹药

《复杂场景下自主着陆的模型预测控制技术》92页

相关资讯

【SIGIR2021】使用难样本优化向量检索模型

【SIGIR2021】使用难样本优化向量检索模型

专知

4+阅读 · 2021年4月22日

【NeurIPS 2020】通过双向传播的可扩展图神经网络

【NeurIPS 2020】通过双向传播的可扩展图神经网络

专知

12+阅读 · 2020年11月3日

【知乎】超越Lexical:用于文本搜索引擎的语义检索框架

【知乎】超越Lexical:用于文本搜索引擎的语义检索框架

专知

9+阅读 · 2020年8月28日

Sentence-BERT: 一种能快速计算句子相似度的孪生网络

Sentence-BERT: 一种能快速计算句子相似度的孪生网络

AINLP

5+阅读 · 2020年5月27日

【SIGIR2020-斯坦福大学】一种新的BERT类信息检索模型-又好又快的ColBERT

【SIGIR2020-斯坦福大学】一种新的BERT类信息检索模型-又好又快的ColBERT

专知

15+阅读 · 2020年4月28日

【CVPR2020】L2 ^GCN：图卷积网络的分层学习高效训练

【CVPR2020】L2 ^GCN：图卷积网络的分层学习高效训练

专知

12+阅读 · 2020年3月31日

ICLR 2018 | CMU&谷歌大脑提出新型问答模型QANet：仅使用卷积和自注意力，性能大大优于RNN

ICLR 2018 | CMU&谷歌大脑提出新型问答模型QANet：仅使用卷积和自注意力，性能大大优于RNN

机器之心

5+阅读 · 2018年5月21日

基于二进制哈希编码快速学习的快速图像检索

基于二进制哈希编码快速学习的快速图像检索

炼数成金订阅号

8+阅读 · 2018年5月17日

优化哈希策略

优化哈希策略

ImportNew

5+阅读 · 2018年1月17日

用线性规划去计算句子之间的相似度

用线性规划去计算句子之间的相似度

AI研习社

9+阅读 · 2017年12月27日

相关论文

Jointly Optimizing Query Encoder and Product Quantization to Improve Retrieval Performance

Arxiv

6+阅读 · 2021年8月2日

Relative Positional Encoding for Transformers with Linear Complexity

Arxiv

8+阅读 · 2021年5月18日

Identity-aware Graph Neural Networks

Identity-aware Graph Neural Networks

Arxiv

14+阅读 · 2021年1月25日

PROP: Pre-training with Representative Words Prediction for Ad-hoc Retrieval

Arxiv

11+阅读 · 2020年10月20日

Entity-aware ELMo: Learning Contextual Entity Representation for Entity Disambiguation

Arxiv

3+阅读 · 2019年8月22日

Scalable Attentive Sentence-Pair Modeling via Distilled Sentence Embedding

Arxiv

3+阅读 · 2019年8月14日

A Context-Aware Citation Recommendation Model with BERT and Graph Convolutional Networks

A Context-Aware Citation Recommendation Model with BERT and Graph Convolutional Networks

Arxiv

9+阅读 · 2019年3月15日

ShuffleNet V2: Practical Guidelines for Efficient CNN Architecture Design

ShuffleNet V2: Practical Guidelines for Efficient CNN Architecture Design

Arxiv

4+阅读 · 2018年7月30日

Phrase-Indexed Question Answering: A New Challenge for Scalable Document Comprehension

Arxiv

3+阅读 · 2018年4月20日

Adaptive Graph Convolutional Neural Networks

Arxiv

7+阅读 · 2018年1月10日

微信扫码咨询专知VIP会员