【NeurIPS2021】上亿量级规模高效向量近似最近邻搜索系统 SPANN - 专知VIP

会员服务 ·

1

NeurIPS 2021 · 最近邻搜索 · 论文 ·

2021 年 11 月 17 日

【NeurIPS2021】上亿量级规模高效向量近似最近邻搜索系统 SPANN

专知会员服务

专知，提供专业可信的知识分发服务，让认知协作更快更好！

SPANN: Highly-efficient Billion-scale Approximate Nearest Neighbor Search

论文摘要：随着数据规模的快速增长，基于内存的向量搜索面临着海量且非常昂贵的内存需求，人们对小内存-大硬盘混合型向量近似最近邻搜索的需求也越来越迫切。因此，研究员们提出了一种非常简单且高效的基于倒排索引思想的内存-硬盘混合型索引和搜索方案 SPANN，有效地解决了倒排索引方法中的三个会导致高延迟或者低召回的难题。实验结果显示，SPANN 在多个上亿量级数据集上都能取得两倍多的加速达到 90% 召回率，其查询延迟能够有效地控制在一毫秒左右。同时， SPANN 的设计能够有效地被扩展到分布式搜索中限制每个查询的资源开销和延迟大小，从而实现高可扩展性。目前 SPANN 已经被部署在了微软必应搜索中支持百亿量级的高性能向量近似最近邻搜索。

https://arxiv.org/abs/2111.08566

成为VIP会员查看完整内容

11

相关内容

NeurIPS 2021

【清华大学陈游旻博士论文】持久性内存存储系统关键技术研究

【清华大学陈游旻博士论文】持久性内存存储系统关键技术研究

专知会员服务

29+阅读 · 2021年11月24日

【WSDM2022】基于约束聚类学习离散表示的高效密集检索

【WSDM2022】基于约束聚类学习离散表示的高效密集检索

专知会员服务

27+阅读 · 2021年11月16日

【KDD2021-腾讯】Apache Spark大规模网络嵌入

专知会员服务

23+阅读 · 2021年6月23日

【ICML2021】基于低秩重参数化的大规模私有学习

专知会员服务

12+阅读 · 2021年6月20日

【MIT】约束最小-最大优化的复杂性，84页pdf

专知会员服务

44+阅读 · 2020年9月25日

ICCV 2019 | 四小时搜索NN结构，厦大提出快速NAS检索方法

ICCV 2019 | 四小时搜索NN结构，厦大提出快速NAS检索方法

极市平台

8+阅读 · 2019年9月7日

携程用ClickHouse轻松玩转每天十亿级数据更新

携程用ClickHouse轻松玩转每天十亿级数据更新

DBAplus社群

11+阅读 · 2019年8月6日

ICML 2019 | 第四范式提出快速张量补全新方法

ICML 2019 | 第四范式提出快速张量补全新方法

PaperWeekly

4+阅读 · 2019年6月19日

Moloch - 开源大规模网络数据捕获数据分析系统

Moloch - 开源大规模网络数据捕获数据分析系统

黑客工具箱

4+阅读 · 2018年4月4日

【智能商务】海量商品查找利器—苏宁搜索系统

【智能商务】海量商品查找利器—苏宁搜索系统

产业智能官

5+阅读 · 2017年12月1日

Splitting Spanner Atoms: A Tool for Acyclic Core Spanners

Arxiv

0+阅读 · 2022年1月19日

Reliable Beam Tracking with Dynamic Beamwidth Adaptation in Terahertz (THz) Communications

Arxiv

0+阅读 · 2022年1月17日

DynaBERT: Dynamic BERT with Adaptive Width and Depth

Arxiv

8+阅读 · 2020年10月9日

Dash: Scalable Hashing on Persistent Memory

Arxiv

6+阅读 · 2020年3月16日

Fast AutoAugment

Fast AutoAugment

Arxiv

5+阅读 · 2019年5月1日

VIP会员

相关主题

最近邻搜索

相关VIP内容

【清华大学陈游旻博士论文】持久性内存存储系统关键技术研究

【清华大学陈游旻博士论文】持久性内存存储系统关键技术研究

专知会员服务

29+阅读 · 2021年11月24日

【WSDM2022】基于约束聚类学习离散表示的高效密集检索

【WSDM2022】基于约束聚类学习离散表示的高效密集检索

专知会员服务

27+阅读 · 2021年11月16日

【KDD2021-腾讯】Apache Spark大规模网络嵌入

专知会员服务

23+阅读 · 2021年6月23日

【ICML2021】基于低秩重参数化的大规模私有学习

专知会员服务

12+阅读 · 2021年6月20日

【MIT】约束最小-最大优化的复杂性，84页pdf

专知会员服务

44+阅读 · 2020年9月25日

热门VIP内容

开通专知VIP会员享更多权益服务

美海军作战管理系统：变革战场空间的二十年

《任务与武器驱动美海军舰队设计》报告

俄罗斯“沙希德”/“天竺葵”攻击无人机

《利用动态图对网络攻击进行建模与仿真：在云安全评估中的应用》90页

相关资讯

ICCV 2019 | 四小时搜索NN结构，厦大提出快速NAS检索方法

ICCV 2019 | 四小时搜索NN结构，厦大提出快速NAS检索方法

极市平台

8+阅读 · 2019年9月7日

携程用ClickHouse轻松玩转每天十亿级数据更新

携程用ClickHouse轻松玩转每天十亿级数据更新

DBAplus社群

11+阅读 · 2019年8月6日

ICML 2019 | 第四范式提出快速张量补全新方法

ICML 2019 | 第四范式提出快速张量补全新方法

PaperWeekly

4+阅读 · 2019年6月19日

Moloch - 开源大规模网络数据捕获数据分析系统

Moloch - 开源大规模网络数据捕获数据分析系统

黑客工具箱

4+阅读 · 2018年4月4日

【智能商务】海量商品查找利器—苏宁搜索系统

【智能商务】海量商品查找利器—苏宁搜索系统

产业智能官

5+阅读 · 2017年12月1日

相关论文

Splitting Spanner Atoms: A Tool for Acyclic Core Spanners

Arxiv

0+阅读 · 2022年1月19日

Reliable Beam Tracking with Dynamic Beamwidth Adaptation in Terahertz (THz) Communications

Arxiv

0+阅读 · 2022年1月17日

DynaBERT: Dynamic BERT with Adaptive Width and Depth

Arxiv

8+阅读 · 2020年10月9日

Dash: Scalable Hashing on Persistent Memory

Arxiv

6+阅读 · 2020年3月16日

Fast AutoAugment

Fast AutoAugment

Arxiv

5+阅读 · 2019年5月1日

微信扫码咨询专知VIP会员