Filter data structures over-approximate a set of hashable keys, i.e. set membership queries may incorrectly come out positive. A filter with false positive rate $f \in (0,1]$ is known to require $\ge \log_2(1/f)$ bits per key. At least for larger $f \ge 2^{-4}$, existing practical filters require a space overhead of at least 20% with respect to this information-theoretic bound. We introduce the Ribbon filter: a new filter for static sets with a broad range of configurable space overheads and false positive rates with competitive speed over that range, especially for larger $f \ge 2^{-7}$. In many cases, Ribbon is faster than existing filters for the same space overhead, or can achieve space overhead below 10% with some additional CPU time. An experimental Ribbon design with load balancing can even achieve space overheads below 1%. A Ribbon filter resembles an Xor filter modified to maximize locality and is constructed by solving a band-like linear system over Boolean variables. In previous work, Dietzfelbinger and Walzer describe this linear system and an efficient Gaussian solver. We present and analyze a faster, more adaptable solving process we call "Rapid Incremental Boolean Banding ON the fly," which resembles hash table construction. We also present and analyze an attractive Ribbon variant based on making the linear system homogeneous, and describe several more practical enhancements.


翻译:超过一套散列密钥的过滤器数据结构, 即设定会籍询问可能错误地显示为正 。 已知一个错误正率的过滤器, 每按键需要$\ge\log_ 2( 1/ f) 美元。 至少对于更大的 $\ ge 2 ⁇ -4} 美元, 现有的实用过滤器需要至少20%的空间管理费, 与这个信息- 理论约束有关的负负比值。 我们引入了ribbon 过滤器: 用于静态装置的新过滤器, 其可配置空间管理器的范围很广, 以及具有竞争性速度的虚假正率, 特别是对于更大的 $f\ ge 2 ⁇ 7} 。 在许多情况下, Ribbon 的过滤器比现有的空间管理器要快得多, 或者可以达到10%以下的空间管理器。 ribon 过滤器类似于一个基于最大程度可配置空间管理器的自动过滤器, 并且通过在Boolean 系统上找到一个类似条式的线性系统, 。 在以往的工作、 底色分析系统上, 我们描述一个更快速的系统, 和直线性分析系统, 正在描述一个更快速的系统, 一种高效的系统, 我们的系统, 正在描述一个更快速的平流式分析系统, 正在使用一个更快速的计算, 。

0
下载
关闭预览

相关内容

如何构建你的推荐系统?这份21页ppt教程为你讲解
专知会员服务
65+阅读 · 2021年2月12日
神经常微分方程教程,50页ppt,A brief tutorial on Neural ODEs
专知会员服务
74+阅读 · 2020年8月2日
Linux导论,Introduction to Linux,96页ppt
专知会员服务
82+阅读 · 2020年7月26日
Hierarchically Structured Meta-learning
CreateAMind
27+阅读 · 2019年5月22日
Transferring Knowledge across Learning Processes
CreateAMind
29+阅读 · 2019年5月18日
Unsupervised Learning via Meta-Learning
CreateAMind
43+阅读 · 2019年1月3日
Ray RLlib: Scalable 降龙十八掌
CreateAMind
9+阅读 · 2018年12月28日
Auto-Encoding GAN
CreateAMind
7+阅读 · 2017年8月4日
Arxiv
0+阅读 · 2021年4月28日
VIP会员
相关VIP内容
相关资讯
Hierarchically Structured Meta-learning
CreateAMind
27+阅读 · 2019年5月22日
Transferring Knowledge across Learning Processes
CreateAMind
29+阅读 · 2019年5月18日
Unsupervised Learning via Meta-Learning
CreateAMind
43+阅读 · 2019年1月3日
Ray RLlib: Scalable 降龙十八掌
CreateAMind
9+阅读 · 2018年12月28日
Auto-Encoding GAN
CreateAMind
7+阅读 · 2017年8月4日
Top
微信扫码咨询专知VIP会员