Filters are fast, small and approximate set membership data structures. They are often used to filter out expensive accesses to a remote set S for negative queries (that is, a query x not in S). Filters have one-sided errors: on a negative query, a filter may say "present" with a tunable false-positve probability of epsilon. Correctness is traded for space: filters only use log (1/\epsilon) + O(1) bits per element. The false-positive guarantees of most filters, however, hold only for a single query. In particular, if x is a false positive of a filter, a subsequent query to x is a false positive with probability 1, not epsilon. With this in mind, recent work has introduced the notion of an adaptive filter. A filter is adaptive if each query has false positive epsilon, regardless of what queries were made in the past. This requires "fixing" false positives as they occur. Adaptive filters not only provide strong false positive guarantees in adversarial environments but also improve performance on query practical workloads by eliminating repeated false positives. Existing work on adaptive filters falls into two categories. First, there are practical filters based on cuckoo filters that attempt to fix false positives heuristically, without meeting the adaptivity guarantee. Meanwhile, the broom filter is a very complex adaptive filter that meets the optimal theoretical bounds. In this paper, we bridge this gap by designing a practical, provably adaptive filter: the telescoping adaptive filter. We provide theoretical false-positive and space guarantees of our filter, along with empirical results where we compare its false positive performance against state-of-the-art filters. We also test the throughput of our filters, showing that they achieve comparable performance to similar non-adaptive filters.


翻译:过滤器是快速、 小型和近似地设定会籍数据结构。 它们通常用来过滤过滤为负面查询( 即查询x 不在 S) 的远程 S 的昂贵访问。 过滤器有片面错误错误: 在否定的查询中, 过滤器可能说“ 存在 ”, 并有一个可调适的 Epsilon 概率。 校正为空间交易: 过滤器只使用日志( 1/\ epsilon) + O(1) 比特 。 大多数过滤器的错误和阳性保证只用于单次查询。 特别是, 如果 x 是过滤器的错误的过滤器, 则随后的调适度查询是错的, 概率为1, 而不是epslelon。 如此, 最近的工作引入了调适度过滤器的概念。 如果每次调适值为假的 Epslon, 这需要“ 固定” 假的逆差值。 然而, 适应过滤器不仅在对敌对的环境下提供强烈的适应性保证,, 也通过设计不实性判断性保证。 改进性判断性工作, 改进性保证我们的工作表现到实际的处理工作, 。, 也通过不力改进工作到 改进性工作, 改进性工作, 改进工作到 改进性工作到 工作到,, 进行不重复性,, 进行不重复性保证, 进行不重复性保证, 进行 进行 。

0
下载
关闭预览

相关内容

专知会员服务
20+阅读 · 2021年8月17日
【AAAI2021】面向交通需求预测的耦合层图卷积
专知会员服务
44+阅读 · 2021年1月31日
FlowQA: Grasping Flow in History for Conversational Machine Comprehension
专知会员服务
25+阅读 · 2019年10月18日
机器学习入门的经验与建议
专知会员服务
91+阅读 · 2019年10月10日
【SIGGRAPH2019】TensorFlow 2.0深度学习计算机图形学应用
专知会员服务
39+阅读 · 2019年10月9日
已删除
将门创投
3+阅读 · 2019年11月25日
A Technical Overview of AI & ML in 2018 & Trends for 2019
待字闺中
16+阅读 · 2018年12月24日
PRL导读-2018年120卷15期
中科院物理所
4+阅读 · 2018年4月23日
【推荐】RNN/LSTM时序预测
机器学习研究会
25+阅读 · 2017年9月8日
Arxiv
0+阅读 · 2021年9月8日
Arxiv
0+阅读 · 2021年9月6日
Arxiv
0+阅读 · 2021年9月3日
VIP会员
相关资讯
已删除
将门创投
3+阅读 · 2019年11月25日
A Technical Overview of AI & ML in 2018 & Trends for 2019
待字闺中
16+阅读 · 2018年12月24日
PRL导读-2018年120卷15期
中科院物理所
4+阅读 · 2018年4月23日
【推荐】RNN/LSTM时序预测
机器学习研究会
25+阅读 · 2017年9月8日
Top
微信扫码咨询专知VIP会员