We show that the `optimal' use of the parallel composition theorem corresponds to finding the size of the largest subset of queries that `overlap' on the data domain, a quantity we call the \emph{maximum overlap} of the queries. It has previously been shown that a certain instance of this problem, formulated in terms of determining the sensitivity of the queries, is NP-hard, but also that it is possible to use graph-theoretic algorithms, such as finding the maximum clique, to approximate query sensitivity. In this paper, we consider a significant generalization of the aforementioned instance which encompasses both a wider range of differentially private mechanisms and a broader class of queries. We show that for a particular class of predicate queries, determining if they are disjoint can be done in time polynomial in the number of attributes. For this class, we show that the maximum overlap problem remains NP-hard as a function of the number of queries. However, we show that efficient approximate solutions exist by relating maximum overlap to the clique and chromatic numbers of a certain graph determined by the queries. The link to chromatic number allows us to use more efficient approximate algorithms, which cannot be done for the clique number as it may underestimate the privacy budget. Our approach is defined in the general setting of $f$-differential privacy, which subsumes standard pure differential privacy and Gaussian differential privacy. We prove the parallel composition theorem for $f$-differential privacy. We evaluate our approach on synthetic and real-world data sets of queries. We show that the approach can scale to large domain sizes (up to $10^{20000}$), and that its application can reduce the noise added to query answers by up to 60\%.


翻译:我们显示,平行构成定理的“ 最佳” 使用平行组成定理, 与在数据域上“ 重叠” 的最大一组查询的大小相符, 我们称之为查询的最大重叠 。 以前已经显示, 在确定查询的敏感性方面, 这个问题的某个实例是NP- 硬的, 但是, 也可以使用图形- 理论算法, 如找到最大分级, 以近似查询敏感度 。 在本文中, 我们考虑对上述实例的显著概括化, 包括范围更广的 差异性私人机制以及范围更广的查询类别。 我们显示, 对于特定类别的前端查询, 确定它们是否不相干, 在属性数量上, 我们显示最大重叠问题作为查询数量的函数。 然而, 我们显示, 最高效的精确度方法, 与一个由纯度私人机制组成的直线性对某个图表的重重重重重叠 。 我们显示, 我们的直位值对数值的直径比, 我们的直径直径直值算法的直径直径直径直径直径直径直径直径直径直径直径直的算, 。

0
下载
关闭预览

相关内容

专知会员服务
25+阅读 · 2021年4月2日
强化学习最新教程,17页pdf
专知会员服务
174+阅读 · 2019年10月11日
已删除
将门创投
9+阅读 · 2019年11月15日
Transferring Knowledge across Learning Processes
CreateAMind
27+阅读 · 2019年5月18日
meta learning 17年:MAML SNAIL
CreateAMind
11+阅读 · 2019年1月2日
A Technical Overview of AI & ML in 2018 & Trends for 2019
待字闺中
16+阅读 · 2018年12月24日
【学习】Hierarchical Softmax
机器学习研究会
4+阅读 · 2017年8月6日
Arxiv
0+阅读 · 2021年11月11日
Arxiv
0+阅读 · 2021年11月10日
Arxiv
0+阅读 · 2021年11月8日
Arxiv
7+阅读 · 2020年6月29日
VIP会员
相关VIP内容
相关资讯
已删除
将门创投
9+阅读 · 2019年11月15日
Transferring Knowledge across Learning Processes
CreateAMind
27+阅读 · 2019年5月18日
meta learning 17年:MAML SNAIL
CreateAMind
11+阅读 · 2019年1月2日
A Technical Overview of AI & ML in 2018 & Trends for 2019
待字闺中
16+阅读 · 2018年12月24日
【学习】Hierarchical Softmax
机器学习研究会
4+阅读 · 2017年8月6日
Top
微信扫码咨询专知VIP会员