We present a highly effective algorithmic approach for generating $\varepsilon$-differentially private synthetic data in a bounded metric space with near-optimal utility guarantees under the 1-Wasserstein distance. In particular, for a dataset $\mathcal X$ in the hypercube $[0,1]^d$, our algorithm generates synthetic dataset $\mathcal Y$ such that the expected 1-Wasserstein distance between the empirical measure of $\mathcal X$ and $\mathcal Y$ is $O((\varepsilon n)^{-1/d})$ for $d\geq 2$, and is $O(\log^2(\varepsilon n)(\varepsilon n)^{-1})$ for $d=1$. The accuracy guarantee is optimal up to a constant factor for $d\geq 2$, and up to a logarithmic factor for $d=1$. Our algorithm has a fast running time of $O(\varepsilon n)$ for all $d\geq 1$ and demonstrates improved accuracy compared to the method in (Boedihardjo et al., 2022) for $d\geq 2$.


翻译:我们提出了一种非常有效的算法方法,用于在1瓦瑟斯坦距离下,以1瓦瑟斯坦距离以近最佳的效用保证在封闭的公制空间中生成美元和瓦瑟斯隆的私人合成数据。特别是,对于超立方[$0,1美元]的数据集,我们的算法产生合成数据集$gmathcal Y$,因此,预期Wasserstein在1瓦瑟斯坦以1美元和1美元的经验计量标准之间的距离为$gmassal X$和$gmathcal Y$。我们的算法以2美元为单位,以2美元为单位,以美元为单位,以2美元为单位,以1美元为单位,以美元为单位,以1美元为单位,以美元为单位,以1瓦瑟斯斯坦为单位,以1美元为单位,以1美元为单位,以1美元为单位,以1美元为单位,以美元为单位计算,以美元为美元计算,以美元为美元/美元为美元计算,以美元为美元计算速度运行时间为1美元,以美元为美元,以美元为美元为美元,以美元为美元为美元为美元,以美元为美元为美元,以美元为美元为美元,以美元为美元为美元为美元,以美元为美元为美元,以美元为美元为美元,以美元为美元为美元,以美元为美元,以美元为美元为美元,以美元为美元,以美元为美元为美元为美元,以美元为美元为美元,以美元为美元为美元为美元为美元为美元为美元为美元,以美元,以美元,以美元为美元为美元为美元,以美元为美元为美元为美元为美元为美元计算的精确比为美元,以美元,以美元,以美元计算的精确度为美元,以美元为美元,以美元为美元为美元为美元,以美元,以美元为美元为美元,以美元为美元,以美元为美元为美元为美元,以美元为美元为美元为美元,以美元为美元为美元为美元为美元为美元,以美元为美元为美元为美元,以美元为美元为美元为美元为美元为美元为美元为美元,以美元计算的计算的计算的精确比的精确比的精确比为美元,以美元,比

0
下载
关闭预览

相关内容

【干货书】机器学习速查手册,135页pdf
专知会员服务
125+阅读 · 2020年11月20日
[综述]深度学习下的场景文本检测与识别
专知会员服务
77+阅读 · 2019年10月10日
【SIGGRAPH2019】TensorFlow 2.0深度学习计算机图形学应用
专知会员服务
39+阅读 · 2019年10月9日
VCIP 2022 Call for Demos
CCF多媒体专委会
1+阅读 · 2022年6月6日
Hierarchically Structured Meta-learning
CreateAMind
26+阅读 · 2019年5月22日
Transferring Knowledge across Learning Processes
CreateAMind
27+阅读 · 2019年5月18日
深度自进化聚类:Deep Self-Evolution Clustering
我爱读PAMI
15+阅读 · 2019年4月13日
Unsupervised Learning via Meta-Learning
CreateAMind
42+阅读 · 2019年1月3日
A Technical Overview of AI & ML in 2018 & Trends for 2019
待字闺中
16+阅读 · 2018年12月24日
disentangled-representation-papers
CreateAMind
26+阅读 · 2018年9月12日
【SIGIR2018】五篇对抗训练文章
专知
12+阅读 · 2018年7月9日
【论文】变分推断(Variational inference)的总结
机器学习研究会
39+阅读 · 2017年11月16日
国家自然科学基金
0+阅读 · 2015年12月31日
国家自然科学基金
0+阅读 · 2013年12月31日
国家自然科学基金
0+阅读 · 2013年12月31日
国家自然科学基金
0+阅读 · 2013年12月31日
国家自然科学基金
0+阅读 · 2012年12月31日
国家自然科学基金
0+阅读 · 2012年12月31日
国家自然科学基金
0+阅读 · 2009年12月31日
Arxiv
0+阅读 · 2023年3月31日
Arxiv
14+阅读 · 2022年10月15日
VIP会员
相关资讯
VCIP 2022 Call for Demos
CCF多媒体专委会
1+阅读 · 2022年6月6日
Hierarchically Structured Meta-learning
CreateAMind
26+阅读 · 2019年5月22日
Transferring Knowledge across Learning Processes
CreateAMind
27+阅读 · 2019年5月18日
深度自进化聚类:Deep Self-Evolution Clustering
我爱读PAMI
15+阅读 · 2019年4月13日
Unsupervised Learning via Meta-Learning
CreateAMind
42+阅读 · 2019年1月3日
A Technical Overview of AI & ML in 2018 & Trends for 2019
待字闺中
16+阅读 · 2018年12月24日
disentangled-representation-papers
CreateAMind
26+阅读 · 2018年9月12日
【SIGIR2018】五篇对抗训练文章
专知
12+阅读 · 2018年7月9日
【论文】变分推断(Variational inference)的总结
机器学习研究会
39+阅读 · 2017年11月16日
相关基金
国家自然科学基金
0+阅读 · 2015年12月31日
国家自然科学基金
0+阅读 · 2013年12月31日
国家自然科学基金
0+阅读 · 2013年12月31日
国家自然科学基金
0+阅读 · 2013年12月31日
国家自然科学基金
0+阅读 · 2012年12月31日
国家自然科学基金
0+阅读 · 2012年12月31日
国家自然科学基金
0+阅读 · 2009年12月31日
Top
微信扫码咨询专知VIP会员