We present a highly effective algorithmic approach for generating $\varepsilon$-differentially private synthetic data in a bounded metric space with near-optimal utility guarantees under the 1-Wasserstein distance. In particular, for a dataset $\mathcal X$ in the hypercube $[0,1]^d$, our algorithm generates synthetic dataset $\mathcal Y$ such that the expected 1-Wasserstein distance between the empirical measure of $\mathcal X$ and $\mathcal Y$ is $O((\varepsilon n)^{-1/d})$ for $d\geq 2$, and is $O(\log^2(\varepsilon n)(\varepsilon n)^{-1})$ for $d=1$. The accuracy guarantee is optimal up to a constant factor for $d\geq 2$, and up to a logarithmic factor for $d=1$. Our algorithm has a fast running time of $O(\varepsilon n)$ for all $d\geq 1$ and demonstrates improved accuracy compared to the method in (Boedihardjo et al., 2022) for $d\geq 2$.
翻译:我们提出了一种非常有效的算法方法,用于在1瓦瑟斯坦距离下,以1瓦瑟斯坦距离以近最佳的效用保证在封闭的公制空间中生成美元和瓦瑟斯隆的私人合成数据。特别是,对于超立方[$0,1美元]的数据集,我们的算法产生合成数据集$gmathcal Y$,因此,预期Wasserstein在1瓦瑟斯坦以1美元和1美元的经验计量标准之间的距离为$gmassal X$和$gmathcal Y$。我们的算法以2美元为单位,以2美元为单位,以美元为单位,以2美元为单位,以1美元为单位,以美元为单位,以1美元为单位,以美元为单位,以1瓦瑟斯斯坦为单位,以1美元为单位,以1美元为单位,以1美元为单位,以1美元为单位,以美元为单位计算,以美元为美元计算,以美元为美元/美元为美元计算,以美元为美元计算速度运行时间为1美元,以美元为美元,以美元为美元为美元,以美元为美元为美元为美元,以美元为美元为美元,以美元为美元为美元,以美元为美元为美元为美元,以美元为美元为美元,以美元为美元为美元,以美元为美元为美元,以美元为美元,以美元为美元为美元,以美元为美元,以美元为美元为美元为美元,以美元为美元为美元,以美元为美元为美元为美元为美元为美元为美元为美元,以美元,以美元,以美元为美元为美元为美元,以美元为美元为美元为美元为美元为美元计算的精确比为美元,以美元,以美元,以美元计算的精确度为美元,以美元为美元,以美元为美元为美元为美元,以美元,以美元为美元为美元,以美元为美元,以美元为美元为美元为美元,以美元为美元为美元为美元,以美元为美元为美元为美元为美元为美元,以美元为美元为美元为美元,以美元为美元为美元为美元为美元为美元为美元为美元,以美元计算的计算的计算的精确比的精确比的精确比为美元,以美元,比