Noise perturbation is one of the most fundamental approaches for achieving $(ε,δ)$-differential privacy (DP) guarantees when releasing the result of a query or function $f(\cdot)\in\mathbb{R}^M$ evaluated on a sensitive dataset $\mathbf{x}$. In this approach, calibrated noise $\mathbf{n}\in\mathbb{R}^M$ is used to obscure the difference vector $f(\mathbf{x})-f(\mathbf{x}')$, where $\mathbf{x}'$ is known as a neighboring dataset. A DP guarantee is obtained by studying the tail probability bound of a privacy loss random variable (PLRV), defined as the Radon-Nikodym derivative between two distributions. When $\mathbf{n}$ follows a multivariate Gaussian distribution, the PLRV is characterized as a specific univariate Gaussian. In this paper, we propose a novel scheme to generate $\mathbf{n}$ by leveraging the fact that the perturbation noise is typically spherically symmetric (i.e., the distribution is rotationally invariant around the origin). The new noise generation scheme allows us to investigate the privacy loss from a geometric perspective and express the resulting PLRV using a product measure, $W\times U$; measure $W$ is related to a radius random variable controlling the magnitude of $\mathbf{n}$, while measure $U$ involves a directional random variable governing the angle between $\mathbf{n}$ and the difference $f(\mathbf{x})-f(\mathbf{x}')$. We derive a closed-form moment bound on the product measure to prove $(ε,δ)$-DP. Under the same $(ε,δ)$-DP guarantee, our mechanism yields a smaller expected noise magnitude than the classic Gaussian noise in high dimensions, thereby significantly improving the utility of the noisy result $f(\mathbf{x})+\mathbf{n}$. To validate this, we consider convex and non-convex empirical risk minimization (ERM) problems in high dimensional space and apply the proposed product noise to achieve privacy.


翻译:噪声扰动是实现查询或函数$f(\cdot)\in\mathbb{R}^M$在敏感数据集$\mathbf{x}$上计算结果发布时满足$(ε,δ)$-差分隐私(DP)保证的最基本方法之一。该方法通过校准噪声$\mathbf{n}\in\mathbb{R}^M$来掩盖差分向量$f(\mathbf{x})-f(\mathbf{x}')$,其中$\mathbf{x}'$称为相邻数据集。通过研究隐私损失随机变量(PLRV)的尾部概率界可获得DP保证,该变量定义为两个分布间的Radon-Nikodym导数。当$\mathbf{n}$服从多元高斯分布时,PLRV可表征为特定的一元高斯分布。本文提出一种利用扰动噪声通常具有球对称性(即分布绕原点旋转不变)特性生成$\mathbf{n}$的新方案。该新噪声生成方案使我们能够从几何角度研究隐私损失,并使用乘积测度$W\times U$表达所得PLRV;测度$W$与控制$\mathbf{n}$幅度的半径随机变量相关,而测度$U$涉及控制$\mathbf{n}$与差分$f(\mathbf{x})-f(\mathbf{x}')$间夹角的方向随机变量。我们推导出乘积测度的闭形式矩界以证明$(ε,δ)$-DP。在相同$(ε,δ)$-DP保证下,本机制在高维空间中产生的期望噪声幅度小于经典高斯噪声,从而显著提升噪声化结果$f(\mathbf{x})+\mathbf{n}$的可用性。为验证此优势,我们考虑高维空间中的凸与非凸经验风险最小化(ERM)问题,并应用所提出的乘积噪声实现隐私保护。

0
下载
关闭预览

相关内容

专知会员服务
16+阅读 · 2021年10月4日
专知会员服务
25+阅读 · 2021年7月31日
【NeurIPS2019】图变换网络:Graph Transformer Network
NAACL 2019 | 一种考虑缓和KL消失的简单VAE训练方法
PaperWeekly
20+阅读 · 2019年4月24日
CNN 反向传播算法推导
统计学习与视觉计算组
30+阅读 · 2017年12月29日
EKF常用于目标跟踪系统的扩展卡尔曼滤波器
无人机
10+阅读 · 2017年7月25日
国家自然科学基金
0+阅读 · 2017年12月31日
国家自然科学基金
0+阅读 · 2015年12月31日
国家自然科学基金
0+阅读 · 2015年12月31日
国家自然科学基金
0+阅读 · 2015年12月31日
国家自然科学基金
2+阅读 · 2015年12月31日
VIP会员
相关资讯
【NeurIPS2019】图变换网络:Graph Transformer Network
NAACL 2019 | 一种考虑缓和KL消失的简单VAE训练方法
PaperWeekly
20+阅读 · 2019年4月24日
CNN 反向传播算法推导
统计学习与视觉计算组
30+阅读 · 2017年12月29日
EKF常用于目标跟踪系统的扩展卡尔曼滤波器
无人机
10+阅读 · 2017年7月25日
相关基金
国家自然科学基金
0+阅读 · 2017年12月31日
国家自然科学基金
0+阅读 · 2015年12月31日
国家自然科学基金
0+阅读 · 2015年12月31日
国家自然科学基金
0+阅读 · 2015年12月31日
国家自然科学基金
2+阅读 · 2015年12月31日
Top
微信扫码咨询专知VIP会员