关于 Rényi 差分隐私在基于统计的合成数据生成中的应用 (On Rényi Differential Privacy in Statistics-Based Synthetic Data Generation) - 专知论文

会员服务 ·

0

差分 · 差分隐私 · 合成数据 · 合成 · 原始数据集 ·

2023 年 3 月 31 日

On Rényi Differential Privacy in Statistics-Based Synthetic Data Generation

翻译：关于 Rényi 差分隐私在基于统计的合成数据生成中的应用

Takayuki Miura,Toshiki Shibahara,Masanobu Kii,Atsunori Ichikawa,Juko Yamamoto,Koji Chida

from arxiv, 18 pages, 3 figures

Privacy protection with synthetic data generation often uses differentially private statistics and model parameters to quantitatively express theoretical security. However, these methods do not take into account privacy protection due to the randomness of data generation. In this paper, we theoretically evaluate R\'{e}nyi differential privacy of the randomness in data generation of a synthetic data generation method that uses the mean vector and the covariance matrix of an original dataset. Specifically, for a fixed $\alpha > 1$, we show the condition of $\varepsilon$ such that the synthetic data generation satisfies $(\alpha, \varepsilon)$-R\'{e}nyi differential privacy under a bounded neighboring condition and an unbounded neighboring condition, respectively. In particular, under the unbounded condition, when the size of the original dataset and synthetic datase is 10 million, the mechanism satisfies $(4, 0.576)$-R\'{e}nyi differential privacy. We also show that when we translate it into the traditional $(\varepsilon, \delta)$-differential privacy, the mechanism satisfies $(4.00, 10^{-10})$-differential privacy.

翻译：利用合成数据生成进行数据隐私保护通常使用差分隐私统计和模型参数来定量表达理论安全性。然而，这些方法并没有考虑到由于数据生成的随机性而产生的隐私保护。本文通过理论分析，在使用原始数据集的均值向量和协方差矩阵的合成数据生成方法中，从 $\varepsilon$ 来确定 $(\alpha, \varepsilon)$-R\'{e}nyi 差分隐私的条件，其中 $\alpha > 1$ 固定。具体而言，在受到有界邻近条件和无界邻近条件的限制下，满足 $(\alpha, \varepsilon)$-R\'{e}nyi 差分隐私时，我们展示了 $\varepsilon$ 的条件。尤其是在无界条件下，当原始数据集和合成数据集的大小均为 1000 万时，该机制满足 $(4, 0.576)$-R\'{e}nyi 差分隐私。同时，我们还证明，当将其转换为传统的 $(\varepsilon, \delta)$-差分隐私时，该机制满足 $(4.00, 10^{-10})$-差分隐私。

0

相关内容

【干货书】数据分析优化，Optimization for Modern Data Analysis，117页pdf

【干货书】数据分析优化，Optimization for Modern Data Analysis，117页pdf

专知会员服务

63+阅读 · 2023年2月15日

宾夕法尼亚大学最新《不确定性估计》课程笔记，134页pdf，附Slides

宾夕法尼亚大学最新《不确定性估计》课程笔记，134页pdf，附Slides

专知会员服务

49+阅读 · 2022年11月13日

「机器学习中差分隐私」最新2022进展综述

「机器学习中差分隐私」最新2022进展综述

专知会员服务

53+阅读 · 2022年9月9日

【干货书】深度学习合成数据，354页pdf，Synthetic Data for Deep Learning

【干货书】深度学习合成数据，354页pdf，Synthetic Data for Deep Learning

专知会员服务

104+阅读 · 2022年2月10日

INRIA最新「机器学习理论」新书，229页pdf原理性阐述机器学习

INRIA最新「机器学习理论」新书，229页pdf原理性阐述机器学习

专知会员服务

69+阅读 · 2021年3月27日

INRIA 最新《机器学习理论》课程笔记，176页pdf

专知会员服务

51+阅读 · 2020年12月14日

机器学习隐私综述论文，An Overview of Privacy in Machine Learning

机器学习隐私综述论文，An Overview of Privacy in Machine Learning

专知会员服务

81+阅读 · 2020年5月20日

【DeepMind】PolyGen: 一种三维网格的自回归生成模型，PolyGen: An Autoregressive Generative Model of 3D Meshes

【DeepMind】PolyGen: 一种三维网格的自回归生成模型，PolyGen: An Autoregressive Generative Model of 3D Meshes

专知会员服务

37+阅读 · 2020年2月27日

【AAAI Tutorials 2019】联合学习：机器学习中的用户隐私，数据安全性和机密性（Federated Learning: User Privacy, Data Security and Confidentiality in Machine Learning）

【AAAI Tutorials 2019】联合学习：机器学习中的用户隐私，数据安全性和机密性（Federated Learning: User Privacy, Data Security and Confidentiality in Machine Learning）

专知会员服务

15+阅读 · 2019年11月18日

【哈佛大学商学院课程Fall 2019】机器学习可解释性

【哈佛大学商学院课程Fall 2019】机器学习可解释性

专知会员服务

105+阅读 · 2019年10月9日

NeurIPS 2022 | 量子算法用于采样对数凹分布和估计归一化常数

NeurIPS 2022 | 量子算法用于采样对数凹分布和估计归一化常数

PaperWeekly

0+阅读 · 2022年10月18日

Hierarchically Structured Meta-learning

Hierarchically Structured Meta-learning

CreateAMind

27+阅读 · 2019年5月22日

强化学习的Unsupervised Meta-Learning

强化学习的Unsupervised Meta-Learning

CreateAMind

18+阅读 · 2019年1月7日

Unsupervised Learning via Meta-Learning

Unsupervised Learning via Meta-Learning

CreateAMind

43+阅读 · 2019年1月3日

【SIGIR2018】五篇对抗训练文章

【SIGIR2018】五篇对抗训练文章

专知

12+阅读 · 2018年7月9日

【论文推荐】最新七篇图像检索相关论文—草图、Tie-Aware、场景图解析、叠加跨注意力机制、深度哈希、人群估计

【论文推荐】最新七篇图像检索相关论文—草图、Tie-Aware、场景图解析、叠加跨注意力机制、深度哈希、人群估计

专知

10+阅读 · 2018年4月22日

【论文推荐】最新七篇推荐系统相关论文—影响兴趣、知识Embeddings、音乐推荐、非结构化、一致性、显式和隐式特征、知识图谱

【论文推荐】最新七篇推荐系统相关论文—影响兴趣、知识Embeddings、音乐推荐、非结构化、一致性、显式和隐式特征、知识图谱

专知

14+阅读 · 2018年3月28日

最新5篇生成对抗网络相关论文推荐—FusedGAN、DeblurGAN、AdvGAN、CipherGAN、MMD GANS

最新5篇生成对抗网络相关论文推荐—FusedGAN、DeblurGAN、AdvGAN、CipherGAN、MMD GANS

专知

23+阅读 · 2018年1月18日

【论文】变分推断（Variational inference)的总结

【论文】变分推断（Variational inference)的总结

机器学习研究会

39+阅读 · 2017年11月16日

【推荐】RNN/LSTM时序预测

【推荐】RNN/LSTM时序预测

机器学习研究会

25+阅读 · 2017年9月8日

LncRNA IRI-1调控Caspase-3在低温保护心肌缺血再灌注损伤中作用机制研究

国家自然科学基金

0+阅读 · 2014年12月31日

量子群与Tewilliger代数的相关问题研究

国家自然科学基金

1+阅读 · 2013年12月31日

带参广义Bézier曲线曲面的关键技术及应用研究

国家自然科学基金

0+阅读 · 2013年12月31日

基于线性无偏估计面向任意树结构的差分隐私直方图发布

国家自然科学基金

0+阅读 · 2013年12月31日

七叶皂苷钠调控NOX家族蛋白介导的MAPK、PI3K/AKT信号通路保护神经细胞氧化应激损伤

国家自然科学基金

0+阅读 · 2013年12月31日

Fourier型标架与分形谱测度

国家自然科学基金

0+阅读 · 2012年12月31日

带正则结构的命题公式的可满足性问题研究

国家自然科学基金

0+阅读 · 2012年12月31日

差分隐私保护关键技术研究

国家自然科学基金

2+阅读 · 2012年12月31日

风轮菜黄酮类成分调控Nrf2/ARE信号通路诱导Ⅱ相解毒酶抗心肌缺血再灌注损伤的分子机制及构效关系研究

国家自然科学基金

0+阅读 · 2012年12月31日

钙敏感受体在缺氧诱导Aβ36807;量生成中的作用及其分子机制

国家自然科学基金

0+阅读 · 2009年12月31日

Towards Achieving Near-optimal Utility for Privacy-Preserving Federated Learning via Data Generation and Parameter Distortion

Arxiv

0+阅读 · 2023年5月19日

TSGM: A Flexible Framework for Generative Modeling of Synthetic Time Series

Arxiv

0+阅读 · 2023年5月19日

Algorithmically Effective Differentially Private Synthetic Data

Arxiv

0+阅读 · 2023年5月18日

Understanding how Differentially Private Generative Models Spend their Privacy Budget

Arxiv

0+阅读 · 2023年5月18日

TPMDP: Threshold Personalized Multi-party Differential Privacy via Optimal Gaussian Mechanism

Arxiv

0+阅读 · 2023年5月18日

Modeling Interference Using Experiment Roll-out

Arxiv

0+阅读 · 2023年5月18日

Learning Differentially Private Probabilistic Models for Privacy-Preserving Image Generation

Arxiv

0+阅读 · 2023年5月18日

Minimax rate for multivariate data under componentwise local differential privacy constraints

Arxiv

0+阅读 · 2023年5月17日

Utility Theory of Synthetic Data Generation

Arxiv

0+阅读 · 2023年5月17日

Generative Adversarial Autoencoder Networks

Arxiv

11+阅读 · 2018年3月23日

VIP会员

文章信息

相关主题

原始数据集

相关VIP内容

【干货书】数据分析优化，Optimization for Modern Data Analysis，117页pdf

【干货书】数据分析优化，Optimization for Modern Data Analysis，117页pdf

专知会员服务

63+阅读 · 2023年2月15日

宾夕法尼亚大学最新《不确定性估计》课程笔记，134页pdf，附Slides

宾夕法尼亚大学最新《不确定性估计》课程笔记，134页pdf，附Slides

专知会员服务

49+阅读 · 2022年11月13日

「机器学习中差分隐私」最新2022进展综述

「机器学习中差分隐私」最新2022进展综述

专知会员服务

53+阅读 · 2022年9月9日

【干货书】深度学习合成数据，354页pdf，Synthetic Data for Deep Learning

【干货书】深度学习合成数据，354页pdf，Synthetic Data for Deep Learning

专知会员服务

104+阅读 · 2022年2月10日

INRIA最新「机器学习理论」新书，229页pdf原理性阐述机器学习

INRIA最新「机器学习理论」新书，229页pdf原理性阐述机器学习

专知会员服务

69+阅读 · 2021年3月27日

INRIA 最新《机器学习理论》课程笔记，176页pdf

专知会员服务

51+阅读 · 2020年12月14日

机器学习隐私综述论文，An Overview of Privacy in Machine Learning

机器学习隐私综述论文，An Overview of Privacy in Machine Learning

专知会员服务

81+阅读 · 2020年5月20日

【DeepMind】PolyGen: 一种三维网格的自回归生成模型，PolyGen: An Autoregressive Generative Model of 3D Meshes

【DeepMind】PolyGen: 一种三维网格的自回归生成模型，PolyGen: An Autoregressive Generative Model of 3D Meshes

专知会员服务

37+阅读 · 2020年2月27日

【AAAI Tutorials 2019】联合学习：机器学习中的用户隐私，数据安全性和机密性（Federated Learning: User Privacy, Data Security and Confidentiality in Machine Learning）

【AAAI Tutorials 2019】联合学习：机器学习中的用户隐私，数据安全性和机密性（Federated Learning: User Privacy, Data Security and Confidentiality in Machine Learning）

专知会员服务

15+阅读 · 2019年11月18日

【哈佛大学商学院课程Fall 2019】机器学习可解释性

【哈佛大学商学院课程Fall 2019】机器学习可解释性

专知会员服务

105+阅读 · 2019年10月9日

热门VIP内容

开通专知VIP会员享更多权益服务

《乌克兰无人机产业：志愿者与政策在构建新兴无人机产业中的协同作用》最新报告

《人工智能辅助决策中的数据可视化：系统性综述》

人工智能驱动弹药制造现代化：美国陆军转型之路

《敏捷作战部署中枢纽-辐条基地选址优化研究》80页

相关资讯

NeurIPS 2022 | 量子算法用于采样对数凹分布和估计归一化常数

NeurIPS 2022 | 量子算法用于采样对数凹分布和估计归一化常数

PaperWeekly

0+阅读 · 2022年10月18日

Hierarchically Structured Meta-learning

Hierarchically Structured Meta-learning

CreateAMind

27+阅读 · 2019年5月22日

强化学习的Unsupervised Meta-Learning

强化学习的Unsupervised Meta-Learning

CreateAMind

18+阅读 · 2019年1月7日

Unsupervised Learning via Meta-Learning

Unsupervised Learning via Meta-Learning

CreateAMind

43+阅读 · 2019年1月3日

【SIGIR2018】五篇对抗训练文章

【SIGIR2018】五篇对抗训练文章

专知

12+阅读 · 2018年7月9日

【论文推荐】最新七篇图像检索相关论文—草图、Tie-Aware、场景图解析、叠加跨注意力机制、深度哈希、人群估计

【论文推荐】最新七篇图像检索相关论文—草图、Tie-Aware、场景图解析、叠加跨注意力机制、深度哈希、人群估计

专知

10+阅读 · 2018年4月22日

【论文推荐】最新七篇推荐系统相关论文—影响兴趣、知识Embeddings、音乐推荐、非结构化、一致性、显式和隐式特征、知识图谱

【论文推荐】最新七篇推荐系统相关论文—影响兴趣、知识Embeddings、音乐推荐、非结构化、一致性、显式和隐式特征、知识图谱

专知

14+阅读 · 2018年3月28日

最新5篇生成对抗网络相关论文推荐—FusedGAN、DeblurGAN、AdvGAN、CipherGAN、MMD GANS

最新5篇生成对抗网络相关论文推荐—FusedGAN、DeblurGAN、AdvGAN、CipherGAN、MMD GANS

专知

23+阅读 · 2018年1月18日

【论文】变分推断（Variational inference)的总结

【论文】变分推断（Variational inference)的总结

机器学习研究会

39+阅读 · 2017年11月16日

【推荐】RNN/LSTM时序预测

【推荐】RNN/LSTM时序预测

机器学习研究会

25+阅读 · 2017年9月8日

相关论文

Towards Achieving Near-optimal Utility for Privacy-Preserving Federated Learning via Data Generation and Parameter Distortion

Arxiv

0+阅读 · 2023年5月19日

TSGM: A Flexible Framework for Generative Modeling of Synthetic Time Series

Arxiv

0+阅读 · 2023年5月19日

Algorithmically Effective Differentially Private Synthetic Data

Arxiv

0+阅读 · 2023年5月18日

Understanding how Differentially Private Generative Models Spend their Privacy Budget

Arxiv

0+阅读 · 2023年5月18日

TPMDP: Threshold Personalized Multi-party Differential Privacy via Optimal Gaussian Mechanism

Arxiv

0+阅读 · 2023年5月18日

Modeling Interference Using Experiment Roll-out

Arxiv

0+阅读 · 2023年5月18日

Learning Differentially Private Probabilistic Models for Privacy-Preserving Image Generation

Arxiv

0+阅读 · 2023年5月18日

Minimax rate for multivariate data under componentwise local differential privacy constraints

Arxiv

0+阅读 · 2023年5月17日

Utility Theory of Synthetic Data Generation

Arxiv

0+阅读 · 2023年5月17日

Generative Adversarial Autoencoder Networks

Arxiv

11+阅读 · 2018年3月23日

相关基金

LncRNA IRI-1调控Caspase-3在低温保护心肌缺血再灌注损伤中作用机制研究

国家自然科学基金

0+阅读 · 2014年12月31日

量子群与Tewilliger代数的相关问题研究

国家自然科学基金

1+阅读 · 2013年12月31日

带参广义Bézier曲线曲面的关键技术及应用研究

国家自然科学基金

0+阅读 · 2013年12月31日

基于线性无偏估计面向任意树结构的差分隐私直方图发布

国家自然科学基金

0+阅读 · 2013年12月31日

七叶皂苷钠调控NOX家族蛋白介导的MAPK、PI3K/AKT信号通路保护神经细胞氧化应激损伤

国家自然科学基金

0+阅读 · 2013年12月31日

Fourier型标架与分形谱测度

国家自然科学基金

0+阅读 · 2012年12月31日

带正则结构的命题公式的可满足性问题研究

国家自然科学基金

0+阅读 · 2012年12月31日

差分隐私保护关键技术研究

国家自然科学基金

2+阅读 · 2012年12月31日

风轮菜黄酮类成分调控Nrf2/ARE信号通路诱导Ⅱ相解毒酶抗心肌缺血再灌注损伤的分子机制及构效关系研究

国家自然科学基金

0+阅读 · 2012年12月31日

钙敏感受体在缺氧诱导Aβ36807;量生成中的作用及其分子机制

国家自然科学基金

0+阅读 · 2009年12月31日

微信扫码咨询专知VIP会员