N-gms Bayes 不同隐私 (N-grams Bayesian Differential Privacy) - 专知论文

会员服务 ·

0

N元 · 语言模型化 · Performer · Better · contrastive ·

2021 年 1 月 29 日

N-grams Bayesian Differential Privacy

翻译：N-gms Bayes 不同隐私

Osman Ramadan,James Withers,Douglas Orr

from arxiv, 12 pages, 6 figures

Differential privacy has gained popularity in machine learning as a strong privacy guarantee, in contrast to privacy mitigation techniques such as k-anonymity. However, applying differential privacy to n-gram counts significantly degrades the utility of derived language models due to their large vocabularies. We propose a differential privacy mechanism that uses public data as a prior in a Bayesian setup to provide tighter bounds on the privacy loss metric epsilon, and thus better privacy-utility trade-offs. It first transforms the counts to log space, approximating the distribution of the public and private data as Gaussian. The posterior distribution is then evaluated and softmax is applied to produce a probability distribution. This technique achieves up to 85% reduction in KL divergence compared to previously known mechanisms at epsilon equals 0.1. We compare our mechanism to k-anonymity in a n-gram language modelling task and show that it offers competitive performance at large vocabulary sizes, while also providing superior privacy protection.

翻译：与K-匿名等减少隐私的技术相比,在机器学习中,不同隐私作为一种强有力的隐私保障越来越受欢迎。然而,对正克计数应用不同的隐私大大降低了衍生语言模型的效用,因为其庞大的词汇库。我们提议采用不同隐私机制,将公共数据作为巴伊西亚结构的先期使用,以提供更严格限制隐私损失指标Epsilon,从而改进隐私-通用的权衡。它首先将计数转换为日志空间,接近作为高山的公共和私人数据的分布。然后对后方和软式数据进行评审,以产生概率分布。与普西隆以前已知的机制相比,这一技术实现了高达85%的KL差异,相当于0.1。我们将我们的机制与n-gram语言模拟任务中的k-匿名性作了比较,并表明它提供了大词汇规模的竞争性性表现,同时提供了更高级的隐私保护。

0

相关内容

【ETH】最新《几何数据分析》2020课程，附PPT下载

专知会员服务

44+阅读 · 2020年12月18日

【经典书】应用随机微分方程，324页pdf，Applied Stochastic Differential Equations

【经典书】应用随机微分方程，324页pdf，Applied Stochastic Differential Equations

专知会员服务

58+阅读 · 2020年11月21日

【EMNLP2020最佳论文】无声语音的数字化发声

【EMNLP2020最佳论文】无声语音的数字化发声

专知会员服务

12+阅读 · 2020年11月20日

手写实现李航《统计学习方法》书中全部算法

手写实现李航《统计学习方法》书中全部算法

专知会员服务

49+阅读 · 2020年8月2日

【SIGIR2020】多检索系统的贝叶斯推理风险评估，Bayesian Inferential Risk Evaluation On Multiple IR Systems

【SIGIR2020】多检索系统的贝叶斯推理风险评估，Bayesian Inferential Risk Evaluation On Multiple IR Systems

专知会员服务

9+阅读 · 2020年6月10日

【北京大学】Locally Differentially Private (Contextual) Bandits Learning

【北京大学】Locally Differentially Private (Contextual) Bandits Learning

专知会员服务

13+阅读 · 2020年6月8日

统计学习理论之父Vapnik-MIT2020报告《完全学习统计理论Statistical Theory of Learning》

统计学习理论之父Vapnik-MIT2020报告《完全学习统计理论Statistical Theory of Learning》

专知会员服务

85+阅读 · 2020年2月16日

【哥伦比亚大学】经济AI优化课程，Economics, AI, and Optimization

【哥伦比亚大学】经济AI优化课程，Economics, AI, and Optimization

专知会员服务

53+阅读 · 2020年2月15日

【新书】贝叶斯网络进展与新应用，附全书下载

【新书】贝叶斯网络进展与新应用，附全书下载

专知会员服务

122+阅读 · 2019年12月9日

Connections between Support Vector Machines, Wasserstein distance and gradient-penalty GANs

Connections between Support Vector Machines, Wasserstein distance and gradient-penalty GANs

专知会员服务

36+阅读 · 2019年10月17日

Transferring Knowledge across Learning Processes

Transferring Knowledge across Learning Processes

CreateAMind

29+阅读 · 2019年5月18日

已删除

将门创投

3+阅读 · 2019年1月15日

【学习】Hierarchical Softmax

【学习】Hierarchical Softmax

机器学习研究会

4+阅读 · 2017年8月6日

Consistency of Bayesian inference with Gaussian process priors for a parabolic inverse problem

Arxiv

0+阅读 · 2021年3月24日

Re-weighting of Vector-weighted Mechanisms for Utility Maximization under Differential Privacy

Re-weighting of Vector-weighted Mechanisms for Utility Maximization under Differential Privacy

Arxiv

0+阅读 · 2021年3月23日

Differentiable Agent-Based Simulation for Gradient-Guided Simulation-Based Optimization

Arxiv

0+阅读 · 2021年3月23日

Mine Me but Don't Single Me Out: Differentially Private Event Logs for Process Mining

Arxiv

0+阅读 · 2021年3月22日

Error analysis for probabilities of rare events with approximate models

Arxiv

0+阅读 · 2021年3月22日

d3p -- A Python Package for Differentially-Private Probabilistic Programming

Arxiv

0+阅读 · 2021年3月22日

Differentially private inference via noisy optimization

Arxiv

0+阅读 · 2021年3月19日

Optimizing Fitness-For-Use of Differentially Private Linear Queries

Arxiv

0+阅读 · 2021年3月19日

Super-convergence and Differential Privacy: Training faster with better privacy guarantees

Arxiv

0+阅读 · 2021年3月18日

LDP-FL: Practical Private Aggregation in Federated Learning with Local Differential Privacy

Arxiv

5+阅读 · 2020年7月31日

VIP会员

文章信息

相关主题

语言模型化

相关VIP内容

【ETH】最新《几何数据分析》2020课程，附PPT下载

专知会员服务

44+阅读 · 2020年12月18日

【经典书】应用随机微分方程，324页pdf，Applied Stochastic Differential Equations

【经典书】应用随机微分方程，324页pdf，Applied Stochastic Differential Equations

专知会员服务

58+阅读 · 2020年11月21日

【EMNLP2020最佳论文】无声语音的数字化发声

【EMNLP2020最佳论文】无声语音的数字化发声

专知会员服务

12+阅读 · 2020年11月20日

手写实现李航《统计学习方法》书中全部算法

手写实现李航《统计学习方法》书中全部算法

专知会员服务

49+阅读 · 2020年8月2日

【SIGIR2020】多检索系统的贝叶斯推理风险评估，Bayesian Inferential Risk Evaluation On Multiple IR Systems

【SIGIR2020】多检索系统的贝叶斯推理风险评估，Bayesian Inferential Risk Evaluation On Multiple IR Systems

专知会员服务

9+阅读 · 2020年6月10日

【北京大学】Locally Differentially Private (Contextual) Bandits Learning

【北京大学】Locally Differentially Private (Contextual) Bandits Learning

专知会员服务

13+阅读 · 2020年6月8日

统计学习理论之父Vapnik-MIT2020报告《完全学习统计理论Statistical Theory of Learning》

统计学习理论之父Vapnik-MIT2020报告《完全学习统计理论Statistical Theory of Learning》

专知会员服务

85+阅读 · 2020年2月16日

【哥伦比亚大学】经济AI优化课程，Economics, AI, and Optimization

【哥伦比亚大学】经济AI优化课程，Economics, AI, and Optimization

专知会员服务

53+阅读 · 2020年2月15日

【新书】贝叶斯网络进展与新应用，附全书下载

【新书】贝叶斯网络进展与新应用，附全书下载

专知会员服务

122+阅读 · 2019年12月9日

Connections between Support Vector Machines, Wasserstein distance and gradient-penalty GANs

Connections between Support Vector Machines, Wasserstein distance and gradient-penalty GANs

专知会员服务

36+阅读 · 2019年10月17日

热门VIP内容

开通专知VIP会员享更多权益服务

《物联网（IoT）中的无人机通信高效控制》135页

《在GNSS信号降级环境中利用共识实现无人机集群稳健协调》

中程单向攻击无人机的战略意义：俄乌战争启示

《面向无人机集群的避障动态传感器覆盖算法》最新38页

相关资讯

Transferring Knowledge across Learning Processes

Transferring Knowledge across Learning Processes

CreateAMind

29+阅读 · 2019年5月18日

已删除

将门创投

3+阅读 · 2019年1月15日

【学习】Hierarchical Softmax

【学习】Hierarchical Softmax

机器学习研究会

4+阅读 · 2017年8月6日

相关论文

Consistency of Bayesian inference with Gaussian process priors for a parabolic inverse problem

Arxiv

0+阅读 · 2021年3月24日

Re-weighting of Vector-weighted Mechanisms for Utility Maximization under Differential Privacy

Re-weighting of Vector-weighted Mechanisms for Utility Maximization under Differential Privacy

Arxiv

0+阅读 · 2021年3月23日

Differentiable Agent-Based Simulation for Gradient-Guided Simulation-Based Optimization

Arxiv

0+阅读 · 2021年3月23日

Mine Me but Don't Single Me Out: Differentially Private Event Logs for Process Mining

Arxiv

0+阅读 · 2021年3月22日

Error analysis for probabilities of rare events with approximate models

Arxiv

0+阅读 · 2021年3月22日

d3p -- A Python Package for Differentially-Private Probabilistic Programming

Arxiv

0+阅读 · 2021年3月22日

Differentially private inference via noisy optimization

Arxiv

0+阅读 · 2021年3月19日

Optimizing Fitness-For-Use of Differentially Private Linear Queries

Arxiv

0+阅读 · 2021年3月19日

Super-convergence and Differential Privacy: Training faster with better privacy guarantees

Arxiv

0+阅读 · 2021年3月18日

LDP-FL: Practical Private Aggregation in Federated Learning with Local Differential Privacy

Arxiv

5+阅读 · 2020年7月31日

微信扫码咨询专知VIP会员