【普林斯顿博士论文】在差分隐私机器学习中有效地从数据中学习并生成数据，189页pdf - 专知VIP

会员服务 ·

0

差分隐私 · 机器学习 · 普林斯顿大学 (Princeton University) · 博士论文 · 数据生成 ·

【普林斯顿博士论文】在差分隐私机器学习中有效地从数据中学习并生成数据，189页pdf

专知会员服务

专知，提供专业可信的知识分发服务，让认知协作更快更好！

机器学习模型容易受到一系列攻击，这些攻击利用了训练模型中的数据泄露。差分隐私 (Differential Privacy, DP) 是量化隐私风险并提供可证明的攻击防御保证的黄金标准。然而，在差分隐私下训练机器学习模型通常会导致显著的效用下降。在本论文中，我们探讨了如何在差分隐私机器学习中有效地从数据中学习和生成数据。

为了在保护隐私的情况下有效地从数据中学习，识别可以利用的先验信息类型至关重要。首先，我们研究了标签差分隐私 (label-DP) 设置，其中特征信息是公开的，而标签信息是私密的。我们研究了如何通过利用公共特征减少噪声添加量并减小噪声影响，从而提高模型在标签差分隐私下的效用。

其次，我们研究了如何利用合成图像来改善差分隐私图像分类。尽管这些合成图像是在没有访问真实世界图像的情况下生成的，并且在非隐私训练中仅具有有限帮助，但我们发现这些合成图像可以为差分隐私图像分类提供更好的先验信息。我们进一步研究了如何最大化使用这些合成先验信息，从而释放其全部潜力以改进隐私训练。

第三，我们研究了零阶优化（zeroth-order optimization）的私有化，该方法已被证明在微调大语言模型时可以达到与随机梯度下降法 (SGD) 相竞争的性能，并提出了差分隐私零阶优化 (DP-ZO)。我们的关键见解是，在零阶优化中，从私有数据中派生的信息仅为一个标量。因此，我们只需要对这个标量进行隐私处理。这对隐私非常友好，因为我们只需要对标量添加噪声，而不是高维梯度。

第四，针对差分隐私的合成数据生成，我们研究了仅通过 API 访问大型语言模型而不进行微调的情况下私密生成数据的方法。我们提出的方法能够为大型语言模型的上下文学习 (in-context learning) 提供隐私保护，并支持无限查询。

总而言之，本论文探讨了如何在差分隐私机器学习中有效地从数据中学习和生成数据，并为设计实际中的隐私保护机器学习模型提供了方向。

成为VIP会员查看完整内容

0

相关内容

差分隐私

【牛津大学博士论文】从多模态数据中学习表示，258页pdf

【牛津大学博士论文】从多模态数据中学习表示，258页pdf

专知会员服务

47+阅读 · 7月28日

【纽约大学博士论文】从奖励中学习在文本生成中的应用，197页pdf

【纽约大学博士论文】从奖励中学习在文本生成中的应用，197页pdf

专知会员服务

15+阅读 · 7月13日

【斯坦福博士论文】有效的差分隐私深度学习，153页pdf

【斯坦福博士论文】有效的差分隐私深度学习，153页pdf

专知会员服务

16+阅读 · 7月10日

【斯坦福大学博士论文】面向现实应用的深度生成模型，222页pdf

【斯坦福大学博士论文】面向现实应用的深度生成模型，222页pdf

专知会员服务

44+阅读 · 2023年9月7日

【伯克利博士论文】受约束的机器学习：算法与模型，153页pdf

【伯克利博士论文】受约束的机器学习：算法与模型，153页pdf

专知会员服务

51+阅读 · 2023年8月22日

【斯坦福博士论文】大模型驱动的鲁棒机器学习，243页pdf

【斯坦福博士论文】大模型驱动的鲁棒机器学习，243页pdf

专知会员服务

58+阅读 · 2023年7月10日

【斯坦福博士论文】基于自适应采样的加速机器学习算法，113页pdf

【斯坦福博士论文】基于自适应采样的加速机器学习算法，113页pdf

专知会员服务

26+阅读 · 2023年6月25日

【伯克利博士论文】不确定性序列决策:最优性保证，组合学习，以及在机器人技术和生态学中的应用，256页pdf

【伯克利博士论文】不确定性序列决策:最优性保证，组合学习，以及在机器人技术和生态学中的应用，256页pdf

专知会员服务

36+阅读 · 2023年5月17日

【剑桥大学博士论文】计算机系统中的端到端深度强化学习，188页pdf

【剑桥大学博士论文】计算机系统中的端到端深度强化学习，188页pdf

专知会员服务

39+阅读 · 2022年10月31日

【MIT博士论文】实用机器学习的高效鲁棒算法，142页pdf

【MIT博士论文】实用机器学习的高效鲁棒算法，142页pdf

专知会员服务

56+阅读 · 2022年9月7日

【佐治亚理工博士论文】基于策略智能体和有限反馈的序列决策，211页pdf

【佐治亚理工博士论文】基于策略智能体和有限反馈的序列决策，211页pdf

专知

28+阅读 · 2023年4月13日

【CMU博士论文】黑盒和多目标优化策略，151页pdf

【CMU博士论文】黑盒和多目标优化策略，151页pdf

专知

13+阅读 · 2022年11月24日

【牛津大学博士论文】元强化学习的快速自适应，217页pdf

【牛津大学博士论文】元强化学习的快速自适应，217页pdf

专知

26+阅读 · 2022年9月19日

【斯坦福博士论文】利用先验知识和结构进行数据高效的机器学习，154页pdf

【斯坦福博士论文】利用先验知识和结构进行数据高效的机器学习，154页pdf

专知

23+阅读 · 2022年9月11日

【MIT博士论文】深度学习几何表示，138页pdf

【MIT博士论文】深度学习几何表示，138页pdf

专知

12+阅读 · 2022年9月4日

【MIT博士论文】数据高效强化学习，176页pdf

【MIT博士论文】数据高效强化学习，176页pdf

专知

15+阅读 · 2022年7月11日

【2022新书】机器学习中的概率数值计算，412页pdf

【2022新书】机器学习中的概率数值计算，412页pdf

专知

26+阅读 · 2022年7月7日

最新《图嵌入组合优化》综述论文，40页pdf

最新《图嵌入组合优化》综述论文，40页pdf

专知

38+阅读 · 2020年8月31日

【KDD2020】图神经网络:基础与应用，322页ppt

【KDD2020】图神经网络:基础与应用，322页ppt

专知

31+阅读 · 2020年8月29日

最新《动态网络嵌入》综述论文，25页pdf

最新《动态网络嵌入》综述论文，25页pdf

专知

34+阅读 · 2020年6月17日

基于多关联数据融合的疾病相似度算法研究

国家自然科学基金

3+阅读 · 2015年12月31日

基于图的半监督学习算法研究

国家自然科学基金

5+阅读 · 2015年12月31日

满足差分隐私的频繁模式挖掘研究

国家自然科学基金

2+阅读 · 2015年12月31日

基于低秩表示的鲁棒特征抽取和分类方法研究

国家自然科学基金

1+阅读 · 2015年12月31日

基于对称识别方法的贝叶斯probit模型稳健性研究

国家自然科学基金

2+阅读 · 2015年12月31日

高维回归模型的预测稳定性研究

国家自然科学基金

2+阅读 · 2015年12月31日

非参数核方法的样本外扩展研究

国家自然科学基金

2+阅读 · 2015年12月31日

面向大规模多步学习问题的学习分类元系统技术研究

国家自然科学基金

5+阅读 · 2015年12月31日

网状meta分析实效性评价方法及其广义线性混合效应模型的构建与应用研究

国家自然科学基金

0+阅读 · 2015年12月31日

基于异构信息网络的分类算法推荐方法研究

国家自然科学基金

7+阅读 · 2015年12月31日

Is ChatGPT a Good Recommender? A Preliminary Study

Arxiv

150+阅读 · 2023年4月20日

A Comprehensive Survey on Deep Graph Representation Learning

Arxiv

87+阅读 · 2023年4月11日

On Efficient Training of Large-Scale Deep Learning Models: A Literature Review

Arxiv

167+阅读 · 2023年4月7日

A Survey of Large Language Models

A Survey of Large Language Models

Arxiv

386+阅读 · 2023年3月31日

Data-centric Artificial Intelligence: A Survey

Arxiv

19+阅读 · 2023年3月17日

A survey and taxonomy of loss functions in machine learning

Arxiv

22+阅读 · 2023年1月13日

Information-theoretic generalization bounds for black-box learning algorithms

Arxiv

12+阅读 · 2021年10月4日

Contrastive learning of global and local features for medical image segmentation with limited annotations

Arxiv

19+阅读 · 2020年6月18日

Hyper-SAGNN: a self-attention based graph neural network for hypergraphs

Hyper-SAGNN: a self-attention based graph neural network for hypergraphs

Arxiv

17+阅读 · 2019年11月6日

Interpretable machine learning: definitions, methods, and applications

Interpretable machine learning: definitions, methods, and applications

Arxiv

19+阅读 · 2019年1月14日

VIP会员

相关主题

普林斯顿大学 (Princeton University)

相关VIP内容

【牛津大学博士论文】从多模态数据中学习表示，258页pdf

【牛津大学博士论文】从多模态数据中学习表示，258页pdf

专知会员服务

47+阅读 · 7月28日

【纽约大学博士论文】从奖励中学习在文本生成中的应用，197页pdf

【纽约大学博士论文】从奖励中学习在文本生成中的应用，197页pdf

专知会员服务

15+阅读 · 7月13日

【斯坦福博士论文】有效的差分隐私深度学习，153页pdf

【斯坦福博士论文】有效的差分隐私深度学习，153页pdf

专知会员服务

16+阅读 · 7月10日

【斯坦福大学博士论文】面向现实应用的深度生成模型，222页pdf

【斯坦福大学博士论文】面向现实应用的深度生成模型，222页pdf

专知会员服务

44+阅读 · 2023年9月7日

【伯克利博士论文】受约束的机器学习：算法与模型，153页pdf

【伯克利博士论文】受约束的机器学习：算法与模型，153页pdf

专知会员服务

51+阅读 · 2023年8月22日

【斯坦福博士论文】大模型驱动的鲁棒机器学习，243页pdf

【斯坦福博士论文】大模型驱动的鲁棒机器学习，243页pdf

专知会员服务

58+阅读 · 2023年7月10日

【斯坦福博士论文】基于自适应采样的加速机器学习算法，113页pdf

【斯坦福博士论文】基于自适应采样的加速机器学习算法，113页pdf

专知会员服务

26+阅读 · 2023年6月25日

【伯克利博士论文】不确定性序列决策:最优性保证，组合学习，以及在机器人技术和生态学中的应用，256页pdf

【伯克利博士论文】不确定性序列决策:最优性保证，组合学习，以及在机器人技术和生态学中的应用，256页pdf

专知会员服务

36+阅读 · 2023年5月17日

【剑桥大学博士论文】计算机系统中的端到端深度强化学习，188页pdf

【剑桥大学博士论文】计算机系统中的端到端深度强化学习，188页pdf

专知会员服务

39+阅读 · 2022年10月31日

【MIT博士论文】实用机器学习的高效鲁棒算法，142页pdf

【MIT博士论文】实用机器学习的高效鲁棒算法，142页pdf

专知会员服务

56+阅读 · 2022年9月7日

热门VIP内容

相关资讯

【佐治亚理工博士论文】基于策略智能体和有限反馈的序列决策，211页pdf

【佐治亚理工博士论文】基于策略智能体和有限反馈的序列决策，211页pdf

专知

28+阅读 · 2023年4月13日

【CMU博士论文】黑盒和多目标优化策略，151页pdf

【CMU博士论文】黑盒和多目标优化策略，151页pdf

专知

13+阅读 · 2022年11月24日

【牛津大学博士论文】元强化学习的快速自适应，217页pdf

【牛津大学博士论文】元强化学习的快速自适应，217页pdf

专知

26+阅读 · 2022年9月19日

【斯坦福博士论文】利用先验知识和结构进行数据高效的机器学习，154页pdf

【斯坦福博士论文】利用先验知识和结构进行数据高效的机器学习，154页pdf

专知

23+阅读 · 2022年9月11日

【MIT博士论文】深度学习几何表示，138页pdf

【MIT博士论文】深度学习几何表示，138页pdf

专知

12+阅读 · 2022年9月4日

【MIT博士论文】数据高效强化学习，176页pdf

【MIT博士论文】数据高效强化学习，176页pdf

专知

15+阅读 · 2022年7月11日

【2022新书】机器学习中的概率数值计算，412页pdf

【2022新书】机器学习中的概率数值计算，412页pdf

专知

26+阅读 · 2022年7月7日

最新《图嵌入组合优化》综述论文，40页pdf

最新《图嵌入组合优化》综述论文，40页pdf

专知

38+阅读 · 2020年8月31日

【KDD2020】图神经网络:基础与应用，322页ppt

【KDD2020】图神经网络:基础与应用，322页ppt

专知

31+阅读 · 2020年8月29日

最新《动态网络嵌入》综述论文，25页pdf

最新《动态网络嵌入》综述论文，25页pdf

专知

34+阅读 · 2020年6月17日

相关基金

基于多关联数据融合的疾病相似度算法研究

国家自然科学基金

3+阅读 · 2015年12月31日

基于图的半监督学习算法研究

国家自然科学基金

5+阅读 · 2015年12月31日

满足差分隐私的频繁模式挖掘研究

国家自然科学基金

2+阅读 · 2015年12月31日

基于低秩表示的鲁棒特征抽取和分类方法研究

国家自然科学基金

1+阅读 · 2015年12月31日

基于对称识别方法的贝叶斯probit模型稳健性研究

国家自然科学基金

2+阅读 · 2015年12月31日

高维回归模型的预测稳定性研究

国家自然科学基金

2+阅读 · 2015年12月31日

非参数核方法的样本外扩展研究

国家自然科学基金

2+阅读 · 2015年12月31日

面向大规模多步学习问题的学习分类元系统技术研究

国家自然科学基金

5+阅读 · 2015年12月31日

网状meta分析实效性评价方法及其广义线性混合效应模型的构建与应用研究

国家自然科学基金

0+阅读 · 2015年12月31日

基于异构信息网络的分类算法推荐方法研究

国家自然科学基金

7+阅读 · 2015年12月31日

相关论文

Is ChatGPT a Good Recommender? A Preliminary Study

Arxiv

150+阅读 · 2023年4月20日

A Comprehensive Survey on Deep Graph Representation Learning

Arxiv

87+阅读 · 2023年4月11日

On Efficient Training of Large-Scale Deep Learning Models: A Literature Review

Arxiv

167+阅读 · 2023年4月7日

A Survey of Large Language Models

A Survey of Large Language Models

Arxiv

386+阅读 · 2023年3月31日

Data-centric Artificial Intelligence: A Survey

Arxiv

19+阅读 · 2023年3月17日

A survey and taxonomy of loss functions in machine learning

Arxiv

22+阅读 · 2023年1月13日

Information-theoretic generalization bounds for black-box learning algorithms

Arxiv

12+阅读 · 2021年10月4日

Contrastive learning of global and local features for medical image segmentation with limited annotations

Arxiv

19+阅读 · 2020年6月18日

Hyper-SAGNN: a self-attention based graph neural network for hypergraphs

Hyper-SAGNN: a self-attention based graph neural network for hypergraphs

Arxiv

17+阅读 · 2019年11月6日

Interpretable machine learning: definitions, methods, and applications

Interpretable machine learning: definitions, methods, and applications

Arxiv

19+阅读 · 2019年1月14日

微信扫码咨询专知VIP会员