更安心的 TensorFlow：全新隐私测试库现已推出！ - 专知

会员服务 ·

0

更安心的 TensorFlow：全新隐私测试库现已推出！

2020 年 7 月 24 日 TensorFlow

文 / Shuang Song 和 David Marn

近日我们在 TensorFlow Privacy (GitHub) 中推出一个全新的实验性模块，可用于评估分类模型的隐私属性。

TensorFlow Privacy
https://github.com/tensorflow/privacy
GitHub
https://github.com/tensorflow/privacy/tree/master/tensorflow_privacy/privacy/membership_inference_attack

隐私是机器学习社区中的新兴话题。虽然目前在生成私有模型方面尚未形成规范的指导原则，但越来越多的研究表明，机器学习模型有时会泄漏训练数据集的敏感信息，从而给训练集中的用户带来安全隐患。

成员推理攻击概览：攻击者试图确定某些示例是否属于训练数据

去年，我们推出了 TensorFlow Privacy，支持开发者使用差异化隐私 (Differential Privacy) 来训练模型。差异化隐私通过增加噪音 (Noise) 隐藏训练数据集中的单个示例。但是，该噪声是专为应对学术上的最坏假设情况而设计的，在实际训练中可能会严重影响到模型准确性。

差异化隐私
https://developers.googleblog.com/2019/09/enabling-developers-and-organizations.html

这些挑战使得我们尝试从另一个角度应对隐私问题。数年前，围绕机器学习模型隐私属性的研究开始出现。

具有成本效益的 “成员推理攻击 (Membership Inference Attacks)” 可预测在训练期间是否使用了某些特定数据。如果攻击者能够进行高精度的预测，那么很可能也会成功找出训练集中是否使用了某段数据。成员推理攻击的最大优势是易于执行，即无需进行任何重新训练。

测试生成的漏洞分数，可用于确定模型是否会从训练集中泄漏信息。我们发现，漏洞分数通常可通过启发式方法降低，例如提早停止训练或使用 DP-SGD 进行训练。

对 CIFAR10 模型的成员推理攻击：x 轴表示模型的测试准确率，而 y 轴表示漏洞分数（分数越低代表隐私性越高）。在测试准确率保持不变的情况下漏洞增加，因此提高泛化能力可防止隐私泄漏

毋庸置疑，差异化隐私可帮助降低此类漏洞分数。即便只有少量噪声，漏洞评分也会降低。

在内部使用成员推理测试后，我们将与开发者分享测试结果来帮助他们构建隐私性更高的模型、探索更好的架构选择、使用正则化技术（如提早停止训练、dropout、权重衰减和输入增强）或收集更多数据。最终，此类测试将帮助开发者社区找到更多融入隐私设计原则和数据处理选项的基础架构。

我们希望能够以这个库为起点，开发出强大的隐私测试套件，并将其分享给世界各地的所有机器学习开发者。未来，我们将探讨将成员推理攻击扩展到分类器之外的可行性，并开发新的测试。我们还将探索将之与 TFX 集成，并融入到 TensorFlow 生态系统中。

TFX
https://tensorflow.google.cn/tfx

请发送邮件至 tf-privacy@google.com，告诉我们使用这个新模块的感受。期待着收到您的故事、反馈和建议！

致谢

Yurii Sushko、Andreas Terzis、Miguel Guevara、Niki Kilbertus、Vadym Doroshenko、Borja De Balle Pigem、Ananth Raghunathan。

— 推荐阅读 —

了解更多请点击 “阅读原文” 访问 GitHub。

🌟将我们设为星标

第一时间收到更新提醒

不再错过精彩内容！

分享 💬 点赞 👍 在看 ❤️

以“三连”行动支持优质内容！

登录查看更多

1

相关内容

TensorFlow

Google发布的第二代深度学习系统TensorFlow

【ACMMM2020】小规模行人检测的自模拟学习

【ACMMM2020】小规模行人检测的自模拟学习

专知会员服务

15+阅读 · 2020年9月25日

近期必读的六篇 ICML 2020【因果推理】相关论文

近期必读的六篇 ICML 2020【因果推理】相关论文

专知会员服务

88+阅读 · 2020年9月8日

联邦学习安全与隐私保护研究综述

专知会员服务

127+阅读 · 2020年8月7日

【ICML2020投稿论文-CMU-DeepMind-Google】用于评估跨语言泛化的大规模多语言多任务基准

【ICML2020投稿论文-CMU-DeepMind-Google】用于评估跨语言泛化的大规模多语言多任务基准

专知会员服务

14+阅读 · 2020年3月27日

【中国人民大学】机器学习的隐私保护研究综述

【中国人民大学】机器学习的隐私保护研究综述

专知会员服务

133+阅读 · 2020年3月25日

谷歌推出量子机器学习框架TFQ-TensorFlow Quantum，一个可训练量子模型的机器学习框架

谷歌推出量子机器学习框架TFQ-TensorFlow Quantum，一个可训练量子模型的机器学习框架

专知会员服务

34+阅读 · 2020年3月10日

【伯克利】通过增大模型加速Transformer训练和推理

专知会员服务

45+阅读 · 2020年3月6日

【2020新书】JavaScript神经网络在TensorFlow.js中的深度学习，561页pdf

【2020新书】JavaScript神经网络在TensorFlow.js中的深度学习，561页pdf

专知会员服务

104+阅读 · 2020年2月4日

TensorFlow Lite指南实战《TensorFlow Lite A primer》，附48页PPT

TensorFlow Lite指南实战《TensorFlow Lite A primer》，附48页PPT

专知会员服务

70+阅读 · 2020年1月17日

如何加速NVIDIA gpu上的训练、推理和ML应用？108页ppt，Accelerating training, inference, and ML applications on NVIDIA GPUs

如何加速NVIDIA gpu上的训练、推理和ML应用？108页ppt，Accelerating training, inference, and ML applications on NVIDIA GPUs

专知会员服务

61+阅读 · 2019年12月29日

训练技巧 | 功守道：NLP中的对抗训练 + PyTorch实现

训练技巧 | 功守道：NLP中的对抗训练 + PyTorch实现

PaperWeekly

12+阅读 · 2019年11月13日

AI 在安全、可靠性方面到底取得了哪些进展？斯坦福 AI 实验室进行了总结

AI 在安全、可靠性方面到底取得了哪些进展？斯坦福 AI 实验室进行了总结

人工智能学家

8+阅读 · 2019年7月6日

让数百万台手机训练同一个模型？Google把这套框架开源了

让数百万台手机训练同一个模型？Google把这套框架开源了

AI100

3+阅读 · 2019年3月9日

官方解读：TensorFlow 2.0 新的功能特性

官方解读：TensorFlow 2.0 新的功能特性

云头条

3+阅读 · 2019年1月23日

TF Boys必看！一文搞懂TensorFlow 2.0新架构！

TF Boys必看！一文搞懂TensorFlow 2.0新架构！

引力空间站

19+阅读 · 2019年1月16日

模型大小缩小75%，TensorFlow推出模型优化工具包

模型大小缩小75%，TensorFlow推出模型优化工具包

论智

7+阅读 · 2018年9月19日

差分隐私保护：从入门到脱坑

差分隐私保护：从入门到脱坑

FreeBuf

17+阅读 · 2018年9月10日

【机器学习】Google发布机器学习术语表 (中英对照）

【机器学习】Google发布机器学习术语表 (中英对照）

产业智能官

6+阅读 · 2018年3月24日

ICLR 2018 | 斯坦福大学论文通过对抗训练实现可保证的分布式鲁棒性

ICLR 2018 | 斯坦福大学论文通过对抗训练实现可保证的分布式鲁棒性

机器之心

8+阅读 · 2018年2月23日

终于！谷歌移动端深度学习框架 TensorFlow Lite 正式发布

终于！谷歌移动端深度学习框架 TensorFlow Lite 正式发布

开源中国

3+阅读 · 2017年11月16日

Beyond Accuracy: Behavioral Testing of NLP models with CheckList

Arxiv

11+阅读 · 2020年5月8日

PFLD: A Practical Facial Landmark Detector

Arxiv

5+阅读 · 2019年2月28日

When Truth Discovery Meets Medical Knowledge Graph: Estimating Trustworthiness Degree for Medical Knowledge Condition

Arxiv

4+阅读 · 2018年9月27日

Multi-Hop Knowledge Graph Reasoning with Reward Shaping

Arxiv

5+阅读 · 2018年9月11日

Stylistic Variation in Social Media Part-of-Speech Tagging

Arxiv

4+阅读 · 2018年4月19日

DAiSEE: Towards User Engagement Recognition in the Wild

Arxiv

5+阅读 · 2018年4月12日

Hybrid User Behavioral Analysis with Deep Neural Network for Notifications/Pop-ups Recommendation

Hybrid User Behavioral Analysis with Deep Neural Network for Notifications/Pop-ups Recommendation

Arxiv

6+阅读 · 2018年2月28日

Generating Adversarial Examples with Adversarial Networks

Arxiv

10+阅读 · 2018年1月15日

Neural Response Generation with Dynamic Vocabularies

Arxiv

5+阅读 · 2017年11月30日

SSD: Single Shot MultiBox Detector

Arxiv

5+阅读 · 2016年12月29日

VIP会员

相关主题

机器学习模型

相关VIP内容

【ACMMM2020】小规模行人检测的自模拟学习

【ACMMM2020】小规模行人检测的自模拟学习

专知会员服务

15+阅读 · 2020年9月25日

近期必读的六篇 ICML 2020【因果推理】相关论文

近期必读的六篇 ICML 2020【因果推理】相关论文

专知会员服务

88+阅读 · 2020年9月8日

联邦学习安全与隐私保护研究综述

专知会员服务

127+阅读 · 2020年8月7日

【ICML2020投稿论文-CMU-DeepMind-Google】用于评估跨语言泛化的大规模多语言多任务基准

【ICML2020投稿论文-CMU-DeepMind-Google】用于评估跨语言泛化的大规模多语言多任务基准

专知会员服务

14+阅读 · 2020年3月27日

【中国人民大学】机器学习的隐私保护研究综述

【中国人民大学】机器学习的隐私保护研究综述

专知会员服务

133+阅读 · 2020年3月25日

谷歌推出量子机器学习框架TFQ-TensorFlow Quantum，一个可训练量子模型的机器学习框架

谷歌推出量子机器学习框架TFQ-TensorFlow Quantum，一个可训练量子模型的机器学习框架

专知会员服务

34+阅读 · 2020年3月10日

【伯克利】通过增大模型加速Transformer训练和推理

专知会员服务

45+阅读 · 2020年3月6日

【2020新书】JavaScript神经网络在TensorFlow.js中的深度学习，561页pdf

【2020新书】JavaScript神经网络在TensorFlow.js中的深度学习，561页pdf

专知会员服务

104+阅读 · 2020年2月4日

TensorFlow Lite指南实战《TensorFlow Lite A primer》，附48页PPT

TensorFlow Lite指南实战《TensorFlow Lite A primer》，附48页PPT

专知会员服务

70+阅读 · 2020年1月17日

如何加速NVIDIA gpu上的训练、推理和ML应用？108页ppt，Accelerating training, inference, and ML applications on NVIDIA GPUs

如何加速NVIDIA gpu上的训练、推理和ML应用？108页ppt，Accelerating training, inference, and ML applications on NVIDIA GPUs

专知会员服务

61+阅读 · 2019年12月29日

热门VIP内容

开通专知VIP会员享更多权益服务

新质生成式AI赋能产业变革的实践与路径

用于多模态大模型的离散标记化：全面综述

Nature综述：金融网络中的物理学

【CMU博士论文】通信高效且差分隐私的优化方法

相关资讯

训练技巧 | 功守道：NLP中的对抗训练 + PyTorch实现

训练技巧 | 功守道：NLP中的对抗训练 + PyTorch实现

PaperWeekly

12+阅读 · 2019年11月13日

AI 在安全、可靠性方面到底取得了哪些进展？斯坦福 AI 实验室进行了总结

AI 在安全、可靠性方面到底取得了哪些进展？斯坦福 AI 实验室进行了总结

人工智能学家

8+阅读 · 2019年7月6日

让数百万台手机训练同一个模型？Google把这套框架开源了

让数百万台手机训练同一个模型？Google把这套框架开源了

AI100

3+阅读 · 2019年3月9日

官方解读：TensorFlow 2.0 新的功能特性

官方解读：TensorFlow 2.0 新的功能特性

云头条

3+阅读 · 2019年1月23日

TF Boys必看！一文搞懂TensorFlow 2.0新架构！

TF Boys必看！一文搞懂TensorFlow 2.0新架构！

引力空间站

19+阅读 · 2019年1月16日

模型大小缩小75%，TensorFlow推出模型优化工具包

模型大小缩小75%，TensorFlow推出模型优化工具包

论智

7+阅读 · 2018年9月19日

差分隐私保护：从入门到脱坑

差分隐私保护：从入门到脱坑

FreeBuf

17+阅读 · 2018年9月10日

【机器学习】Google发布机器学习术语表 (中英对照）

【机器学习】Google发布机器学习术语表 (中英对照）

产业智能官

6+阅读 · 2018年3月24日

ICLR 2018 | 斯坦福大学论文通过对抗训练实现可保证的分布式鲁棒性

ICLR 2018 | 斯坦福大学论文通过对抗训练实现可保证的分布式鲁棒性

机器之心

8+阅读 · 2018年2月23日

终于！谷歌移动端深度学习框架 TensorFlow Lite 正式发布

终于！谷歌移动端深度学习框架 TensorFlow Lite 正式发布

开源中国

3+阅读 · 2017年11月16日

相关论文

Beyond Accuracy: Behavioral Testing of NLP models with CheckList

Arxiv

11+阅读 · 2020年5月8日

PFLD: A Practical Facial Landmark Detector

Arxiv

5+阅读 · 2019年2月28日

When Truth Discovery Meets Medical Knowledge Graph: Estimating Trustworthiness Degree for Medical Knowledge Condition

Arxiv

4+阅读 · 2018年9月27日

Multi-Hop Knowledge Graph Reasoning with Reward Shaping

Arxiv

5+阅读 · 2018年9月11日

Stylistic Variation in Social Media Part-of-Speech Tagging

Arxiv

4+阅读 · 2018年4月19日

DAiSEE: Towards User Engagement Recognition in the Wild

Arxiv

5+阅读 · 2018年4月12日

Hybrid User Behavioral Analysis with Deep Neural Network for Notifications/Pop-ups Recommendation

Hybrid User Behavioral Analysis with Deep Neural Network for Notifications/Pop-ups Recommendation

Arxiv

6+阅读 · 2018年2月28日

Generating Adversarial Examples with Adversarial Networks

Arxiv

10+阅读 · 2018年1月15日

Neural Response Generation with Dynamic Vocabularies

Arxiv

5+阅读 · 2017年11月30日

SSD: Single Shot MultiBox Detector

Arxiv

5+阅读 · 2016年12月29日

大家都在搜

大型语言模型

国防科技创新

久别重逢话双塔

无人机航拍交通事故现场勘查处置系统——行业第一的警用事故处理软件

微信扫码咨询专知VIP会员