【复旦大学-SP2020】NLP语言模型隐私泄漏风险 - 专知

会员服务 ·

1

【复旦大学-SP2020】NLP语言模型隐私泄漏风险

2020 年 4 月 20 日 专知

最近，在自然语言处理(NLP)中构建通用语言模型(如谷歌的Bert和OpenAI的GPT-2)用于文本特征提取的新范式出现了。对于下游建模，已经出现并开始在各种下游NLP任务和现实世界系统(例如，谷歌的搜索引擎)中发现它的应用。为了获得通用的文本嵌入，这些语言模型具有高度复杂的体系结构，具有数百万个可学习的参数，通常在使用之前对数十亿个句子进行预处理。众所周知，这种做法确实提高了许多下游NLP任务的最新性能。但是，改进的实用程序不是免费的。我们发现，通用语言模型中的文本嵌入会从纯文本中捕获很多敏感信息。一旦被对手访问，嵌入信息可以被反向设计，以披露受害者的敏感信息，以进行进一步的骚扰。尽管这样的隐私风险可能会对这些有前途的NLP工具的未来影响造成真正的威胁，但是目前还没有针对主流行业级语言模型的公开攻击或系统评估。为了弥补这一差距，我们首次系统地研究了8种最先进的语言模型和4个不同的案例。通过构建两个新的攻击类，我们的研究表明上述隐私风险确实存在，并可能对通用语言模型在身份、基因组、医疗保健和位置等敏感数据上的应用造成实际威胁。例如，当我们从病人的医疗描述的Bert embeddings中推断出精确的疾病位置时，我们向几乎没有先验知识的对手展示了大约75%的准确性。作为可能的对策，我们提出了4种不同的防御(通过舍入、差异隐私、对抗性训练和子空间投影)来混淆无保护的嵌入，以达到缓解的目的。在广泛评估的基础上，我们还对每一种防御所带来的效用-隐私权衡进行了初步分析，希望能对未来的缓解研究有所帮助。

https://www.computer.org/csdl/proceedings-article/sp/2020/349700b471/1j2LgooZ4fS

专知便捷查看

便捷下载，请关注专知公众号（点击上方蓝色专知关注）

后台回复“PRLM” 就可以获取《【复旦大学-SP2020】NLP语言模型隐私泄漏风险》专知下载链接

专知，专业可信的人工智能知识分发，让认知协作更快更好！欢迎注册登录专知www.zhuanzhi.ai，获取5000+AI主题干货知识资料！

欢迎微信扫一扫加入专知人工智能知识星球群，获取最新AI专业干货知识教程资料和与专家交流咨询！

点击“ 阅读原文 ”，了解使用专知 ，查看获取5000+AI主题知识资源

登录查看更多

10

相关内容

语言模型

【ICML2020-哈佛】深度语言表示中可分流形

【ICML2020-哈佛】深度语言表示中可分流形

专知会员服务

13+阅读 · 2020年6月2日

【2020最新干货综述】基于知识图谱嵌入的链接预测综述， 43页pdf

【2020最新干货综述】基于知识图谱嵌入的链接预测综述， 43页pdf

专知会员服务

167+阅读 · 2020年5月24日

【KDD2020-MSU】图结构学习的鲁棒图神经网络，克服对抗攻击提升GNN防御能力

【KDD2020-MSU】图结构学习的鲁棒图神经网络，克服对抗攻击提升GNN防御能力

专知会员服务

44+阅读 · 2020年5月21日

【微软】大型神经语言模型的对抗性训练，Adversarial Training for Large Neural Language Models

【微软】大型神经语言模型的对抗性训练，Adversarial Training for Large Neural Language Models

专知会员服务

51+阅读 · 2020年5月3日

【ACL2020-Allen AI】预训练语言模型中的无监督域聚类

【ACL2020-Allen AI】预训练语言模型中的无监督域聚类

专知会员服务

24+阅读 · 2020年4月7日

【MIT】对抗鲁棒性的流形正则化，Manifold Regularization for Adversarial Robustness

【MIT】对抗鲁棒性的流形正则化，Manifold Regularization for Adversarial Robustness

专知会员服务

28+阅读 · 2020年3月11日

AAAI 2020 | 滴滴自主提出基于注意力机制的异构图神经网络模型

专知会员服务

53+阅读 · 2020年2月26日

【Google AI新论文】REALM:检索增强语言模型预训练，QA的SOTA提升4-16%准确性

【Google AI新论文】REALM:检索增强语言模型预训练，QA的SOTA提升4-16%准确性

专知会员服务

45+阅读 · 2020年2月12日

安全和健壮的医疗机器学习综述，附22页pdf

安全和健壮的医疗机器学习综述，附22页pdf

专知会员服务

47+阅读 · 2020年1月25日

中科院信工所发布《深度学习系统的隐私与安全》综述论文，187篇文献总结

中科院信工所发布《深度学习系统的隐私与安全》综述论文，187篇文献总结

专知会员服务

103+阅读 · 2019年12月5日

BERT技术体系综述论文：40项分析探究BERT如何work

BERT技术体系综述论文：40项分析探究BERT如何work

专知

50+阅读 · 2020年3月1日

【Google AI新论文】REALM:检索增强语言模型预训练，QA的SOTA提升4-16%准确性

【Google AI新论文】REALM:检索增强语言模型预训练，QA的SOTA提升4-16%准确性

专知

12+阅读 · 2020年2月12日

一文读懂最强中文NLP预训练模型ERNIE

一文读懂最强中文NLP预训练模型ERNIE

AINLP

25+阅读 · 2019年10月22日

最新《生成式对抗网络GAN进展》论文

最新《生成式对抗网络GAN进展》论文

专知

95+阅读 · 2019年4月5日

【最新综述】无监督网络表示学习综述，附18页全文下载

【最新综述】无监督网络表示学习综述，附18页全文下载

专知

28+阅读 · 2019年3月20日

【NLP】Facebook推出最新跨语言预训练模型，刷新多项跨语言任务记录

【NLP】Facebook推出最新跨语言预训练模型，刷新多项跨语言任务记录

专知

8+阅读 · 2019年1月24日

微软亚洲研究院周明老师48页《自然语言处理：进展，机会，挑战》PPT

微软亚洲研究院周明老师48页《自然语言处理：进展，机会，挑战》PPT

专知

10+阅读 · 2018年11月29日

白雪 | NLP加持知识图谱在金融事件挖掘中的应用

白雪 | NLP加持知识图谱在金融事件挖掘中的应用

开放知识图谱

14+阅读 · 2018年9月21日

【干货】ACL 2018 鲁棒、无偏的NLP训练方法

【干货】ACL 2018 鲁棒、无偏的NLP训练方法

专知

4+阅读 · 2018年7月25日

从Facebook、百度“隐私门”看企业对用户隐私保护的责任何在

从Facebook、百度“隐私门”看企业对用户隐私保护的责任何在

FreeBuf

7+阅读 · 2018年3月30日

Deflecting Adversarial Attacks

Deflecting Adversarial Attacks

Arxiv

8+阅读 · 2020年2月18日

Differentiable Reasoning on Large Knowledge Bases and Natural Language

Arxiv

12+阅读 · 2019年12月17日

Do Transformer Attention Heads Provide Transparency in Abstractive Summarization?

Do Transformer Attention Heads Provide Transparency in Abstractive Summarization?

Arxiv

3+阅读 · 2019年7月8日

Context-aware Neural-based Dialog Act Classification on Automatically Generated Transcriptions

Context-aware Neural-based Dialog Act Classification on Automatically Generated Transcriptions

Arxiv

3+阅读 · 2019年2月28日

Notes on Deep Learning for NLP

Arxiv

22+阅读 · 2018年8月30日

End-to-end Speech Recognition with Word-based RNN Language Models

End-to-end Speech Recognition with Word-based RNN Language Models

Arxiv

3+阅读 · 2018年8月8日

Meta-Learning with Latent Embedding Optimization

Meta-Learning with Latent Embedding Optimization

Arxiv

6+阅读 · 2018年7月16日

Adversarial Meta-Learning

Arxiv

7+阅读 · 2018年6月8日

Self-Attention Generative Adversarial Networks

Arxiv

8+阅读 · 2018年5月21日

Adversarial Feature Augmentation for Unsupervised Domain Adaptation

Arxiv

6+阅读 · 2018年5月4日

VIP会员

相关主题

相关VIP内容

【ICML2020-哈佛】深度语言表示中可分流形

【ICML2020-哈佛】深度语言表示中可分流形

专知会员服务

13+阅读 · 2020年6月2日

【2020最新干货综述】基于知识图谱嵌入的链接预测综述， 43页pdf

【2020最新干货综述】基于知识图谱嵌入的链接预测综述， 43页pdf

专知会员服务

167+阅读 · 2020年5月24日

【KDD2020-MSU】图结构学习的鲁棒图神经网络，克服对抗攻击提升GNN防御能力

【KDD2020-MSU】图结构学习的鲁棒图神经网络，克服对抗攻击提升GNN防御能力

专知会员服务

44+阅读 · 2020年5月21日

【微软】大型神经语言模型的对抗性训练，Adversarial Training for Large Neural Language Models

【微软】大型神经语言模型的对抗性训练，Adversarial Training for Large Neural Language Models

专知会员服务

51+阅读 · 2020年5月3日

【ACL2020-Allen AI】预训练语言模型中的无监督域聚类

【ACL2020-Allen AI】预训练语言模型中的无监督域聚类

专知会员服务

24+阅读 · 2020年4月7日

【MIT】对抗鲁棒性的流形正则化，Manifold Regularization for Adversarial Robustness

【MIT】对抗鲁棒性的流形正则化，Manifold Regularization for Adversarial Robustness

专知会员服务

28+阅读 · 2020年3月11日

AAAI 2020 | 滴滴自主提出基于注意力机制的异构图神经网络模型

专知会员服务

53+阅读 · 2020年2月26日

【Google AI新论文】REALM:检索增强语言模型预训练，QA的SOTA提升4-16%准确性

【Google AI新论文】REALM:检索增强语言模型预训练，QA的SOTA提升4-16%准确性

专知会员服务

45+阅读 · 2020年2月12日

安全和健壮的医疗机器学习综述，附22页pdf

安全和健壮的医疗机器学习综述，附22页pdf

专知会员服务

47+阅读 · 2020年1月25日

中科院信工所发布《深度学习系统的隐私与安全》综述论文，187篇文献总结

中科院信工所发布《深度学习系统的隐私与安全》综述论文，187篇文献总结

专知会员服务

103+阅读 · 2019年12月5日

热门VIP内容

开通专知VIP会员享更多权益服务

《美陆军徒步机动作战条令手册》最新168页

【博士论文】基于不确定性的可靠性：现代机器学习中的选择性预测与可信部署

军事后勤数字化未来展望

《美海军后勤体系整合与创新挑战》最新报告

相关资讯

BERT技术体系综述论文：40项分析探究BERT如何work

BERT技术体系综述论文：40项分析探究BERT如何work

专知

50+阅读 · 2020年3月1日

【Google AI新论文】REALM:检索增强语言模型预训练，QA的SOTA提升4-16%准确性

【Google AI新论文】REALM:检索增强语言模型预训练，QA的SOTA提升4-16%准确性

专知

12+阅读 · 2020年2月12日

一文读懂最强中文NLP预训练模型ERNIE

一文读懂最强中文NLP预训练模型ERNIE

AINLP

25+阅读 · 2019年10月22日

最新《生成式对抗网络GAN进展》论文

最新《生成式对抗网络GAN进展》论文

专知

95+阅读 · 2019年4月5日

【最新综述】无监督网络表示学习综述，附18页全文下载

【最新综述】无监督网络表示学习综述，附18页全文下载

专知

28+阅读 · 2019年3月20日

【NLP】Facebook推出最新跨语言预训练模型，刷新多项跨语言任务记录

【NLP】Facebook推出最新跨语言预训练模型，刷新多项跨语言任务记录

专知

8+阅读 · 2019年1月24日

微软亚洲研究院周明老师48页《自然语言处理：进展，机会，挑战》PPT

微软亚洲研究院周明老师48页《自然语言处理：进展，机会，挑战》PPT

专知

10+阅读 · 2018年11月29日

白雪 | NLP加持知识图谱在金融事件挖掘中的应用

白雪 | NLP加持知识图谱在金融事件挖掘中的应用

开放知识图谱

14+阅读 · 2018年9月21日

【干货】ACL 2018 鲁棒、无偏的NLP训练方法

【干货】ACL 2018 鲁棒、无偏的NLP训练方法

专知

4+阅读 · 2018年7月25日

从Facebook、百度“隐私门”看企业对用户隐私保护的责任何在

从Facebook、百度“隐私门”看企业对用户隐私保护的责任何在

FreeBuf

7+阅读 · 2018年3月30日

相关论文

Deflecting Adversarial Attacks

Deflecting Adversarial Attacks

Arxiv

8+阅读 · 2020年2月18日

Differentiable Reasoning on Large Knowledge Bases and Natural Language

Arxiv

12+阅读 · 2019年12月17日

Do Transformer Attention Heads Provide Transparency in Abstractive Summarization?

Do Transformer Attention Heads Provide Transparency in Abstractive Summarization?

Arxiv

3+阅读 · 2019年7月8日

Context-aware Neural-based Dialog Act Classification on Automatically Generated Transcriptions

Context-aware Neural-based Dialog Act Classification on Automatically Generated Transcriptions

Arxiv

3+阅读 · 2019年2月28日

Notes on Deep Learning for NLP

Arxiv

22+阅读 · 2018年8月30日

End-to-end Speech Recognition with Word-based RNN Language Models

End-to-end Speech Recognition with Word-based RNN Language Models

Arxiv

3+阅读 · 2018年8月8日

Meta-Learning with Latent Embedding Optimization

Meta-Learning with Latent Embedding Optimization

Arxiv

6+阅读 · 2018年7月16日

Adversarial Meta-Learning

Arxiv

7+阅读 · 2018年6月8日

Self-Attention Generative Adversarial Networks

Arxiv

8+阅读 · 2018年5月21日

Adversarial Feature Augmentation for Unsupervised Domain Adaptation

Arxiv

6+阅读 · 2018年5月4日

大家都在搜

无人机集群

国防科技创新

久别重逢话双塔

软件无线电

论文浅尝 - ICLR2020 | 通过神经逻辑归纳学习有效地解释

微信扫码咨询专知VIP会员