【复旦大学-SP2020】NLP语言模型隐私泄漏风险 - 专知VIP

会员服务 ·

4

语言模型 · 隐私泄露风险 ·

2020 年 4 月 20 日

【复旦大学-SP2020】NLP语言模型隐私泄漏风险

专知会员服务

专知，提供专业可信的知识分发服务，让认知协作更快更好！

最近，在自然语言处理(NLP)中构建通用语言模型(如谷歌的Bert和OpenAI的GPT-2)用于文本特征提取的新范式出现了。对于下游建模，已经出现并开始在各种下游NLP任务和现实世界系统(例如，谷歌的搜索引擎)中发现它的应用。为了获得通用的文本嵌入，这些语言模型具有高度复杂的体系结构，具有数百万个可学习的参数，通常在使用之前对数十亿个句子进行预处理。众所周知，这种做法确实提高了许多下游NLP任务的最新性能。但是，改进的实用程序不是免费的。我们发现，通用语言模型中的文本嵌入会从纯文本中捕获很多敏感信息。一旦被对手访问，嵌入信息可以被反向设计，以披露受害者的敏感信息，以进行进一步的骚扰。尽管这样的隐私风险可能会对这些有前途的NLP工具的未来影响造成真正的威胁，但是目前还没有针对主流行业级语言模型的公开攻击或系统评估。为了弥补这一差距，我们首次系统地研究了8种最先进的语言模型和4个不同的案例。通过构建两个新的攻击类，我们的研究表明上述隐私风险确实存在，并可能对通用语言模型在身份、基因组、医疗保健和位置等敏感数据上的应用造成实际威胁。例如，当我们从病人的医疗描述的Bert embeddings中推断出精确的疾病位置时，我们向几乎没有先验知识的对手展示了大约75%的准确性。作为可能的对策，我们提出了4种不同的防御(通过舍入、差异隐私、对抗性训练和子空间投影)来混淆无保护的嵌入，以达到缓解的目的。在广泛评估的基础上，我们还对每一种防御所带来的效用-隐私权衡进行了初步分析，希望能对未来的缓解研究有所帮助。

成为VIP会员查看完整内容

25

相关内容

语言模型

【ICML2020-哈佛】深度语言表示中可分流形

【ICML2020-哈佛】深度语言表示中可分流形

专知会员服务

13+阅读 · 2020年6月2日

【2020最新干货综述】基于知识图谱嵌入的链接预测综述， 43页pdf

【2020最新干货综述】基于知识图谱嵌入的链接预测综述， 43页pdf

专知会员服务

167+阅读 · 2020年5月24日

【微软】大型神经语言模型的对抗性训练，Adversarial Training for Large Neural Language Models

【微软】大型神经语言模型的对抗性训练，Adversarial Training for Large Neural Language Models

专知会员服务

51+阅读 · 2020年5月3日

自然语言处理中深度学习模型对抗性攻击综述，41页pdf论文

自然语言处理中深度学习模型对抗性攻击综述，41页pdf论文

专知会员服务

63+阅读 · 2020年4月19日

【ACL2020-Allen AI】预训练语言模型中的无监督域聚类

【ACL2020-Allen AI】预训练语言模型中的无监督域聚类

专知会员服务

24+阅读 · 2020年4月7日

【复旦大学】最新《预训练语言模型》2020综述论文大全，50+PTMs分类体系，25页pdf205篇参考文献

【复旦大学】最新《预训练语言模型》2020综述论文大全，50+PTMs分类体系，25页pdf205篇参考文献

专知会员服务

105+阅读 · 2020年3月19日

AAAI 2020 | 滴滴自主提出基于注意力机制的异构图神经网络模型

专知会员服务

53+阅读 · 2020年2月26日

AAAI2020最新「迁移表示学习最新进展」247页PPT，宾夕法尼亚大学

AAAI2020最新「迁移表示学习最新进展」247页PPT，宾夕法尼亚大学

专知会员服务

112+阅读 · 2020年2月11日

安全和健壮的医疗机器学习综述，附22页pdf

安全和健壮的医疗机器学习综述，附22页pdf

专知会员服务

47+阅读 · 2020年1月25日

中科院信工所发布《深度学习系统的隐私与安全》综述论文，187篇文献总结

中科院信工所发布《深度学习系统的隐私与安全》综述论文，187篇文献总结

专知会员服务

103+阅读 · 2019年12月5日

AAAI 2020 开源论文 | 一种针对图嵌入模型的受限黑盒对抗攻击框架

AAAI 2020 开源论文 | 一种针对图嵌入模型的受限黑盒对抗攻击框架

PaperWeekly

6+阅读 · 2020年2月21日

AAAI 2020论文解读：关注实体以更好地理解文本

AAAI 2020论文解读：关注实体以更好地理解文本

AI科技评论

17+阅读 · 2019年11月20日

一文读懂最强中文NLP预训练模型ERNIE

一文读懂最强中文NLP预训练模型ERNIE

AINLP

25+阅读 · 2019年10月22日

NLP领域中的迁移学习现状

NLP领域中的迁移学习现状

AI科技评论

7+阅读 · 2019年9月1日

【干货】NLP中的迁移学习教程来啦！（238页PPT下载）

【干货】NLP中的迁移学习教程来啦！（238页PPT下载）

新智元

35+阅读 · 2019年6月3日

百度提出ERNIE，多项中文NLP任务表现出色（已开源）

百度提出ERNIE，多项中文NLP任务表现出色（已开源）

AI100

33+阅读 · 2019年3月16日

自然语言处理中的语言模型预训练方法

自然语言处理中的语言模型预训练方法

PaperWeekly

14+阅读 · 2018年10月21日

白雪 | NLP加持知识图谱在金融事件挖掘中的应用

白雪 | NLP加持知识图谱在金融事件挖掘中的应用

开放知识图谱

14+阅读 · 2018年9月21日

NLP通用模型诞生？一个模型搞定十大自然语言常见任务

NLP通用模型诞生？一个模型搞定十大自然语言常见任务

人工智能头条

10+阅读 · 2018年6月29日

2017深度学习NLP进展与趋势

2017深度学习NLP进展与趋势

云栖社区

7+阅读 · 2017年12月17日

Deflecting Adversarial Attacks

Deflecting Adversarial Attacks

Arxiv

8+阅读 · 2020年2月18日

Adversarial Attacks and Defenses in Images, Graphs and Text: A Review

Adversarial Attacks and Defenses in Images, Graphs and Text: A Review

Arxiv

17+阅读 · 2019年10月9日

Do Transformer Attention Heads Provide Transparency in Abstractive Summarization?

Do Transformer Attention Heads Provide Transparency in Abstractive Summarization?

Arxiv

3+阅读 · 2019年7月8日

Context-aware Neural-based Dialog Act Classification on Automatically Generated Transcriptions

Context-aware Neural-based Dialog Act Classification on Automatically Generated Transcriptions

Arxiv

3+阅读 · 2019年2月28日

PFLD: A Practical Facial Landmark Detector

Arxiv

5+阅读 · 2019年2月28日

Notes on Deep Learning for NLP

Arxiv

22+阅读 · 2018年8月30日

Adversarial Meta-Learning

Arxiv

7+阅读 · 2018年6月8日

Fooling Vision and Language Models Despite Localization and Attention Mechanism

Arxiv

7+阅读 · 2018年4月6日

Tiny SSD: A Tiny Single-shot Detection Deep Convolutional Neural Network for Real-time Embedded Object Detection

Arxiv

7+阅读 · 2018年2月19日

Graph Attention Networks

Arxiv

10+阅读 · 2018年2月4日

VIP会员

相关主题

隐私泄露风险

相关VIP内容

【ICML2020-哈佛】深度语言表示中可分流形

【ICML2020-哈佛】深度语言表示中可分流形

专知会员服务

13+阅读 · 2020年6月2日

【2020最新干货综述】基于知识图谱嵌入的链接预测综述， 43页pdf

【2020最新干货综述】基于知识图谱嵌入的链接预测综述， 43页pdf

专知会员服务

167+阅读 · 2020年5月24日

【微软】大型神经语言模型的对抗性训练，Adversarial Training for Large Neural Language Models

【微软】大型神经语言模型的对抗性训练，Adversarial Training for Large Neural Language Models

专知会员服务

51+阅读 · 2020年5月3日

自然语言处理中深度学习模型对抗性攻击综述，41页pdf论文

自然语言处理中深度学习模型对抗性攻击综述，41页pdf论文

专知会员服务

63+阅读 · 2020年4月19日

【ACL2020-Allen AI】预训练语言模型中的无监督域聚类

【ACL2020-Allen AI】预训练语言模型中的无监督域聚类

专知会员服务

24+阅读 · 2020年4月7日

【复旦大学】最新《预训练语言模型》2020综述论文大全，50+PTMs分类体系，25页pdf205篇参考文献

【复旦大学】最新《预训练语言模型》2020综述论文大全，50+PTMs分类体系，25页pdf205篇参考文献

专知会员服务

105+阅读 · 2020年3月19日

AAAI 2020 | 滴滴自主提出基于注意力机制的异构图神经网络模型

专知会员服务

53+阅读 · 2020年2月26日

AAAI2020最新「迁移表示学习最新进展」247页PPT，宾夕法尼亚大学

AAAI2020最新「迁移表示学习最新进展」247页PPT，宾夕法尼亚大学

专知会员服务

112+阅读 · 2020年2月11日

安全和健壮的医疗机器学习综述，附22页pdf

安全和健壮的医疗机器学习综述，附22页pdf

专知会员服务

47+阅读 · 2020年1月25日

中科院信工所发布《深度学习系统的隐私与安全》综述论文，187篇文献总结

中科院信工所发布《深度学习系统的隐私与安全》综述论文，187篇文献总结

专知会员服务

103+阅读 · 2019年12月5日

热门VIP内容

开通专知VIP会员享更多权益服务

小规模训练指南：打造世界级大语言模型的关键方法

无人机编队飞行：复杂环境中作战的策略、挑战与应用

大模型APP，AI时代第一个爆款

从数据中心视角出发的高效大语言模型训练综述

相关资讯

AAAI 2020 开源论文 | 一种针对图嵌入模型的受限黑盒对抗攻击框架

AAAI 2020 开源论文 | 一种针对图嵌入模型的受限黑盒对抗攻击框架

PaperWeekly

6+阅读 · 2020年2月21日

AAAI 2020论文解读：关注实体以更好地理解文本

AAAI 2020论文解读：关注实体以更好地理解文本

AI科技评论

17+阅读 · 2019年11月20日

一文读懂最强中文NLP预训练模型ERNIE

一文读懂最强中文NLP预训练模型ERNIE

AINLP

25+阅读 · 2019年10月22日

NLP领域中的迁移学习现状

NLP领域中的迁移学习现状

AI科技评论

7+阅读 · 2019年9月1日

【干货】NLP中的迁移学习教程来啦！（238页PPT下载）

【干货】NLP中的迁移学习教程来啦！（238页PPT下载）

新智元

35+阅读 · 2019年6月3日

百度提出ERNIE，多项中文NLP任务表现出色（已开源）

百度提出ERNIE，多项中文NLP任务表现出色（已开源）

AI100

33+阅读 · 2019年3月16日

自然语言处理中的语言模型预训练方法

自然语言处理中的语言模型预训练方法

PaperWeekly

14+阅读 · 2018年10月21日

白雪 | NLP加持知识图谱在金融事件挖掘中的应用

白雪 | NLP加持知识图谱在金融事件挖掘中的应用

开放知识图谱

14+阅读 · 2018年9月21日

NLP通用模型诞生？一个模型搞定十大自然语言常见任务

NLP通用模型诞生？一个模型搞定十大自然语言常见任务

人工智能头条

10+阅读 · 2018年6月29日

2017深度学习NLP进展与趋势

2017深度学习NLP进展与趋势

云栖社区

7+阅读 · 2017年12月17日

相关论文

Deflecting Adversarial Attacks

Deflecting Adversarial Attacks

Arxiv

8+阅读 · 2020年2月18日

Adversarial Attacks and Defenses in Images, Graphs and Text: A Review

Adversarial Attacks and Defenses in Images, Graphs and Text: A Review

Arxiv

17+阅读 · 2019年10月9日

Do Transformer Attention Heads Provide Transparency in Abstractive Summarization?

Do Transformer Attention Heads Provide Transparency in Abstractive Summarization?

Arxiv

3+阅读 · 2019年7月8日

Context-aware Neural-based Dialog Act Classification on Automatically Generated Transcriptions

Context-aware Neural-based Dialog Act Classification on Automatically Generated Transcriptions

Arxiv

3+阅读 · 2019年2月28日

PFLD: A Practical Facial Landmark Detector

Arxiv

5+阅读 · 2019年2月28日

Notes on Deep Learning for NLP

Arxiv

22+阅读 · 2018年8月30日

Adversarial Meta-Learning

Arxiv

7+阅读 · 2018年6月8日

Fooling Vision and Language Models Despite Localization and Attention Mechanism

Arxiv

7+阅读 · 2018年4月6日

Tiny SSD: A Tiny Single-shot Detection Deep Convolutional Neural Network for Real-time Embedded Object Detection

Arxiv

7+阅读 · 2018年2月19日

Graph Attention Networks

Arxiv

10+阅读 · 2018年2月4日

微信扫码咨询专知VIP会员