直播 | AAAI 2021：文本对抗攻防中的对抗训练方法 - 专知

会员服务 ·

0

直播 | AAAI 2021：文本对抗攻防中的对抗训练方法

2021 年 1 月 11 日 PaperWeekly

「AI Drive」是由 PaperWeekly 和 biendata 共同发起的学术直播间，旨在帮助更多的青年学者宣传其最新科研成果。我们一直认为，单向地输出知识并不是一个最好的方式，而有效地反馈和交流可能会让知识的传播更加有意义，从而产生更大的价值。

本期 AI Drive，我们邀请到华中科技大学计算机学院硕士生王晓森，为大家解读其发表于 AAAI 2021 的最新工作。对本期主题感兴趣的小伙伴，1 月 12 日（周二）晚 7 点，我们准时相约 PaperWeekly B 站直播间。

直播信息

深度模型对抗样本最先在图像分类任务中提出，即通过微小扰动使得神经网络产生错误输出。近几年来，研究者发现自然语言处理模型中同样存在对抗样本，并提出一系列的对抗攻击和防御方法。但是由于文本的离散性和语义约束，在图像对抗攻防中被广泛使用的梯度信息和对抗训练防御方法一直未能有效地在基于近义词替换的文本对抗中使用。

本篇工作针对文本分类模型进行研究，提出了：

1. 快速梯度投影攻击：通过投影方式将梯度引入到基于同义词替换的文本对抗攻击，在保证现有攻击成功率的前提下，速度比目前最快的攻击提升了至少 20 倍；

2. 基于快速梯度投影攻击的对抗训练：由于快速梯度投影攻击的高效性，我们利用其实现了对抗训练，显著地提升了深度模型的鲁棒性。

代码和模型公开于：

https://github.com/JHL-HUST/FGPM

本次分享的具体内容有：

文本对抗攻防现状
快速梯度投影算法
基于快速梯度投影攻击的对抗训练
实验结果和分析

嘉宾介绍

王晓森.jpg

王晓森 / 华中科技大学硕士生

王晓森，华中科技大学计算机学院 2019 级硕士生 ，师从何琨教授，主要关注深度学习的对抗样本。

直播地址 & 交流群

本次直播将在 PaperWeekly B 站直播间进行，扫描下方海报二维码或点击阅读原文即可免费观看。线上分享结束后，嘉宾还将在直播交流群内实时 QA，在 PaperWeekly 微信公众号后台回复「AI Drive」，即可获取入群通道。

B 站直播间：

https://live.bilibili.com/14884511

合作伙伴

🔍

现在，在「知乎」也能找到我们了

进入知乎首页搜索「PaperWeekly」

点击「关注」订阅我们的专栏吧

关于PaperWeekly

PaperWeekly 是一个推荐、解读、讨论、报道人工智能前沿论文成果的学术平台。如果你研究或从事 AI 领域，欢迎在公众号后台点击「交流群」，小助手将把你带入 PaperWeekly 的交流群里。

登录查看更多

1

相关内容

对抗训练

【CVPR2021】一种基于知识蒸馏的弱监督图像文本匹配模型

专知会员服务

35+阅读 · 2021年4月8日

【AAAI2021】属性引导对抗训练的自然扰动鲁棒性

专知会员服务

26+阅读 · 2021年1月21日

深度学习的对抗攻击与防御方法综述

专知会员服务

99+阅读 · 2020年12月8日

[NeurIPS 2020]对图神经网络更实际的对抗式攻击

[NeurIPS 2020]对图神经网络更实际的对抗式攻击

专知会员服务

9+阅读 · 2020年11月1日

【NeurIPS 2020】视觉和语言表示学习的大规模对抗性训练

【NeurIPS 2020】视觉和语言表示学习的大规模对抗性训练

专知会员服务

15+阅读 · 2020年10月27日

【ICML2020】对抗的非负矩阵分解

专知会员服务

30+阅读 · 2020年7月31日

自然语言处理中深度学习模型对抗性攻击综述，41页pdf论文

自然语言处理中深度学习模型对抗性攻击综述，41页pdf论文

专知会员服务

63+阅读 · 2020年4月19日

中山大学发布最新《图对抗机器学习》2020综述论文，带你全面了解40+种攻防对抗学习方法

中山大学发布最新《图对抗机器学习》2020综述论文，带你全面了解40+种攻防对抗学习方法

专知会员服务

80+阅读 · 2020年3月13日

【综述】基于图的对抗式攻击和防御，附22页论文下载

【综述】基于图的对抗式攻击和防御，附22页论文下载

专知会员服务

69+阅读 · 2020年3月5日

【综述】深度学习攻防对抗在图像数据、图数据以及文本数据上的应用，附29页PDF

【综述】深度学习攻防对抗在图像数据、图数据以及文本数据上的应用，附29页PDF

专知会员服务

48+阅读 · 2019年11月21日

今晚直播 | 清华大学高天宇：对比学习及其在NLP中的应用

今晚直播 | 清华大学高天宇：对比学习及其在NLP中的应用

PaperWeekly

3+阅读 · 2020年4月16日

今晚直播 | 清华大学王晓智：事件抽取的进展与挑战

今晚直播 | 清华大学王晓智：事件抽取的进展与挑战

PaperWeekly

11+阅读 · 2020年3月26日

PW Live 直播 | 清华大学王晓智：事件抽取的进展与挑战

PW Live 直播 | 清华大学王晓智：事件抽取的进展与挑战

PaperWeekly

6+阅读 · 2020年3月25日

今晚直播！手把手教你学会NLP情感分类技术内核

今晚直播！手把手教你学会NLP情感分类技术内核

PaperWeekly

3+阅读 · 2020年3月4日

一文读懂文本处理中的对抗训练

一文读懂文本处理中的对抗训练

PaperWeekly

22+阅读 · 2019年6月5日

直播 | 基于对抗跨语言多任务学习的微博个性化情感分析

直播 | 基于对抗跨语言多任务学习的微博个性化情感分析

AI科技评论

4+阅读 · 2018年10月9日

直播预告：GAN在网络特征学习中的应用 | PhD Talk #23

直播预告：GAN在网络特征学习中的应用 | PhD Talk #23

PaperWeekly

3+阅读 · 2018年1月9日

今晚直播 | 基于生成模型的事件流研究 + NIPS 2017 论文解读

今晚直播 | 基于生成模型的事件流研究 + NIPS 2017 论文解读

PaperWeekly

5+阅读 · 2017年12月20日

今晚8点：基于强化学习的关系抽取和文本分类 | PhD Talk #18

今晚8点：基于强化学习的关系抽取和文本分类 | PhD Talk #18

PaperWeekly

4+阅读 · 2017年11月22日

基于双语主题模型的跨语言层次分类体系匹配 | 直播预告·PhD Talk #16

基于双语主题模型的跨语言层次分类体系匹配 | 直播预告·PhD Talk #16

PaperWeekly

5+阅读 · 2017年9月12日

Regularizing Neural Networks via Adversarial Model Perturbation

Arxiv

0+阅读 · 2021年4月22日

Model-Targeted Poisoning Attacks with Provable Convergence

Arxiv

0+阅读 · 2021年4月21日

Asymmetric Loss For Multi-Label Classification

Arxiv

6+阅读 · 2020年9月29日

BERT-Based Multi-Head Selection for Joint Entity-Relation Extraction

BERT-Based Multi-Head Selection for Joint Entity-Relation Extraction

Arxiv

6+阅读 · 2019年9月26日

Interpretable Adversarial Training for Text

Interpretable Adversarial Training for Text

Arxiv

5+阅读 · 2019年5月30日

Span Based Open Information Extraction

Arxiv

3+阅读 · 2019年3月1日

Class-Balanced Loss Based on Effective Number of Samples

Arxiv

12+阅读 · 2019年1月16日

Multi-Head Attention with Disagreement Regularization

Arxiv

9+阅读 · 2018年10月24日

Multi-pseudo Regularized Label for Generated Samples in Person Re-Identification

Arxiv

12+阅读 · 2018年1月29日

Generating Adversarial Examples with Adversarial Networks

Arxiv

10+阅读 · 2018年1月15日

VIP会员

相关主题

相关VIP内容

【CVPR2021】一种基于知识蒸馏的弱监督图像文本匹配模型

专知会员服务

35+阅读 · 2021年4月8日

【AAAI2021】属性引导对抗训练的自然扰动鲁棒性

专知会员服务

26+阅读 · 2021年1月21日

深度学习的对抗攻击与防御方法综述

专知会员服务

99+阅读 · 2020年12月8日

[NeurIPS 2020]对图神经网络更实际的对抗式攻击

[NeurIPS 2020]对图神经网络更实际的对抗式攻击

专知会员服务

9+阅读 · 2020年11月1日

【NeurIPS 2020】视觉和语言表示学习的大规模对抗性训练

【NeurIPS 2020】视觉和语言表示学习的大规模对抗性训练

专知会员服务

15+阅读 · 2020年10月27日

【ICML2020】对抗的非负矩阵分解

专知会员服务

30+阅读 · 2020年7月31日

自然语言处理中深度学习模型对抗性攻击综述，41页pdf论文

自然语言处理中深度学习模型对抗性攻击综述，41页pdf论文

专知会员服务

63+阅读 · 2020年4月19日

中山大学发布最新《图对抗机器学习》2020综述论文，带你全面了解40+种攻防对抗学习方法

中山大学发布最新《图对抗机器学习》2020综述论文，带你全面了解40+种攻防对抗学习方法

专知会员服务

80+阅读 · 2020年3月13日

【综述】基于图的对抗式攻击和防御，附22页论文下载

【综述】基于图的对抗式攻击和防御，附22页论文下载

专知会员服务

69+阅读 · 2020年3月5日

【综述】深度学习攻防对抗在图像数据、图数据以及文本数据上的应用，附29页PDF

【综述】深度学习攻防对抗在图像数据、图数据以及文本数据上的应用，附29页PDF

专知会员服务

48+阅读 · 2019年11月21日

热门VIP内容

开通专知VIP会员享更多权益服务

在无标注条件下适配视觉—语言模型：全面综述

面向视觉语言模型的持续学习：遗忘之外的综述与分类体系

《高能激光武器》22页slides

新书册《几何深度学习的数学基础》

相关资讯

今晚直播 | 清华大学高天宇：对比学习及其在NLP中的应用

今晚直播 | 清华大学高天宇：对比学习及其在NLP中的应用

PaperWeekly

3+阅读 · 2020年4月16日

今晚直播 | 清华大学王晓智：事件抽取的进展与挑战

今晚直播 | 清华大学王晓智：事件抽取的进展与挑战

PaperWeekly

11+阅读 · 2020年3月26日

PW Live 直播 | 清华大学王晓智：事件抽取的进展与挑战

PW Live 直播 | 清华大学王晓智：事件抽取的进展与挑战

PaperWeekly

6+阅读 · 2020年3月25日

今晚直播！手把手教你学会NLP情感分类技术内核

今晚直播！手把手教你学会NLP情感分类技术内核

PaperWeekly

3+阅读 · 2020年3月4日

一文读懂文本处理中的对抗训练

一文读懂文本处理中的对抗训练

PaperWeekly

22+阅读 · 2019年6月5日

直播 | 基于对抗跨语言多任务学习的微博个性化情感分析

直播 | 基于对抗跨语言多任务学习的微博个性化情感分析

AI科技评论

4+阅读 · 2018年10月9日

直播预告：GAN在网络特征学习中的应用 | PhD Talk #23

直播预告：GAN在网络特征学习中的应用 | PhD Talk #23

PaperWeekly

3+阅读 · 2018年1月9日

今晚直播 | 基于生成模型的事件流研究 + NIPS 2017 论文解读

今晚直播 | 基于生成模型的事件流研究 + NIPS 2017 论文解读

PaperWeekly

5+阅读 · 2017年12月20日

今晚8点：基于强化学习的关系抽取和文本分类 | PhD Talk #18

今晚8点：基于强化学习的关系抽取和文本分类 | PhD Talk #18

PaperWeekly

4+阅读 · 2017年11月22日

基于双语主题模型的跨语言层次分类体系匹配 | 直播预告·PhD Talk #16

基于双语主题模型的跨语言层次分类体系匹配 | 直播预告·PhD Talk #16

PaperWeekly

5+阅读 · 2017年9月12日

相关论文

Regularizing Neural Networks via Adversarial Model Perturbation

Arxiv

0+阅读 · 2021年4月22日

Model-Targeted Poisoning Attacks with Provable Convergence

Arxiv

0+阅读 · 2021年4月21日

Asymmetric Loss For Multi-Label Classification

Arxiv

6+阅读 · 2020年9月29日

BERT-Based Multi-Head Selection for Joint Entity-Relation Extraction

BERT-Based Multi-Head Selection for Joint Entity-Relation Extraction

Arxiv

6+阅读 · 2019年9月26日

Interpretable Adversarial Training for Text

Interpretable Adversarial Training for Text

Arxiv

5+阅读 · 2019年5月30日

Span Based Open Information Extraction

Arxiv

3+阅读 · 2019年3月1日

Class-Balanced Loss Based on Effective Number of Samples

Arxiv

12+阅读 · 2019年1月16日

Multi-Head Attention with Disagreement Regularization

Arxiv

9+阅读 · 2018年10月24日

Multi-pseudo Regularized Label for Generated Samples in Person Re-Identification

Arxiv

12+阅读 · 2018年1月29日

Generating Adversarial Examples with Adversarial Networks

Arxiv

10+阅读 · 2018年1月15日

大家都在搜

国防科技创新

大型语言模型

无人机集群

久别重逢话双塔

无人机航拍交通事故现场勘查处置系统——行业第一的警用事故处理软件

微信扫码咨询专知VIP会员