直播 | AAAI 2021:文本对抗攻防中的对抗训练方法

2021 年 1 月 11 日 PaperWeekly


「AI Drive」是由 PaperWeekly 和 biendata 共同发起的学术直播间,旨在帮助更多的青年学者宣传其最新科研成果。我们一直认为,单向地输出知识并不是一个最好的方式,而有效地反馈和交流可能会让知识的传播更加有意义,从而产生更大的价值。

本期 AI Drive,我们邀请到华中科技大学计算机学院硕士生王晓森,为大家解读其发表于 AAAI 2021 的最新工作对本期主题感兴趣的小伙伴,1 月 12 日(周二)晚 7 点,我们准时相约 PaperWeekly B 站直播间。



直播信息




深度模型对抗样本最先在图像分类任务中提出,即通过微小扰动使得神经网络产生错误输出。近几年来,研究者发现自然语言处理模型中同样存在对抗样本,并提出一系列的对抗攻击和防御方法。但是由于文本的离散性和语义约束,在图像对抗攻防中被广泛使用的梯度信息和对抗训练防御方法一直未能有效地在基于近义词替换的文本对抗中使用。

本篇工作针对文本分类模型进行研究,提出了: 

1. 快速梯度投影攻击:通过投影方式将梯度引入到基于同义词替换的文本对抗攻击,在保证现有攻击成功率的前提下,速度比目前最快的攻击提升了至少 20 倍;

2. 基于快速梯度投影攻击的对抗训练:由于快速梯度投影攻击的高效性,我们利用其实现了对抗训练,显著地提升了深度模型的鲁棒性。 

代码和模型公开于:
https://github.com/JHL-HUST/FGPM

本次分享的具体内容有:  
  • 文本对抗攻防现状

  • 快速梯度投影算法

  • 基于快速梯度投影攻击的对抗训练

  • 实验结果和分析



嘉宾介绍


 王晓森  华中科技大学硕士生  


王晓森,华中科技大学计算机学院 2019 级硕士生 ,师从何琨教授,主要关注深度学习的对抗样本。



直播地址 & 交流群




本次直播将在 PaperWeekly B 站直播间进行,扫描下方海报二维码点击阅读原文即可免费观看。线上分享结束后,嘉宾还将在直播交流群内实时 QA,在 PaperWeekly 微信公众号后台回复「AI Drive」,即可获取入群通道


B 站直播间:

https://live.bilibili.com/14884511



合作伙伴







🔍


现在,在「知乎」也能找到我们了

进入知乎首页搜索「PaperWeekly」

点击「关注」订阅我们的专栏吧



关于PaperWeekly


PaperWeekly 是一个推荐、解读、讨论、报道人工智能前沿论文成果的学术平台。如果你研究或从事 AI 领域,欢迎在公众号后台点击「交流群」,小助手将把你带入 PaperWeekly 的交流群里。



登录查看更多
1

相关内容

专知会员服务
25+阅读 · 2021年1月21日
专知会员服务
95+阅读 · 2020年12月8日
[NeurIPS 2020]对图神经网络更实际的对抗式攻击
专知会员服务
8+阅读 · 2020年11月1日
【NeurIPS 2020】视觉和语言表示学习的大规模对抗性训练
专知会员服务
14+阅读 · 2020年10月27日
专知会员服务
29+阅读 · 2020年7月31日
【综述】基于图的对抗式攻击和防御,附22页论文下载
专知会员服务
68+阅读 · 2020年3月5日
一文读懂文本处理中的对抗训练
PaperWeekly
22+阅读 · 2019年6月5日
Arxiv
6+阅读 · 2020年9月29日
Interpretable Adversarial Training for Text
Arxiv
5+阅读 · 2019年5月30日
Arxiv
3+阅读 · 2019年3月1日
Arxiv
9+阅读 · 2018年10月24日
VIP会员
相关VIP内容
专知会员服务
25+阅读 · 2021年1月21日
专知会员服务
95+阅读 · 2020年12月8日
[NeurIPS 2020]对图神经网络更实际的对抗式攻击
专知会员服务
8+阅读 · 2020年11月1日
【NeurIPS 2020】视觉和语言表示学习的大规模对抗性训练
专知会员服务
14+阅读 · 2020年10月27日
专知会员服务
29+阅读 · 2020年7月31日
【综述】基于图的对抗式攻击和防御,附22页论文下载
专知会员服务
68+阅读 · 2020年3月5日
相关论文
Top
微信扫码咨询专知VIP会员