「AI Drive」是由 PaperWeekly 和 biendata 共同发起的学术直播间,旨在帮助更多的青年学者宣传其最新科研成果。我们一直认为,单向地输出知识并不是一个最好的方式,而有效地反馈和交流可能会让知识的传播更加有意义,从而产生更大的价值。
本期 AI Drive,我们邀请到华中科技大学计算机学院硕士生王晓森,为大家解读其发表于 AAAI 2021 的最新工作。对本期主题感兴趣的小伙伴,1 月 12 日(周二)晚 7 点,我们准时相约 PaperWeekly B 站直播间。
深度模型对抗样本最先在图像分类任务中提出,即通过微小扰动使得神经网络产生错误输出。近几年来,研究者发现自然语言处理模型中同样存在对抗样本,并提出一系列的对抗攻击和防御方法。但是由于文本的离散性和语义约束,在图像对抗攻防中被广泛使用的梯度信息和对抗训练防御方法一直未能有效地在基于近义词替换的文本对抗中使用。
1. 快速梯度投影攻击:通过投影方式将梯度引入到基于同义词替换的文本对抗攻击,在保证现有攻击成功率的前提下,速度比目前最快的攻击提升了至少 20 倍;
2. 基于快速梯度投影攻击的对抗训练:由于快速梯度投影攻击的高效性,我们利用其实现了对抗训练,显著地提升了深度模型的鲁棒性。
https://github.com/JHL-HUST/FGPM
文本对抗攻防现状
快速梯度投影算法
基于快速梯度投影攻击的对抗训练
实验结果和分析
王晓森,华中科技大学计算机学院 2019 级硕士生
,师从何琨教授,主要关注深度学习的对抗样本。
本次直播将在 PaperWeekly B 站直播间进行,扫描下方海报二维码或点击阅读原文即可免费观看。线上分享结束后,嘉宾还将在直播交流群内实时 QA,在 PaperWeekly 微信公众号后台回复「AI Drive」,即可获取入群通道。
B 站直播间:
https://live.bilibili.com/14884511
🔍
现在,在「知乎」也能找到我们了
进入知乎首页搜索「PaperWeekly」
点击「关注」订阅我们的专栏吧
关于PaperWeekly
PaperWeekly 是一个推荐、解读、讨论、报道人工智能前沿论文成果的学术平台。如果你研究或从事 AI 领域,欢迎在公众号后台点击「交流群」,小助手将把你带入 PaperWeekly 的交流群里。