主题: Imitation Attacks and Defenses for Black-box Machine Translation Systems

摘要: 我们考虑一个寻求窃取黑盒机器翻译(MT)系统的对手,以获取经济利益或排除模型错误。我们首先表明,黑盒机器翻译系统可以通过使用单语句子和训练模型来模拟它们的输出来窃取。通过模拟实验,我们证明了即使模仿模型的输入数据或架构与受害者不同,MTmodel的窃取也是可能的。应用这些思想,我们在高资源和低资源语言对上训练了三个生产MT系统的0.6 BLEU以内的模仿模型。然后,我们利用模仿模型的相似性将对抗性示例转移到生产系统。我们使用基于梯度的攻击,这些攻击会暴露输入,从而导致语义错误的翻译,内容丢失和庸俗的模型输出。为了减少这些漏洞,我们提出了一种防御措施,该防御措施会修改翻译输出,从而误导了模仿模型优化的防御措施。这种防御降低了仿真模型BLEU的性能,并降低了BLEU的攻击传输速率和推理速度。

成为VIP会员查看完整内容
6

相关内容

加州大学伯克利分校(University of California, Berkeley),是美国最负盛名且是最顶尖的一所公立研究型大学,位于旧金山东湾伯克利市的山丘上。创建于1868年,是加州大学十个分校中历史最悠久的一所。加州大学伯克利分校在世界范围内拥有崇高的学术声誉,拥有丰富的教学资源,研究水平非常坚厚,与斯坦福大学、麻省理工学院等一同被誉为美国工程科技界的学术领袖。
【综述】基于图的对抗式攻击和防御,附22页论文下载
专知会员服务
68+阅读 · 2020年3月5日
【Google】无监督机器翻译,Unsupervised Machine Translation
专知会员服务
35+阅读 · 2020年3月3日
IJCAI 2019 提前看 | 神经网络后门攻击、对抗攻击
揭秘|多伦多大学反人脸识别,身份欺骗成功率达99.5%
机器人大讲堂
6+阅读 · 2018年6月9日
产生和防御对抗样本的新方法 | 分享总结
AI研习社
7+阅读 · 2018年1月6日
Deflecting Adversarial Attacks
Arxiv
8+阅读 · 2020年2月18日
Doubly Attentive Transformer Machine Translation
Arxiv
4+阅读 · 2018年7月30日
Arxiv
6+阅读 · 2018年2月26日
VIP会员
相关VIP内容
微信扫码咨询专知VIP会员