「PW Live」是 PaperWeekly 的学术直播间,旨在帮助更多的青年学者宣传其最新科研成果。我们一直认为,单向地输出知识并不是一个最好的方式,而有效地反馈和交流可能会让知识的传播更加有意义,从而产生更大的价值。
本期 PW Live,我们邀请到旷视成都研究院实习生周鸣一,为大家带来不需要真实数据的模型窃取方法的主题分享。
对本期主题感兴趣的小伙伴,5 月 26 日(周二)晚 7 点,我们准时相约 PaperWeekly B 站直播间。
当前研究表明机器学习模型容易受到对抗性样本的攻击。在黑盒攻击模式下,当前的替身攻击(substitute attacks)需要用预训练的模型来生成对抗性样本。
在本文中,我们提出了一种不需要数据的替身模型训练方法(DaST),无需任何真实数据即可获得对抗性黑盒攻击的替身模型。为此,DaST 利用专门设计的生成对抗网络(GAN)来训练替身模型。我们用 GAN 中生成器产生的样本训练分类器(即替身模型),样本的标签为目标模型的输出。
实验表明,与由目标模型相同训练数据集训练的基线替身模型相比,DaST 生产的替身模型可以实现具有竞争力性能。
此外,为了评估所提出的方法在实际任务中的实用性,我们在 Microsoft Azure
平台上攻击了在线机器学习模型。
就我们目前了解所知,这是第一个不需要任何真实数据就能生成替身模型并用来产生对抗攻击的工作。这项工作被 CVPR 2020 接收为 Oral。
对当前对抗样本与替身模型训练方法
提出的不需要真实数据的替身模型训练方法
实验结果
周鸣一,旷视成都研究院实习生
,电子科技大学信息与通信学院硕士生在读。研究方向为机器学习安全,主要包括对抗机器学习、模型窃取等。发表过多篇期刊和会议论文。
本次直播将在 PaperWeekly B 站直播间进行,扫描下方海报二维码或点击阅读原文即可免费观看。线上分享结束后,嘉宾还将在直播交流群内实时 QA,在 PaperWeekly 微信公众号后台回复「PW Live」,即可获取入群通道。
B 站直播间:
https://live.bilibili.com/14884511
🔍
现在,在「知乎」也能找到我们了
进入知乎首页搜索「PaperWeekly」
点击「关注」订阅我们的专栏吧
关于PaperWeekly
PaperWeekly 是一个推荐、解读、讨论、报道人工智能前沿论文成果的学术平台。如果你研究或从事 AI 领域,欢迎在公众号后台点击「交流群」,小助手将把你带入 PaperWeekly 的交流群里。