随着机器学习技术的发展,真实世界的数据以不同模态的形式存在,研究的重点已从单模态学习转向多模态学习。然而,多模态模型通常比单模态模型携带更多的信息,它们通常应用于敏感场景,如医疗报告生成或疾病识别。与现有的针对机器学习分类器的成员推理方法相比,我们关注的是多模态模型的输入和输出是不同形式的问题,如图像字幕。本文从成员推理攻击的角度研究了多模态模型的隐私泄露问题,成员推理攻击是一个判断数据记录是否参与模型训练过程的过程。为此,我们提出了多模态模型成员推断(M4 I),并使用两种攻击方法来推断成员状态,分别称为基于度量(MB) M4 I和基于特征(FB) M4 I。更具体地说,MB M4 I在攻击时采用相似度度量来推断目标数据的成员。FB M4 I采用预训练的阴影多模态特征提取器,通过比较提取的输入输出特征的相似性来达到数据推理攻击的目的。大量的实验结果表明,这两种攻击方法都能取得较好的性能。在不受限制的场景下,平均攻击成功率分别为72.5%和94.83%。此外,我们评估针对攻击的多种防御机制。M4 I攻击的源代码可以在https://github.com/MultimodalMI/ Multimodal-membership-inference.git上公开获取。

成为VIP会员查看完整内容
14

相关内容

【NeurIPS2022】扩散视觉反事实解释
专知会员服务
23+阅读 · 2022年10月24日
联邦学习攻防研究综述
专知会员服务
37+阅读 · 2022年7月22日
专知会员服务
62+阅读 · 2021年10月14日
专知会员服务
13+阅读 · 2021年10月13日
专知会员服务
65+阅读 · 2021年8月1日
【AAAI2021】知识迁移的机器学习成员隐私保护,57页ppt
专知会员服务
27+阅读 · 2021年2月9日
AAAI2021 | 学习预训练图神经网络
专知会员服务
115+阅读 · 2021年1月28日
【AAAI2021】低资源医疗对话生成的图演化元学习
专知会员服务
47+阅读 · 2020年12月26日
【NeurIPS2020】基于能量的分布外检测
专知会员服务
13+阅读 · 2020年10月10日
论文浅尝 | 预训练单模态和多模态模型中的视觉常识
开放知识图谱
4+阅读 · 2022年8月22日
如何使用多类型数据预训练多模态模型?
极市平台
0+阅读 · 2022年7月21日
联邦学习攻防研究综述
专知
2+阅读 · 2022年7月15日
国家自然科学基金
1+阅读 · 2015年12月31日
国家自然科学基金
0+阅读 · 2013年12月31日
国家自然科学基金
0+阅读 · 2013年12月31日
国家自然科学基金
0+阅读 · 2013年12月31日
国家自然科学基金
3+阅读 · 2012年12月31日
国家自然科学基金
3+阅读 · 2012年12月31日
国家自然科学基金
3+阅读 · 2012年12月31日
国家自然科学基金
0+阅读 · 2011年12月31日
Arxiv
0+阅读 · 2022年10月24日
Arxiv
0+阅读 · 2022年10月22日
Arxiv
25+阅读 · 2022年1月3日
VIP会员
相关VIP内容
【NeurIPS2022】扩散视觉反事实解释
专知会员服务
23+阅读 · 2022年10月24日
联邦学习攻防研究综述
专知会员服务
37+阅读 · 2022年7月22日
专知会员服务
62+阅读 · 2021年10月14日
专知会员服务
13+阅读 · 2021年10月13日
专知会员服务
65+阅读 · 2021年8月1日
【AAAI2021】知识迁移的机器学习成员隐私保护,57页ppt
专知会员服务
27+阅读 · 2021年2月9日
AAAI2021 | 学习预训练图神经网络
专知会员服务
115+阅读 · 2021年1月28日
【AAAI2021】低资源医疗对话生成的图演化元学习
专知会员服务
47+阅读 · 2020年12月26日
【NeurIPS2020】基于能量的分布外检测
专知会员服务
13+阅读 · 2020年10月10日
相关基金
国家自然科学基金
1+阅读 · 2015年12月31日
国家自然科学基金
0+阅读 · 2013年12月31日
国家自然科学基金
0+阅读 · 2013年12月31日
国家自然科学基金
0+阅读 · 2013年12月31日
国家自然科学基金
3+阅读 · 2012年12月31日
国家自然科学基金
3+阅读 · 2012年12月31日
国家自然科学基金
3+阅读 · 2012年12月31日
国家自然科学基金
0+阅读 · 2011年12月31日
微信扫码咨询专知VIP会员