会员服务 ·

9

论文 · AI与军事 · 北约“用于混合军事行动的人工智能、机器学习和大数据（AI4HMO） ”研讨会 · 文件安全 · 分类模型 ·

2022 年 4 月 26 日

【AI+军事】附论文《敏感还是不敏感？如何攻击和捍卫文件安全分类模型》

专知会员服务

专知，提供专业可信的知识分发服务，让认知协作更快更好！

摘要

最近，我们见证了对抗性机器学习技术的快速发展，它破坏了底层机器学习模型的安全性，并导致了有利于对抗者的故障。最常见的对抗性机器学习攻击包括故意修改机器学习模型的输入，其方式是人类无法察觉的，但足以导致模型失败。对抗性例子最初是为图像设计的，也可以应用于自然语言处理（NLP）和文本分类。这项工作提出了一个研究和实施对抗性例子--以及防御机制--来对抗基于BERT的NLP分类器。用于测试拟议方法的数据集包括北约文件，现在已经解密，这些文件最初拥有不同的保密级别，由文件中嵌入的标签指定。BERT模型被用来根据这些文件的初始敏感性对其进行自动分类。虽然攻击者的目的是改变分类级别，但防御方致力于阻止这些企图。实验表明，对抗性文本实例可以误导模型，导致拒绝服务，当文件被识别为具有比实际更高的敏感性时，或者导致数据泄漏，当文件被解释为具有比实际更低的敏感性时。通过采取适当的防御措施，有可能抵制特定类型的对抗性攻击，但代价是降低模型的整体准确性。

引言

机器学习系统的广泛使用和成功使其成为攻击者越来越频繁的目标，他们的目标是滥用这些系统为自己谋利。这种现象导致了对抗性机器学习的发展[1]，这是一个结合了机器学习和网络安全的领域，涉及到对智能系统可能的攻击以及对策的研究。因此，尽管机器学习在一般情况下能快速提供结果，而且准确性很高，但它并非没有风险，如果在没有充分的安全分析的情况下实施，后果可能是灾难性的。例如，特斯拉Model S 75自动驾驶系统可以通过隐藏高速公路标志或添加人类驾驶忽略的标记来进行操纵，从而导致，例如，转向错误的车道[2]。

图1描述了机器学习系统的各个组成部分可能受到的攻击类型，按有意和无意的故障分组。机器学习的最大威胁之一是数据的完整性，表现为数据中毒。作为训练集一部分的数据，如果被破坏，会改变模型的学习能力，从而影响其性能。训练样本通常不涵盖所有可能的角落案例。一些没有被考虑的样本可能被模型错误分类，导致不正确的预测。提供其预训练模型的第三方服务通常只想提供查询访问，而不提供额外的信息。任何针对模型保密性的安全漏洞都会泄露敏感信息，可能会揭示和暴露出模型结构。一般来说，机器学习服务提供者希望对用作训练集的数据相关信息进行保密。成员推理攻击的目的是通过泄露训练集的一部分来损害数据隐私。

图1 针对机器学习系统的安全威胁实例

成为VIP会员查看完整内容

18

相关内容

论文（Paper）是专知网站核心资料文档，包括全球顶级期刊、顶级会议论文，及全球顶尖高校博士硕士学位论文。重点关注中国计算机学会推荐的国际学术会议和期刊，CCF-A、B、C三类。通过人机协作方式，汇编、挖掘后呈现于专知网站。

【AI+军事】附论文+PPT《军事飞行员的情绪压力分析》

【AI+军事】附论文+PPT《军事飞行员的情绪压力分析》

专知会员服务

43+阅读 · 2022年5月11日

【AI+军事】附论文《连接点-增强信息处理链，为支持东道国和领土作战的混合威胁检测》

【AI+军事】附论文《连接点-增强信息处理链，为支持东道国和领土作战的混合威胁检测》

专知会员服务

25+阅读 · 2022年5月5日

【AI+军事】附论文《对抗人工智能: 通过基于ai战略游戏，在攻防游戏中开发对抗攻击的鲁棒性》

【AI+军事】附论文《对抗人工智能: 通过基于ai战略游戏，在攻防游戏中开发对抗攻击的鲁棒性》

专知会员服务

72+阅读 · 2022年4月29日

【AI+军事】附论文《论混合军事行动中人工智能的数字伦理》

【AI+军事】附论文《论混合军事行动中人工智能的数字伦理》

专知会员服务

44+阅读 · 2022年4月28日

【AI+军事】《冲突监测》附论文

【AI+军事】《冲突监测》附论文

专知会员服务

49+阅读 · 2022年4月27日

【军事】2022兰德160页pdf《如何有效评估非致命性武器作为中间力量能力的影响》

【军事】2022兰德160页pdf《如何有效评估非致命性武器作为中间力量能力的影响》

专知会员服务

48+阅读 · 2022年3月24日

【AI+军事】《低、慢、小威胁建模和仿真》北约STO技术报告50页

【AI+军事】《低、慢、小威胁建模和仿真》北约STO技术报告50页

专知会员服务

253+阅读 · 2022年3月19日

【AI+军事】兰德53页PDF：网络任务线程分析——用于评估从网络攻击到武器系统对任务的影响的原型框架

【AI+军事】兰德53页PDF：网络任务线程分析——用于评估从网络攻击到武器系统对任务的影响的原型框架

专知会员服务

81+阅读 · 2022年3月14日

深度学习模型鲁棒性研究综述

深度学习模型鲁棒性研究综述

专知会员服务

97+阅读 · 2022年1月23日

【论文推荐】增加透明度与谷歌云可解释的人工智能（附pdf）

专知会员服务

16+阅读 · 2019年11月23日

超过 380,000 个 Kubernetes API 服务器面临一系列攻击

超过 380,000 个 Kubernetes API 服务器面临一系列攻击

CCF计算机安全专委会

0+阅读 · 2022年5月26日

漫谈软件缺陷与漏洞

漫谈软件缺陷与漏洞

InfoQ

1+阅读 · 2022年4月23日

将模型训练外包真的安全吗？新研究：外包商可能植入后门，控制银行放款

将模型训练外包真的安全吗？新研究：外包商可能植入后门，控制银行放款

机器之心

0+阅读 · 2022年4月21日

人工智能，「抛弃」真实数据集？

人工智能，「抛弃」真实数据集？

新智元

1+阅读 · 2022年4月6日

物理攻击「损害」深度学习系统，CV、语音领域如何防御？

物理攻击「损害」深度学习系统，CV、语音领域如何防御？

机器之心

3+阅读 · 2022年4月4日

「深度学习模型鲁棒性」最新2022综述

「深度学习模型鲁棒性」最新2022综述

专知

7+阅读 · 2022年1月23日

美国首例！特斯拉司机滥用L2辅助驾驶致两人死亡，被控过失杀人罪

美国首例！特斯拉司机滥用L2辅助驾驶致两人死亡，被控过失杀人罪

AI前线

0+阅读 · 2022年1月20日

避免自动驾驶事故，CV领域如何检测物理攻击？

避免自动驾驶事故，CV领域如何检测物理攻击？

机器之心

2+阅读 · 2022年1月10日

为什么说对抗性图像攻击不是闹着玩的？

为什么说对抗性图像攻击不是闹着玩的？

AI前线

1+阅读 · 2022年1月5日

面对无处不在的黑客威胁，如何保护智能设备免受攻击？

面对无处不在的黑客威胁，如何保护智能设备免受攻击？

AI前线

21+阅读 · 2019年10月28日

网络安全威胁踪源分析方法研究

国家自然科学基金

19+阅读 · 2015年12月31日

基于被控物理对象监测的核电厂网络空间攻击的检测和响应

国家自然科学基金

2+阅读 · 2015年12月31日

方差正则化的分类模型选择方法研究

国家自然科学基金

1+阅读 · 2015年12月31日

可抵抗密钥失窃的无线通信安全协议研究

国家自然科学基金

1+阅读 · 2013年12月31日

面向BYOD数据防护机制的多维脆弱性攻击研究

国家自然科学基金

3+阅读 · 2013年12月31日

面向密集移动标签的RFID敏感信息交互机制研究

国家自然科学基金

0+阅读 · 2013年12月31日

面向移动互联网的多步攻击安全可视化研究

国家自然科学基金

1+阅读 · 2013年12月31日

互联网前缀劫持的监测与防御研究

国家自然科学基金

2+阅读 · 2013年12月31日

视觉监控敏感信息处理关键技术研究

国家自然科学基金

0+阅读 · 2011年12月31日

大规模网络视频在线定位与地理信息挖掘技术研究

国家自然科学基金

0+阅读 · 2011年12月31日

Deadline-constrained Multi-resource Task Mapping and Allocation for Edge-Cloud Systems

Arxiv

0+阅读 · 2022年6月13日

The leaky integrator that could: Or recursive polynomial regression for online signal analysis

Arxiv

0+阅读 · 2022年6月9日

Attention Mechanisms in Computer Vision: A Survey

Arxiv

58+阅读 · 2021年11月15日

Train Large, Then Compress: Rethinking Model Size for Efficient Training and Inference of Transformers

Arxiv

12+阅读 · 2020年6月23日

Embedding-based Retrieval in Facebook Search

Arxiv

12+阅读 · 2020年6月20日

A Survey of Methods for Low-Power Deep Learning and Computer Vision

A Survey of Methods for Low-Power Deep Learning and Computer Vision

Arxiv

14+阅读 · 2020年3月24日

A Survey on Contextual Embeddings

Arxiv

29+阅读 · 2020年3月16日

A Survey of Model Compression and Acceleration for Deep Neural Networks

Arxiv

66+阅读 · 2019年9月8日

Self-Driving Cars: A Survey

Self-Driving Cars: A Survey

Arxiv

41+阅读 · 2019年1月14日

Notes on Deep Learning for NLP

Arxiv

22+阅读 · 2018年8月30日

VIP会员

相关主题

北约“用于混合军事行动的人工智能、机器学习和大数据（AI4HMO） ”研讨会

相关VIP内容

【AI+军事】附论文+PPT《军事飞行员的情绪压力分析》

【AI+军事】附论文+PPT《军事飞行员的情绪压力分析》

专知会员服务

43+阅读 · 2022年5月11日

【AI+军事】附论文《连接点-增强信息处理链，为支持东道国和领土作战的混合威胁检测》

【AI+军事】附论文《连接点-增强信息处理链，为支持东道国和领土作战的混合威胁检测》

专知会员服务

25+阅读 · 2022年5月5日

【AI+军事】附论文《对抗人工智能: 通过基于ai战略游戏，在攻防游戏中开发对抗攻击的鲁棒性》

【AI+军事】附论文《对抗人工智能: 通过基于ai战略游戏，在攻防游戏中开发对抗攻击的鲁棒性》

专知会员服务

72+阅读 · 2022年4月29日

【AI+军事】附论文《论混合军事行动中人工智能的数字伦理》

【AI+军事】附论文《论混合军事行动中人工智能的数字伦理》

专知会员服务

44+阅读 · 2022年4月28日

【AI+军事】《冲突监测》附论文

【AI+军事】《冲突监测》附论文

专知会员服务

49+阅读 · 2022年4月27日

【军事】2022兰德160页pdf《如何有效评估非致命性武器作为中间力量能力的影响》

【军事】2022兰德160页pdf《如何有效评估非致命性武器作为中间力量能力的影响》

专知会员服务

48+阅读 · 2022年3月24日

【AI+军事】《低、慢、小威胁建模和仿真》北约STO技术报告50页

【AI+军事】《低、慢、小威胁建模和仿真》北约STO技术报告50页

专知会员服务

253+阅读 · 2022年3月19日

【AI+军事】兰德53页PDF：网络任务线程分析——用于评估从网络攻击到武器系统对任务的影响的原型框架

【AI+军事】兰德53页PDF：网络任务线程分析——用于评估从网络攻击到武器系统对任务的影响的原型框架

专知会员服务

81+阅读 · 2022年3月14日

深度学习模型鲁棒性研究综述

深度学习模型鲁棒性研究综述

专知会员服务

97+阅读 · 2022年1月23日

【论文推荐】增加透明度与谷歌云可解释的人工智能（附pdf）

专知会员服务

16+阅读 · 2019年11月23日

热门VIP内容

开通专知VIP会员享更多权益服务

操作系统智能体：基于多模态大模型（MLLM）的通用计算设备智能体综述

《美国太空军系统全生命周期建模、仿真与分析效能提升方案》最新84页报告

【博士论文】推进数据高效的深度学习：非参数 Transformer、主动测试与上下文学习

自主人工智能：未来战争是否将是自主化的？

相关资讯

超过 380,000 个 Kubernetes API 服务器面临一系列攻击

超过 380,000 个 Kubernetes API 服务器面临一系列攻击

CCF计算机安全专委会

0+阅读 · 2022年5月26日

漫谈软件缺陷与漏洞

漫谈软件缺陷与漏洞

InfoQ

1+阅读 · 2022年4月23日

将模型训练外包真的安全吗？新研究：外包商可能植入后门，控制银行放款

将模型训练外包真的安全吗？新研究：外包商可能植入后门，控制银行放款

机器之心

0+阅读 · 2022年4月21日

人工智能，「抛弃」真实数据集？

人工智能，「抛弃」真实数据集？

新智元

1+阅读 · 2022年4月6日

物理攻击「损害」深度学习系统，CV、语音领域如何防御？

物理攻击「损害」深度学习系统，CV、语音领域如何防御？

机器之心

3+阅读 · 2022年4月4日

「深度学习模型鲁棒性」最新2022综述

「深度学习模型鲁棒性」最新2022综述

专知

7+阅读 · 2022年1月23日

美国首例！特斯拉司机滥用L2辅助驾驶致两人死亡，被控过失杀人罪

美国首例！特斯拉司机滥用L2辅助驾驶致两人死亡，被控过失杀人罪

AI前线

0+阅读 · 2022年1月20日

避免自动驾驶事故，CV领域如何检测物理攻击？

避免自动驾驶事故，CV领域如何检测物理攻击？

机器之心

2+阅读 · 2022年1月10日

为什么说对抗性图像攻击不是闹着玩的？

为什么说对抗性图像攻击不是闹着玩的？

AI前线

1+阅读 · 2022年1月5日

面对无处不在的黑客威胁，如何保护智能设备免受攻击？

面对无处不在的黑客威胁，如何保护智能设备免受攻击？

AI前线

21+阅读 · 2019年10月28日

相关基金

网络安全威胁踪源分析方法研究

国家自然科学基金

19+阅读 · 2015年12月31日

基于被控物理对象监测的核电厂网络空间攻击的检测和响应

国家自然科学基金

2+阅读 · 2015年12月31日

方差正则化的分类模型选择方法研究

国家自然科学基金

1+阅读 · 2015年12月31日

可抵抗密钥失窃的无线通信安全协议研究

国家自然科学基金

1+阅读 · 2013年12月31日

面向BYOD数据防护机制的多维脆弱性攻击研究

国家自然科学基金

3+阅读 · 2013年12月31日

面向密集移动标签的RFID敏感信息交互机制研究

国家自然科学基金

0+阅读 · 2013年12月31日

面向移动互联网的多步攻击安全可视化研究

国家自然科学基金

1+阅读 · 2013年12月31日

互联网前缀劫持的监测与防御研究

国家自然科学基金

2+阅读 · 2013年12月31日

视觉监控敏感信息处理关键技术研究

国家自然科学基金

0+阅读 · 2011年12月31日

大规模网络视频在线定位与地理信息挖掘技术研究

国家自然科学基金

0+阅读 · 2011年12月31日

相关论文

Deadline-constrained Multi-resource Task Mapping and Allocation for Edge-Cloud Systems

Arxiv

0+阅读 · 2022年6月13日

The leaky integrator that could: Or recursive polynomial regression for online signal analysis

Arxiv

0+阅读 · 2022年6月9日

Attention Mechanisms in Computer Vision: A Survey

Arxiv

58+阅读 · 2021年11月15日

Train Large, Then Compress: Rethinking Model Size for Efficient Training and Inference of Transformers

Arxiv

12+阅读 · 2020年6月23日

Embedding-based Retrieval in Facebook Search

Arxiv

12+阅读 · 2020年6月20日

A Survey of Methods for Low-Power Deep Learning and Computer Vision

A Survey of Methods for Low-Power Deep Learning and Computer Vision

Arxiv

14+阅读 · 2020年3月24日

A Survey on Contextual Embeddings

Arxiv

29+阅读 · 2020年3月16日

A Survey of Model Compression and Acceleration for Deep Neural Networks

Arxiv

66+阅读 · 2019年9月8日

Self-Driving Cars: A Survey

Self-Driving Cars: A Survey

Arxiv

41+阅读 · 2019年1月14日

Notes on Deep Learning for NLP

Arxiv

22+阅读 · 2018年8月30日

微信扫码咨询专知VIP会员