为了打击日益多变和易变的现代恶意软件,机器学习(ML)现在是对现有基于签名的恶意软件分流和识别技术的一种流行和有效的补充。然而,ML也是对手的一个现成的工具。最近的研究表明,恶意软件可以通过深度强化学习(RL)技术进行修改,以绕过基于人工智能和基于签名的反病毒系统,而不改变其原有的恶意功能。这些研究只专注于生成规避样本,并假设静态检测系统为敌人。

恶意软件检测和回避本质上形成了一个双方的猫鼠游戏。在本文中,我们模拟现实生活中的场景,按照零和多智能体强化学习(MARL)的范式,提出了第一个用于规避恶意软件检测和生成的双人竞争博弈。我们对最近的恶意软件进行的实验表明,所产生的恶意软件检测智能体对对抗性攻击更加强大。此外,所产生的恶意软件修改智能体能够产生更多的规避样本,骗过基于人工智能和其他反恶意软件技术。

关键词:对抗性学习,恶意软件分析,神经网络,强化学习,马尔科夫决策过程

图1:单次的H4rm0ny训练过程。还显示了所有系统配置的结果。从我们的数据集中选择一个恶意软件的样本。然后,它被送到一个修改的过程中。如果任何修改产生了一个恶意软件的回避样本,该样本将被训练成检测智能体。一旦样本被训练成检测智能体,修改智能体的策略就会随着对恶意软件样本和检测智能体的状态所采取的一系列行动而更新。

成为VIP会员查看完整内容
25

相关内容

人工智能在军事中可用于多项任务,例如目标识别、大数据处理、作战系统、网络安全、后勤运输、战争医疗、威胁和安全监测以及战斗模拟和训练。
机器学习的 7 个关键军事应用
专知会员服务
297+阅读 · 2022年4月24日
安全隐患:神经网络可以隐藏恶意软件
THU数据派
0+阅读 · 2022年3月16日
国家自然科学基金
1+阅读 · 2015年12月31日
国家自然科学基金
18+阅读 · 2015年12月31日
国家自然科学基金
15+阅读 · 2013年12月31日
国家自然科学基金
0+阅读 · 2013年12月31日
国家自然科学基金
4+阅读 · 2013年12月31日
国家自然科学基金
0+阅读 · 2012年12月31日
国家自然科学基金
0+阅读 · 2009年12月31日
国家自然科学基金
0+阅读 · 2009年12月31日
国家自然科学基金
8+阅读 · 2008年12月31日
Arxiv
0+阅读 · 2022年12月9日
Arxiv
82+阅读 · 2022年7月16日
Arxiv
11+阅读 · 2018年1月15日
VIP会员
相关基金
国家自然科学基金
1+阅读 · 2015年12月31日
国家自然科学基金
18+阅读 · 2015年12月31日
国家自然科学基金
15+阅读 · 2013年12月31日
国家自然科学基金
0+阅读 · 2013年12月31日
国家自然科学基金
4+阅读 · 2013年12月31日
国家自然科学基金
0+阅读 · 2012年12月31日
国家自然科学基金
0+阅读 · 2009年12月31日
国家自然科学基金
0+阅读 · 2009年12月31日
国家自然科学基金
8+阅读 · 2008年12月31日
微信扫码咨询专知VIP会员