美国空军部对人工智能(AI)彻底改变作战各个方面的潜力越来越感兴趣。在这个项目中,美国空军要求兰德公司的 "空军项目"(Project AIR FORCE)广泛考虑人工智能无法做到的事情,以了解人工智能在作战应用中的局限性。本报告讨论了人工智能系统在执行两种常见网络安全任务(检测网络入侵和识别恶意软件)中的应用,以及分布转移对这些任务的影响,这种现象会极大地限制人工智能的有效性。当人工智能系统在部署后遇到的数据与经过训练和测试的数据有明显差异时,就会发生分布偏移。

本报告阐述了分布偏移的重要性,它如何并确实显著限制了人工智能在检测网络入侵和识别恶意软件方面的有效性,如何测试和量化其影响,以及如何减轻这些影响。这项工作主要针对大型组织,如总部设施,它们有足够的带宽和计算能力来实施人工智能网络安全系统并定期更新系统。

本报告是五卷系列报告中的第二卷,论述了如何利用人工智能在网络安全、预测性维护、兵棋推演和任务规划四个不同领域为作战人员提供帮助。本卷面向技术读者;整个系列面向对作战和人工智能应用感兴趣的读者。

研究问题

  • 网络安全数据集是否受到分布漂移的影响?
  • 如何在网络安全数据集中检测和描述分布漂移?
  • 用于检测分布漂移的数据集的质量和周期有多重要,这些因素如何影响人工智能的性能?

主要发现

  • 网络安全数据集存在分布偏移问题,尤其是在标准网络入侵检测和恶意软件分类方面。
  • 分布偏移有多种表现形式,检测的难易程度取决于数据集。
  • 虽然数据质量对训练机器学习算法很重要,但数据的新旧程度也很重要。
  • 在某些情况下,数据必须是近期的才有用,这就限制了可用于训练的数据,反过来又限制了人工智能的性能。

建议

  • 任何基于人工智能的网络安全系统都应进行数据集分割测试,以评估随时间推移的分布变化对性能的可能影响。这些测试可用于估算数据衰减率,而数据衰减率又可用于估算人工智能系统在必须完全重新训练之前可能的保质期。
  • 此外,我们还建议对数据集进行著名的统计检验,如 Kolmogorov-Smirnov 检验,作为检测或确认分布偏移的额外措施。
成为VIP会员查看完整内容
69

相关内容

人工智能在军事中可用于多项任务,例如目标识别、大数据处理、作战系统、网络安全、后勤运输、战争医疗、威胁和安全监测以及战斗模拟和训练。
【2022新书】深度学习归一化技术,117页pdf
专知
24+阅读 · 2022年11月25日
国家自然科学基金
4+阅读 · 2015年12月31日
国家自然科学基金
1+阅读 · 2015年12月31日
国家自然科学基金
3+阅读 · 2015年12月31日
国家自然科学基金
2+阅读 · 2015年12月31日
国家自然科学基金
37+阅读 · 2015年12月31日
国家自然科学基金
32+阅读 · 2014年12月31日
国家自然科学基金
2+阅读 · 2014年12月31日
国家自然科学基金
2+阅读 · 2014年12月31日
国家自然科学基金
45+阅读 · 2009年12月31日
Arxiv
156+阅读 · 2023年4月20日
A Survey of Large Language Models
Arxiv
398+阅读 · 2023年3月31日
Arxiv
66+阅读 · 2023年3月26日
Arxiv
20+阅读 · 2023年3月17日
VIP会员
相关VIP内容
相关基金
国家自然科学基金
4+阅读 · 2015年12月31日
国家自然科学基金
1+阅读 · 2015年12月31日
国家自然科学基金
3+阅读 · 2015年12月31日
国家自然科学基金
2+阅读 · 2015年12月31日
国家自然科学基金
37+阅读 · 2015年12月31日
国家自然科学基金
32+阅读 · 2014年12月31日
国家自然科学基金
2+阅读 · 2014年12月31日
国家自然科学基金
2+阅读 · 2014年12月31日
国家自然科学基金
45+阅读 · 2009年12月31日
微信扫码咨询专知VIP会员