2021年3月19日洛克希德·马丁首席工程师Ambrose Kam讲解DRL在Cyber Wargaming Engine中的运用。内容如下:由于威胁的动态性和不断扩大的攻击面,网络安全本质上是复杂的。另外许多新技术的快速发展加剧了这一挑战,如物联网设备、5G基础设施、基于云的计算等。人工智能和机器学习技术在快速变化的环境中可以提供威胁检测和缓解响应方面的潜在解决方案。相反,人类往往受限于其天生的信息处理能力,无法识别/响应多维、多面世界中的攻击模式。最近的美国国防部高级研究计划局阿尔法格斗已经证明,在空对空战斗中,机器甚至可以击败最好的人类飞行员。这促使我们的工程师开发了一个最小可行产品(MVP),该产品展示了深度强化学习(DRL)架构在模拟网络战争博弈环境中的价值。通过使用此模拟框架,我们基本上“训练”了机器,以在给定的场景中产生网络攻击向量的最佳组合/排列。这个网络战争博弈引擎允许我们的分析师检查我们的对手可能采用的战术、技术和程序。