软件工程师关闭办公室,带着笔记本电脑坐在炮兵单元旁。数据科学家在无人机袭击几分钟后重新训练目标定位模型,每次出击都能提高准确性。数据科学家每天多次更新面部识别软件,以确保边境安全并识别阵亡士兵。
难道是某个秘密的美军单元最终实现了国防部的愿景,将颠覆性技术迅速掌握在战士手中?不是。这些事件发生在乌克兰军队内部,乌克兰军队将商业技术快速融入军事行动的动力来自于冲突的现实和创造非对称优势以击退数量上占优势的部队的需要。
"我们如何才能以符合军方愿景、战争需求和行业创新的方式进行智能自主系统的研发、采购和集成?2023年6 月 8 日至 9 日,本文作者参加了在美国海军研究生院举办的海军创新交流会智能自主系统探索研讨会,任务就是回答这个问题。通过发散性构思、主持讨论和非正式交谈,一批军人、项目经理、工程师和其他利益相关者讨论了这个问题。
尽管参与者的背景各不相同,讨论的重点领域也各不相同,但还是形成了一个中心思想:虽然自主性的破坏性在俄乌冲突中每天都在得到证明,但美军的采购系统目前还无法适应必要的范式转变,无法在速度和规模上为自己的作战人员带来好处。
美军规模庞大,采购部门必须保持必要的规模,以提供作战人员所需的技术和产品。然而,除非"教会大象跳舞",否则美国将无法为其作战人员提供自主决策优势,使他们无法与当前步调一致的威胁抗衡,也无法在未来战争的复杂环境中作战。
自主性通过软件定义的情报将约翰-博伊德的 "观察-定向-决策-行动 "循环自动化,在保留人工监督的同时加快决策进程。它使军事指挥官能够收集、处理、利用来自战场的大量信息并采取行动。自主化的形式可以是车辆的感知和控制系统、炮兵单元的自动目标定位模型或用于分析截获通信的自然语言处理算法。
自主系统通过从数据中提取意义来学习和适应,而不是通过明确的编程。正如人类通过反复观察和体验来学习复杂任务一样,自主系统也是需要大量数据来训练的学习智能体。因此,数据是开发真正智能自主系统的核心驱动力。
无论其具体用途如何,自主系统都将有助于实现赢得未来战争所需的决策优势和速度。
乌克兰对俄罗斯入侵的反应产生了许多令人难以置信的例子,证明了自主性所能提供的战场优势,包括后勤功能协调、战损评估以及动能和非动能行动。
俄罗斯的炮兵火力几乎是乌克兰的 20 比 1,但乌克兰通过软件自动匹配传感器和射手,使其火力更加致命,对俄罗斯单元造成了关键性打击。乌克兰使用绰号为 "火炮Uber"的商业开发软件包,将通常需要 20 分钟的目标定位到开火的时间缩短到 30 秒。
2022 年 3 月,美国公司 clearviewAl 向乌克兰提供了免费使用其面部识别软件的机会。乌克兰立即部署了这一软件,但未针对军事用途进行任何具体修改,以便在边境检查站识别俄罗斯士兵的身份,迅速通知死亡士兵的家属,并反击俄罗斯的虚假信息。
与无人机单元并肩作战的乌克兰民间软件工程师开发了分类器,能够比人类更准确、更快速地探测出隐藏在自然和人工伪装背后的俄罗斯坦克,而人类仅仅通过观看视频画面就能做到这一点。这种技术迅速提高了无人机打击的杀伤力,使花费 1 万美元的精确打击能够以极高的成功率摧毁价值百万美元的坦克。看来,一个在笔记本电脑上安装了 TensorFlow 的软件工程师为乌克兰作战单元带来的成功,比五角大楼每年 2.47 亿美元的 "Project Maven "合同为美国及其盟国带来的成功还要多。当前的技术格局和威胁环境所带来的这种投入与成果的不对称,凸显了美军文化转变的必要性。
与“火炮Uber”在连接传感器和射手方面的成效相比,美国军方为复制乌克兰软件工程师的成功每年花费超过 10 亿美元,但尚未取得类似的成功。政府高级官员将这一现象称为 "国家安全危机"。
由于采购流程是以硬件为中心的,因此商业部门的自主性爆炸式增长至今仍未被美国防部发现。几十年来,战争的主要推动力一直是坦克、飞机、舰船和其他大型武器系统--只有军方才有动力建造这些系统。这些"系统簇"经历了研究、开发、生产、部署、维护和报废的渐进过程,由多个政府资助机构、国家实验室和国防承包商为产品做出贡献。在 "规划、计划、预算和执行 "周期的计划阶段提交需求的军种直到三年后才会看到合同的执行,这与实际能力的交付毫无关系。
但如今,战争的关键推动因素——数据分析、自主系统和软件定义的信息处理——都是军民两用的,商业世界正在以比美国防部更好、更快、更便宜的方式开发这些技术。
美国国防部负责采办和维持的副部长威廉-拉普兰特博士在听证会上称赞 SpaceX 公司是在数周内,而不是数月或数年内将关键能力投入使用的典范。他说,"软件......将成为未来敏捷性和速度的关键"。然而,如果我们像国防创新委员会在 2019 年提出的那样,采用线性的、以硬件为中心的方法来采购软件,那么软件的采购、部署和更新速度就不可能与时俱进。乌克兰的 "软件士兵 "正在证明,军队不需要 "研究 "DevSecOps、软件即服务、云基础设施和自动测试等商业部门的做法,军队需要实施这些做法。
图:美国海军研究生院的研究人员准备在加州罗伯茨营发射 ScanEagle 无螺杆飞行器进行测试。
要在美国海军和整个美国防部实现自主性的快速获取和部署,必须解决自主性的三个独特方面:数据、周期时间和信任。
美国军方被数据淹没,但缺乏正确的数据却阻碍了自主系统在整个美国防部的应用。自主系统依靠数据驱动的模型,通过实例进行学习。这些模型需要大量的实例来捕捉正确的可观测数据,同时还要有准确的上下文,并标注必要的元数据。当这些因素汇聚在一起时,数据就能通过模型从战场自由流出,并为战场决策者提供有用的输出,就像我们在乌克兰看到的那样。
如今,美军尚未适应这种以数据为中心的现实。能够建立模型来利用自主性满足战争需求的工程师往往无法获得所需的数据。也许有人掌握了这些数据,但却无法迅速找出这个 "人 "是谁,数据存储在哪里,如何分类。工程师最终可能会对模型进行训练,但却无法将其部署到所需的运行网络上,以加快边缘决策周期。此外,该模型已经过时,因为使用最新的传感器数据对其进行重新训练已有数月之久。军方需要相关数据的中央存储库和通用词典,以便对数据和模型的作战使用准备情况进行分类。军方还需要数据自动收集、处理和输入模型的途径,该模型的输出可为其支持的系统或决策者提供价值。
软件中的 "软"是指能够以近乎无限的方式进行修改,方便快捷,以满足用户的需求。在商业软件开发中,近 60% 的软件开发人员每天都要部署新代码,有时一天要部署多次。为了修复错误、修补安全漏洞或增加必要的功能,这些修改都是必要的。
美军以硬件为中心的采购视角历来不太重视可持续发展。即使对可持续发展进行了规划,也往往是以 "技术更新率 "等术语来表述,而这无非是一个在未来几年硬件组件寿命即将结束时对其进行更换的计划。要认识到 "软件永不过时",就必须转变观念,从 "技术更新 "转变为 DevSecOps 的持续交付理念,即对软件进行修改、测试并推送给客户,以确保其继续满足任务需求,同时对用户透明。让软件工程师和数据科学家在时间和空间上更接近作战人员,有助于加快周期时间。
最后,由于自主系统的设计目的是减轻人类的认知负担,如果没有经过校准的信任,人类就不会正确地委派任务。正确的信任校准意味着人类对自主系统的依赖与系统的真实能力相匹配。从历史上看,这很容易做到:士兵信任火炮的有效射程,飞行员信任低于最大额定航速的飞机。
然而,旨在学习和适应作战环境的系统在不断整合动态数据流的同时,其能力和性能水平也在不断变化。这种模式需要的远不止是验收测试时的系统交接。它要求了解技术能力和局限性的人员与使用这些技术的操作单元和决策者并肩工作,以确保他们能够量化系统风险。在研讨会上,我们主张培养一批新型的 "自主过渡专家",他们既是数据科学家,又是作战人员,是关键技术的推动者,能够在有效使用自主性方面建立信任,从而在行动中可靠地使用自主性。
美国《2024 财年国防授权法案》(NDAA)要求美国防部提供 388 份简报和报告,其中很大一部分涉及自主系统。这是高层领导影响未来自主系统政策、资金和采购途径的关键机会。提供了直接适用于《国防授权法案》任务分配的三项关键建议,并辅以具体实例,美国防部将评估这些建议,并将其纳入报告中。
数据必须优先考虑,而不是事后考虑。众议院军事委员会指示首席数字和人工智能办公室 "确保采购数据存储库的要求......对政府和行业利益相关者都是明确的",并指出美国防部长必须制定一项战略,"确保企业的人工智能工作能够吸收和纳入具有正确属性和标记的数据"。针对这些要求,美国防部应评估并报告是否有必要为联合集中式数据存储库提供资金,并维护能以尽可能低的分类级别将连续的真实世界数据流填充到这些数据库中的架构。此外,他们还应该考虑制定通用词典的建议,以便对数据的准备情况及其产生的模型进行分类。
持续监控是建立信任的关键。美国防部长/首席数字与人工智能办公室的联合报告将讨论 "在包括虚拟和现实世界在内的所有环境中测试、评估、验证和确认自主软件的能力"方面的差距。对此,这些部门可以考虑建议国防部投资技术解决方案,在设计时验证和确认系统,并在部署后使人类能够在系统学习和适应的过程中评估运行可靠性的变化。此外,国防部还可考虑要求所有自主系统在开发过程中同时具备现实模拟能力,以便在测试和运行过程中对不断变化的系统行为进行持续的、人类可理解的评估。
人是采用和集成的解决方案。美国防部长的任务是制定一项全面计划,以 "实现自主系统的快速技术进步和采用",特别是在联合全域指挥与控制方面。委员会还呼吁联合 "评估自主软件资源和集成工作的现状"。在报告中,美国防部可考虑提供 "自主过渡专家",以确保作战单元了解如何训练自主算法以满足其任务需求,以及如何量化采用演进系统的风险。对于商业开发的软件,合同应包括软件工程师与作战单元一起部署的条款,帮助他们在学习和适应过程中了解自主系统的能力和局限性。
战场上信息流动的速度要求自主系统能够对其进行处理并采取行动。面对在原始能力上超过自己的近邻对手,必须尽快做到这一点。但是,目前的程序并不适合在需要的时间和地点获取和部署自主系统。自主系统需要正确的数据来将感知转化为行动,采购部门需要新的验证和确认方法来持续证明其动态可靠性。此外,作战单元需要既了解系统又了解任务式指挥的人员,以帮助指挥员充分了解如何在战场上使用关键技术。
参考来源:DEFENSEAC QUISITION