本文主张军队必须采取审慎而系统化的方法将生成式人工智能整合到军事决策流程中。通过类比历史上坦克和飞机的引入,警示既要避免技术利用不足,也要防止被过度宣传的能力所误导。以生成式人工智能系统“多诺万”(Donovan)作为案例研究,本评论重点指出了当前系统的关键缺陷,例如缺乏计算和地理空间推理能力,并指出了阻碍改进的采购挑战。本文认为,仅仅使用生成式人工智能来加速旧有流程将浪费其潜力。相反,主张利用专业军事教育中的兵棋推演和实验作为压力测试,以正确定义需求、管理人员的认知负荷,并引导私营部门开发真正符合作战人员需求的解决方案,最终提升军事决策水平。

在开始将人工智能采纳到几乎全部作战领域之际,值得思考从整合以往颠覆性技术中汲取的一些经验教训。坦克和飞机在最初投入使用时,其扮演的角色都未能充分发挥其潜力。例如,坦克无法发挥其卓越的机动性,因为它们最初被配属给步兵,而在战斗中,步兵的行进速度仅如士兵步行一般。飞机被降格用于侦察角色,因为指挥官们对其进攻能力持怀疑态度。甚至军事航空先驱比利·米切尔准将最初也认为航空兵应隶属于通信兵。

另一方面,这两种技术也都曾被过度吹捧。在两次世界大战之间的年代,英国理论家巴兹尔·亨利·利德尔·哈特爵士和J.F.C.富勒认为坦克将使步兵在很大程度上过时。意大利空军元帅朱利奥·杜黑著名地论证,轰炸机能够迫使敌人投降,而无需进行代价高昂的地面战斗。最终,这些技术以某种方式找到了自己的道路,因为军队进行了实验、创新,并且最重要的是,制定了关于如何最佳使用它们的条令。

在这两种情况下,倡导者从创新的新颖性中过度推断,而没有充分考虑充分利用它所需的条令、组织和后勤资源。他们的过度宣传也反映了一个事实,即倡导者常常将创新视为解决战争迷雾和摩擦的方案,却没有考虑它自身可能如何制造新的迷雾和摩擦。随着军队在使用这些武器系统方面积累经验,他们认识到坦克和飞机需要庞大的支援体系,这增加了摩擦的可能性,并催生了新的条令——其目的与其说是减少战争迷雾,不如说是为对方制造迷雾。对于生成式人工智能,可汲取的教训是,早期关于其具有颠覆性、能赢得战争效应的说法很可能误导实践者,除非配以对数据性质、模型如何使用数据及其对条令和资源分配的影响进行审慎、系统化的理解。

生成式人工智能的整合正处于与装甲战和空战早期阶段相似的节点。近期报告指出,即使在该技术已被采纳的地方,美军也尚未完全优化其使用。根据乔治城大学安全与新兴技术中心的报告,美军第十八空降军整合人工智能后实现的目标定位流程,在“伊拉克自由行动”期间大幅减少了所需人员数量。尽管存在这一事实,这些组织效率尚未反映在条令或该军火力支援分队在全陆军的调整中。在另一案例中,正如美智库战略与国际研究中心近期报告所观察到的,未能对计算基础设施进行投资和培养懂人工智能的人员,有可能导致传统流程碎片化,并增加遭受对手攻击的脆弱性。

与此同时,人工智能技术常常被过度宣传。例如,生成式人工智能系统“多诺万”(Donovan)宣称能够“在作战人员最需要的时候和地点,将强大的作战能力交付其手中”。然而,当美陆军战争学院战略领导力中心的兵棋推演人员于2025年5月下旬将其整合到一场为期一周、秘密层级、作战级别的兵棋推演中时,他们发现了该系统功能上的三项关键缺陷,这些缺陷限制了其执行某些关键计划功能的能力,包括对军事计划至关重要的计算和地理空间能力缺失,以及一个使得供应商难以根据观察到的缺陷进行适应的采购系统。

与大多数生成式人工智能系统一样,“多诺万”(Donovan)返回的是概率性结果,并且缺乏执行计算的内在能力。因此,如果被要求计算移动时间或其他关键计划信息,它会利用其数据库来猜测答案,而不是自行执行计算。它还缺乏地理空间推理能力,这使得它在计算(例如)机动表格时更加不可靠。此外,由于它缺乏在无定向管理情况下回忆先前迭代所需的记忆能力,其从用户交互中学习的能力有限。

然而,采购体系限制了供应商为解决任何关切所能采取的行动。在2025年9月于华盛顿特区举行的首席数据与人工智能办公室国防会议上,供应商和行业领袖们都认识到,获取有效的、作战层级的反馈来改进其产品存在困难。在本案例中,为“多诺万”(Donovan)及其他供应商许可证提供资金的“全球整合主导实验”项目,并未能使政府获得资金以进行进一步开发来解决已发现的问题。其结果是,“多诺万”(Donovan)的性能未能得到改善。这里的问题在于,需要制定一种采购策略,既能通过奖励能力创建来激励实验,又能通过提供足够资金以避免供应商遭受财务损失来鼓励参与。在这样的采购环境中,像美军第十八空降军这样的作战单位,被迫继续试用那些不足以完成所需任务的系统,并发布结果,以期吸引声称拥有有效解决方案的供应商。目前,美陆军战争学院战略领导力中心正在探索通过合作研发协议、小企业创新研究计划以及陆军现有合同载体等创新性资金途径,以促进与美陆军能力相匹配的实验和开发。

整合颠覆性技术的困难在于找到使其可持续的方法。遗憾的是,维持性创新是指那些提升传统上受重视的作战职能绩效的创新。然而,颠覆性创新则是指那些提升先前未被重视的作战职能绩效的创新。生成式人工智能显然属于后一种情况。如果生成式人工智能仅用于加速旧有流程,那么它将始终未被充分利用。要发现生成式人工智能能为哪些其他职能带来价值,例如取代旧有的记录软件程序,将需要在较低层级进行实验和创新——很大程度上就像比利·米切尔为空中力量所做的那样——从而为体制改革提供信息。

要达到这一点,将需要高级领导人和采办专业人士改善与私营部门的互动,使其技术与陆军需求保持一致。像“FUZE”这样的项目,能够使各军种更快速地整合现有技术以适应陆军需求,或许是一个良好的开端。然而,正如“多诺万”(Donovan)的例子所示,参与采购和获取流程的人员必须理解技术需要具备哪些能力才能达成期望的结果:例如,如果你想生成机动表格,你的人工智能助手必须能够执行必要的计算。

此外,他们必须理解商业激励机制如何影响人工智能的设计。这样做需要在炫目的技术优越感之中,始终保持对人工智能整合战略概念的关注。商业激励优先考虑最广泛的应用以控制成本,其结果是军方接收到的是与高中生用来写学校报告相同的生成式人工智能模型。此类“军民两用”方式,即军方将民用应用适配于自身需求,可能无法满足所有军事要求。为了获得更好的结果,还必须理解一家公司是如何根据其潜力而非收入进行估值的,这是衡量其是否愿意迭代直至成功交付能力的一个指标。潜力越高且收入损失越低,政府与供应商的关系就越有可能取得丰硕成果。

这一点并非是说军方不应利用民用应用。通常,它们足够有能力,是军方获取技术最经济的路径。然而,负责其获取、采购和整合的人员需要充分理解该技术将如何被使用,以便评估其适用性和可持续性。例如,军方需要高度训练的模型,这对于提升指挥和参谋机构在管理暴力行动中的认知表现至关重要。为了优化这些流程,陆军领导人需要理解人工智能技术如何重新分配认知负荷,进而理解承担该负荷所需的能力。从需要许多大脑到仅需少数大脑,若不改变这些大脑的思考方式和组织方式,是无法实现的。参与人工智能实验和应用的第十八空降军人员将这种重新分配称为“用数据作战”,而非以传统做法为特征的“用武器作战”。

因此,陆军和联合部队须建立并利用采购体系,激励私营部门的专业知识,为各指挥层级的作战人员生产所需之物。实现此目标的一种途径是在专业军事教育中投资于兵棋推演的研究与开发。在认知领域,这些环境使系统接受人类层级的作战评估。人工智能系统在陆军参谋机构内部的演进将需要个体定制化,以防止认知启发式错误。模型必须通过接受不确定性、对数据来源保持透明以及管理认知负荷,来促进人类对计划和流程的主导权,从而优化人与机器的贡献。需要进行这种“压力测试”,以确保人工智能解决方案满足作战人员的需求,而不是相反。德怀特·D·艾森豪威尔曾指出的:“在准备战斗时,我总是发现计划是无用的,但计划工作不可或缺。”这对人工智能系统的启示在于,如果计划工作的过程对人类是有价值的,那么将人类从该过程的关键环节中移除将会降低其效益。

为了促进这些效益,美陆军战争学院战略领导力中心继续在战区级兵棋推演中测试现有解决方案,首要目的是评估其在作战环境中的表现;其次是为了更好地界定军在军级以上层级需要什么来促进决策。2026年春季,美陆军战争学院战略领导力中心将为新成立的西半球司令部领导一场战略级兵棋推演。这场推演将使一个新成立的司令部能够演练保卫本土,并确立评估生成式人工智能系统的标准。

在专业军事教育中赋能持续实验是采购领域的一项重要调整。在战争的认知维度,专业军事教育在理解如何为提升陆军和联合计划流程中的认知能力进行正确的概念整合以推动技术解决方案方面,保持着优势。迄今为止,美陆军过度关注技术的展示,而非与陆军作战方式相一致的、经过验证的性能。生成式人工智能具有潜力,但就其目前形式而言,并不适合在战略层级增强高级领导人的认知能力。

美军认为,美国工业基地已准备好做出响应,陆军也在赋能硅谷,以推进作战人员在战争的认知维度保持优势。生成式人工智能的整合将在军事中找到自己的道路,就像坦克和飞机曾经那样。然而,与坦克和飞机不同的是,这次的赌注可能更高,因为这些新系统几乎与军队的每个系统都相互作用,并影响着最大的优势——领导人如何思考和决策。现在的责任在于要重新掌握话语权,通过兵棋推演赋能商业部门,以增强决策能力和杀伤力。

参考来源:美陆军战争学院

成为VIP会员查看完整内容
3

相关内容

人工智能在军事中可用于多项任务,例如目标识别、大数据处理、作战系统、网络安全、后勤运输、战争医疗、威胁和安全监测以及战斗模拟和训练。
微信扫码咨询专知VIP会员