作战战术决策中的人机对比

人类收集信息、了解情况、优化行动和边执行边学习的能力最近在游戏、模拟器、诊断和实时分析中受到了挑战。这种发展会如何反映到未来的战术战斗决策中？机器会在战斗中战胜人类吗？

"这不仅需要大量的资源投入，还需要一种开放的思想和探索性的方法，这与人们通常认为军事组织是保守实体但有时被夸大的看法形成鲜明对比"。梅厄-芬克尔（芬克尔 2023 年）
"第五代战争将重点从物理维度的兵力转移到影响信息维度，在人工智能、自动化和机器人等新兴技术的推动下，叙事和认知占据了中心位置。" 丹尼尔-阿博特（阿博特，2010 年）

这篇文章回顾了人工智能领域最近取得的一些成就，介绍了作战技术层面的功能，深入探讨了压力条件下的决策，并阐述了对未来状态的可能展望。其目的是撼动历史上保守的陆战概念，考虑未来的可能性。

人工智能在决策方面的进步

表 1 显示了机器学习在各种战略战术游戏和竞赛中的进步，从中可以看出，在桌上游戏、纸牌游戏、视频游戏和创造力竞赛中，机器正在追赶并超越人类。此外，在这些游戏中，快速学习通用算法正在击败专用算法。

表 1：机器学习在游戏和创造力方面应用的改进示例

年份	对抗	进步
1997	国际象棋：DeepMind 对战加里-卡斯帕罗夫	IBM 花了 11 年的时间来制造和使用定制芯片来执行并行搜索。DeepMind 能够每秒评估 2 亿个位置。
2016	围棋：AlphaGo对战李世石	基于神经网络的算法首先从对局数据中学习，然后与自己对弈，最后根据所犯的错误进行改进。AlphaGo 能够在对局中创造出一种从未见过的棋步。
2017	国际象棋：AlphaZero对Stockfish（2016 年顶级国际象棋引擎）	通用强化学习算法在与自己对弈 4 小时后学会了国际象棋。AlphaZero 能够每秒评估 80 000 个局面。
2017	将棋：AlphaZero对艾莫（2017 年将棋引擎世界冠军）	算法在自己下棋 2 小时后就学会了棋局。AlphaZero 能够在比国际象棋有更多选项的棋盘上每秒评估 40 000 个局面。
2017	围棋：AlphaZero 对战 AlphaGo Lee（高级围棋引擎）	采用 tabula rasa 强化学习算法的深度神经网络。该算法在三天内学会了游戏，同时自己也在玩游戏。
2017	扑克:Liberatus 与四位扑克冠军选手对决	该算法采用博弈论方法，在不完全信息环境中进行推理，同时与四名具有以下能力的人类玩家进行比赛：提前管理整个扑克比赛;在比赛期间解决每个游戏;在为期三周的比赛中每天结束后进行自我改进
2019	Dota 2：开放式人工智能五人组对抗5名电竞玩家组成的团队	该算法采用近端策略优化。该算法使用 800 petaflops/s，在 10 个月内获得了约 45 000 年的经验。短期平均决策时间为 80 毫秒。
2020	AlphaFold2 在 "结构预测关键评估 "中的得分比人类竞争对手高出一倍。	该算法根据复杂的规则预测三维结构，比人类更快、更全面。
2022	人工智能模型使用数十 TB 的地球系统数据，预测未来两周天气的速度和准确度是当代预测方法的数万倍。	利用海量数据，ML 算法可以对非常复杂的现象进行预测。

总之，从理论上讲，具备上述功能的机器可以

从零基础开始训练，在几个月内掌握特定战斗场景的技术、战术，甚至可能是作战层面的特征，从而取得胜利。
比人类更好地预测对手的未来行动，绘制潜在场景图，预测对手在三维空间中的行动。
在 80 毫秒内做出短期决策，并同时在技术和战术层面优化决策。
从事件中汲取经验教训，一夜之间自学 150 年的理论作战经验。

地面作战的技术层面是一个复杂的军事决策环境

概率和机会是公认的作战环境因素（克劳塞维茨，1984 年）（富勒，2012 年）（奥利维罗，2021 年）。战术——技术层面的作战能力是出其不意、机动、大规模、火力和节奏（仅列举一些基本原则）的总和，通过与指挥和控制的各种组合来扰乱对手的社会--技术军事系统并耗尽其战斗力。(弗里德曼，2017 年）战术原则正在转型，以应对战场上可预见的变化。首先，让我们回顾一下陆战中最可能发生的变化，其次，看看这些变化将对战术要领提出哪些要求。

RUSI陆战会议（RUSI 2023）提出了以下陆战变化趋势，这些趋势将对当代战术提出挑战：

1.透明战场

民用和军用低地轨道卫星传感器可提供来自战场上空的持续信息。这些数据可从商业来源获取，并与经过训练的算法融合，以识别地面上的特别军事行动。
无人值守的地面传感器可改善细节，增加实时事件状况的可靠性。
由于传感器可以融合来自不同频谱的探测数据，掩护和隐蔽变得更加困难。
当信息在蓝方作战管理系统中流动时，对手就会迅速知道蓝方兵力的位置和动向。

2.集中效应与防护

对射武器、致命的自主武器系统和精确弹头使现代装甲的生存面临挑战。增加装甲厚度会降低战术机动性。
集中的装甲部队为常规火炮、攻击直升机或反坦克无人机系统的集结提供了有利可图的目标。
平台和行动者需要更具消耗性和分布性，但能够协调机动和射击。

3.维持

后勤保障能加快战斗节奏，对进攻行动至关重要。为分布式部队提供补给需要新的运送方法。
物资的移动和数量使后勤面临持续、大范围的监视，因此后勤的保护和持久性成为一项挑战。

4.态势感知

越来越多的数据和信息对感知能力提出了挑战，因为人类的认知能力会因大量信息而不堪重负，在刺激丰富的环境中失去注意力，并做出有失偏颇的结论。
组织文化可能会阻碍信息的传播（需要知道与需要分享；空隙安全与零信任安全），因此态势感知不符合分布式战术的要求。(曼苏尔和默里，2019 年）

5.无边界的城市作战空间

人们主要居住在城市环境中，军事战略的目标是 "抓住人民及其领导人的意志，从而赢得实力的较量"。(史密斯，2005 年）
城市战斗空间的参与者可能包括平民、社区当局、法律和救援机构、地方企业、国际企业、非政府组织、叛乱分子、商业军事公司、利益集团、民兵、犯罪组织、敌对正规军和敌对联盟部队等。(沃特曼，2019 年）
城市环境更为复杂，因为这些行动者没有明确的识别标志，他们的意图可能从白天转移到夜晚，而且他们不遵守有关战争罪的协议。

总之，下表 2 反映了上述传统战术原则的变化趋势，并说明了对作战技术和战术可能产生的影响，以及因此而改变的战术意识和决策。

表 2：陆战中明显的变化趋势如何影响地面作战的战术原则？

原则/倾向	出其不意	机动	兵力集结	火力	节奏
透明度	陆地上的出其不意可以通过其他领域和层面获得。	由较小、不易察觉的平台组成的蜂拥机动。	集中式具有杀伤力，但分布式是规则。	如果能实现态势感知，则目标捕获更具杀伤力。	在透明的战场上更难获得优势。
效应	系统效应可出其不意，破坏兵力凝聚。	大型、移动、高温和辐射平台很容易成为攻击目标。	需要大量灵活、小巧、机动的弹头。	4IR 生产软件定义的效应器。	分散的效应器会增加摩擦和不确定性。
维持	N/A	更高的机动性和更广泛的分布掩盖了后勤工作。	分散的部队增加了后勤方面的挑战。	智能弹头需要软件维护。	除了实弹补给，兵力还需要技术维护。
态势感知	数字化 C2 带来更多认知瓶颈。	成为分布式效应器蜂拥而至的核心因素和弱点。	成为核心因素和薄弱环节。	成为核心因素和薄弱环节。	成为核心因素和薄弱环节。
城市化	在物理维度上提供隐蔽性。	减慢机动速度，促进小型、自主和敏捷平台的发展。	限制单位的集结，但更喜欢小型、蜂拥的效应器。	有利于防御，但制约进攻。	减慢单位速度，增加不确定性。

军事感知与决策艺术

感知与决策的概念

约翰-博伊德（John Boyd）定义的经典军事决策框架简化为观察、定位、决策和行动（OODA）（Osinga，2007 年）。根据这一框架，图 2 展示了感知与决策的概念。在这种情况下，感性决策由观察和定向组成，用于解释模棱两可的数据。(马蒂拉，2016 年）此外，决策是在预测结果、能力和制约因素之间寻找和选择最优化的替代方案。(马蒂拉，2016 年）这一概念有三种不同的态势图：每个领域的实时事件、组成的行动图和预测的可能/预期态势，这些态势图参考现有信息，最后在社会认知层面共享并达成一致。

图 2：军事战术层面的 "观察、定向和决策 "概念

上述指挥与控制（C2）概念的建立可以强调创造性领导或遵守政策。这些重点建立在兵力产生的文化基础之上。例如，1871-1945 年间的德国文化提倡军官在战场上采取自主和积极的行动。(Mansoor and Murray 2019）相反，在布尔什维克政府的兵力操纵之后，俄罗斯文化培养出了服从命令的年轻军官，并在作战层面依赖经验丰富、足智多谋的指挥官。(弗里德曼，2022 年）

参与决策的军官团队

成功的军事指挥应该是遵守制度管理文化与创造性作战艺术的结合。(Kuronen 2015）二战前的德国文化将战争视为 "一种艺术，一种建立在科学原则基础上的自由和创造性活动"。(Condell 和 Zabecki，2008 年）美国 FM 5-0 要求适应性领导"......不是线性思维，而是在寻求解决问题之前先了解问题的复杂性......"（Cojocar，2011 年）另一方面，北约用五项功绩衡量标准来评估军事成功，其中只有一项，即绩效衡量标准（MoP），包含了一些个人领导特征。(CCRP 2002）其他四项则强制要求遵守条令和流程。(北约 RTO，2002 年）1/5 的期望比率并不表明北约军官在战术决策方面具有创新性。

在战术承诺层面，所有努力都应着眼于赢得主动权，并最终战胜对手（将对手战斗力削弱 30% 以上）。(Oliviero 2021, 51）在现实中，并非所有军官都能做到这一点：

训练强化了演习和战术形式，因此军官在决策时更愿意使用熟悉的概念来解决战场难题。
他们的观点可能会受到基本训练和武器的限制。步兵军官的目标是夺取地面，装甲部队军官的目标是拉开距离，或者炮兵军官评估射程、弹药数量和补给，以施加特定效果。
军官们所针对的 "红方兵力 "条令仍然是线性的、可预测的、缺乏想象力的对手。
由于实战演习成本高昂，军官们只能在兵棋推演中训练战术决策，而兵棋推演往往忽略了战场上的摩擦、迷雾、混乱和认知压力。

研究（Henaker，2022 年）（Scott 和 Bruce，1995 年）（Loo，2000 年）得出的结论是，个人在做出重要决策时可分为五种不同的决策风格：理性型、直觉型、依赖型、回避型和自发型。

理性型决策风格系统地寻求信息，偏好逻辑评估。然而，理性型在创造性和执行已决定的意图方面存在挑战。
直觉型从信息流中识别细节，并匹配感觉正确的模式。直觉与创造力和解决困难有积极的关系。
依赖型在决策前会寻求他人的社会一致性。决策过程可能会分心，需要社会支持。
回避型由于自卑而试图推迟决策。尽管如此，回避者还是会顺从政策、条令和命令。回避型的人不适合发挥创造力，而且往往压力很大。
自发型试图尽快完成决策。自发型不喜欢冲突环境，但在草率决策和高风险环境中表现出色。

未来战场上的人机决策对比

本节将战术战斗的原则与可见的变化融合在一起，并尝试在以人为中心和以机器为中心的决策中反映这些新情况，如前几节所述。表 3 从两位冠军的角度说明了融合的结果：

人被假定为受过 3-4 年军事教育和大约 5 年专业经验的普通决策军官，可能还有 1 年在实战战术行动中获得的经验。
机器被假定为一台高性能计算机，运行持续学习算法、专家算法和预训练算法与真实或合成数据的组合。数字连接应达到作战云级别。

表 3：快速变化的战术作战环境中的人机决策对比

战术作战原则的转变带来决策挑战	人类	机器
透明度增加了信息量，需要更强的计算能力来理解收集到的数据。在战术上，更倾向于使用规模较小、高度分散、机动性强的效应器，这些效应器会蜂拥而至，并迅速撤退。	现有的数据和信息可能会使理解情况的认知能力不堪重负。	机器可以识别图像，从大量数据中找出规律，并预测复杂、相互依存的行为。
效果需要系统理解，才能产生全系统影响。分散的效应器更难控制和协调。软件定义的精确度要求更好的目标获取和配置。	必须将对手视为多维行动者网络（Inglis 和 Thorpe，2019 年）。分散的效应器需要协调更多细节。	机器可以绘制 COA 频谱，为复杂、相互依存的系统建模，并优化小型效应器的行动。
分布式网络物理平台的维护需要更加灵活和专业的维护。	可用性或持续性关键路径的复杂性不断增加，可能会在压力下压垮认知能力。	通过数字孪生模型和基于场景的模拟，机器可以创建一个整体的后勤图景，并优化维护工作。
将感性认识下放给较低的合作层次，或提高等级较高的指挥结构的信息管理能力，就能实现感性认识。	社会文化结构和信仰阻碍了最佳 C2 方法的应用。	社会文化结构并不限制机器的行动，即使在不完整的信息环境下，机器也能行动。
城市化增加了熵，减缓了战术节奏，增加了伤亡，提高了对持续性的需求，并使环境和形势变得更加难以理解。	城市环境增加了不确定性，需要更具创新性的决策。	即使只有部分信息，机器也能理解复杂的情况，更快地识别不稳定的行为，并优化努力和持续。

一名连长遇到一名前机械人战斗上尉

在未来战场的战术场景中，当一名人类指挥官与一名前机械人上尉相遇时，作战双方的决策能力可能会有所不同。在兵力相等、条令一致、战场相当稳定的情况下，连长不可能战胜前机械人。而富有创造力的人类指挥官则可能在更加混乱的条件下，通过创新战术获得优势。我们的军事院校在培养敏捷型军官吗？不过，在《Dota 2》战略游戏中，较高的人机协作表现还是值得肯定的，但这还有待今后的文章进行研究。