人类收集信息、了解情况、优化行动和边执行边学习的能力最近在游戏、模拟器、诊断和实时分析中受到了挑战。这种发展会如何反映到未来的战术战斗决策中?机器会在战斗中战胜人类吗?
"这不仅需要大量的资源投入,还需要一种开放的思想和探索性的方法,这与人们通常认为军事组织是保守实体但有时被夸大的看法形成鲜明对比"。梅厄-芬克尔(芬克尔 2023 年)
"第五代战争将重点从物理维度的兵力转移到影响信息维度,在人工智能、自动化和机器人等新兴技术的推动下,叙事和认知占据了中心位置。" 丹尼尔-阿博特(阿博特,2010 年)
这篇文章回顾了人工智能领域最近取得的一些成就,介绍了作战技术层面的功能,深入探讨了压力条件下的决策,并阐述了对未来状态的可能展望。其目的是撼动历史上保守的陆战概念,考虑未来的可能性。
表 1 显示了机器学习在各种战略战术游戏和竞赛中的进步,从中可以看出,在桌上游戏、纸牌游戏、视频游戏和创造力竞赛中,机器正在追赶并超越人类。此外,在这些游戏中,快速学习通用算法正在击败专用算法。
表 1:机器学习在游戏和创造力方面应用的改进示例
年份 | 对抗 | 进步 |
---|---|---|
1997 | 国际象棋:DeepMind 对战加里-卡斯帕罗夫 | IBM 花了 11 年的时间来制造和使用定制芯片来执行并行搜索。DeepMind 能够每秒评估 2 亿个位置。 |
2016 | 围棋:AlphaGo对战李世石 | 基于神经网络的算法首先从对局数据中学习,然后与自己对弈,最后根据所犯的错误进行改进。AlphaGo 能够在对局中创造出一种从未见过的棋步。 |
2017 | 国际象棋:AlphaZero对Stockfish(2016 年顶级国际象棋引擎) | 通用强化学习算法在与自己对弈 4 小时后学会了国际象棋。AlphaZero 能够每秒评估 80 000 个局面。 |
2017 | 将棋:AlphaZero对艾莫(2017 年将棋引擎世界冠军) | 算法在自己下棋 2 小时后就学会了棋局。AlphaZero 能够在比国际象棋有更多选项的棋盘上每秒评估 40 000 个局面。 |
2017 | 围棋:AlphaZero 对战 AlphaGo Lee(高级围棋引擎) | 采用 tabula rasa 强化学习算法的深度神经网络。该算法在三天内学会了游戏,同时自己也在玩游戏。 |
2017 | 扑克:Liberatus 与四位扑克冠军选手对决 | 该算法采用博弈论方法,在不完全信息环境中进行推理,同时与四名具有以下能力的人类玩家进行比赛:提前管理整个扑克比赛;在比赛期间解决每个游戏;在为期三周的比赛中每天结束后进行自我改进 |
2019 | Dota 2:开放式人工智能五人组对抗5名电竞玩家组成的团队 | 该算法采用近端策略优化。该算法使用 800 petaflops/s,在 10 个月内获得了约 45 000 年的经验。短期平均决策时间为 80 毫秒。 |
2020 | AlphaFold2 在 "结构预测关键评估 "中的得分比人类竞争对手高出一倍。 | 该算法根据复杂的规则预测三维结构,比人类更快、更全面。 |
2022 | 人工智能模型使用数十 TB 的地球系统数据,预测未来两周天气的速度和准确度是当代预测方法的数万倍。 | 利用海量数据,ML 算法可以对非常复杂的现象进行预测。 |
总之,从理论上讲,具备上述功能的机器可以
概率和机会是公认的作战环境因素(克劳塞维茨,1984 年)(富勒,2012 年)(奥利维罗,2021 年)。战术——技术层面的作战能力是出其不意、机动、大规模、火力和节奏(仅列举一些基本原则)的总和,通过与指挥和控制的各种组合来扰乱对手的社会--技术军事系统并耗尽其战斗力。(弗里德曼,2017 年)战术原则正在转型,以应对战场上可预见的变化。首先,让我们回顾一下陆战中最可能发生的变化,其次,看看这些变化将对战术要领提出哪些要求。
RUSI陆战会议(RUSI 2023)提出了以下陆战变化趋势,这些趋势将对当代战术提出挑战:
1.透明战场
2.集中效应与防护
3.维持
4.态势感知
5.无边界的城市作战空间
总之,下表 2 反映了上述传统战术原则的变化趋势,并说明了对作战技术和战术可能产生的影响,以及因此而改变的战术意识和决策。
表 2:陆战中明显的变化趋势如何影响地面作战的战术原则?
原则/倾向 | 出其不意 | 机动 | 兵力集结 | 火力 | 节奏 |
---|---|---|---|---|---|
透明度 | 陆地上的出其不意可以通过其他领域和层面获得。 | 由较小、不易察觉的平台组成的蜂拥机动。 | 集中式具有杀伤力,但分布式是规则。 | 如果能实现态势感知,则目标捕获更具杀伤力。 | 在透明的战场上更难获得优势。 |
效应 | 系统效应可出其不意,破坏兵力凝聚。 | 大型、移动、高温和辐射平台很容易成为攻击目标。 | 需要大量灵活、小巧、机动的弹头。 | 4IR 生产软件定义的效应器。 | 分散的效应器会增加摩擦和不确定性。 |
维持 | N/A | 更高的机动性和更广泛的分布掩盖了后勤工作。 | 分散的部队增加了后勤方面的挑战。 | 智能弹头需要软件维护。 | 除了实弹补给,兵力还需要技术维护。 |
态势感知 | 数字化 C2 带来更多认知瓶颈。 | 成为分布式效应器蜂拥而至的核心因素和弱点。 | 成为核心因素和薄弱环节。 | 成为核心因素和薄弱环节。 | 成为核心因素和薄弱环节。 |
城市化 | 在物理维度上提供隐蔽性。 | 减慢机动速度,促进小型、自主和敏捷平台的发展。 | 限制单位的集结,但更喜欢小型、蜂拥的效应器。 | 有利于防御,但制约进攻。 | 减慢单位速度,增加不确定性。 |
约翰-博伊德(John Boyd)定义的经典军事决策框架简化为观察、定位、决策和行动(OODA)(Osinga,2007 年)。根据这一框架,图 2 展示了感知与决策的概念。在这种情况下,感性决策由观察和定向组成,用于解释模棱两可的数据。(马蒂拉,2016 年)此外,决策是在预测结果、能力和制约因素之间寻找和选择最优化的替代方案。(马蒂拉,2016 年)这一概念有三种不同的态势图:每个领域的实时事件、组成的行动图和预测的可能/预期态势,这些态势图参考现有信息,最后在社会认知层面共享并达成一致。
图 2:军事战术层面的 "观察、定向和决策 "概念
上述指挥与控制(C2)概念的建立可以强调创造性领导或遵守政策。这些重点建立在兵力产生的文化基础之上。例如,1871-1945 年间的德国文化提倡军官在战场上采取自主和积极的行动。(Mansoor and Murray 2019)相反,在布尔什维克政府的兵力操纵之后,俄罗斯文化培养出了服从命令的年轻军官,并在作战层面依赖经验丰富、足智多谋的指挥官。(弗里德曼,2022 年)
成功的军事指挥应该是遵守制度管理文化与创造性作战艺术的结合。(Kuronen 2015)二战前的德国文化将战争视为 "一种艺术,一种建立在科学原则基础上的自由和创造性活动"。(Condell 和 Zabecki,2008 年)美国 FM 5-0 要求适应性领导"......不是线性思维,而是在寻求解决问题之前先了解问题的复杂性......"(Cojocar,2011 年)另一方面,北约用五项功绩衡量标准来评估军事成功,其中只有一项,即绩效衡量标准(MoP),包含了一些个人领导特征。(CCRP 2002)其他四项则强制要求遵守条令和流程。(北约 RTO,2002 年)1/5 的期望比率并不表明北约军官在战术决策方面具有创新性。
在战术承诺层面,所有努力都应着眼于赢得主动权,并最终战胜对手(将对手战斗力削弱 30% 以上)。(Oliviero 2021, 51)在现实中,并非所有军官都能做到这一点:
研究(Henaker,2022 年)(Scott 和 Bruce,1995 年)(Loo,2000 年)得出的结论是,个人在做出重要决策时可分为五种不同的决策风格: 理性型、直觉型、依赖型、回避型和自发型。
本节将战术战斗的原则与可见的变化融合在一起,并尝试在以人为中心和以机器为中心的决策中反映这些新情况,如前几节所述。表 3 从两位冠军的角度说明了融合的结果:
表 3:快速变化的战术作战环境中的人机决策对比
战术作战原则的转变带来决策挑战 | 人类 | 机器 |
---|---|---|
透明度增加了信息量,需要更强的计算能力来理解收集到的数据。在战术上,更倾向于使用规模较小、高度分散、机动性强的效应器,这些效应器会蜂拥而至,并迅速撤退。 | 现有的数据和信息可能会使理解情况的认知能力不堪重负。 | 机器可以识别图像,从大量数据中找出规律,并预测复杂、相互依存的行为。 |
效果需要系统理解,才能产生全系统影响。分散的效应器更难控制和协调。软件定义的精确度要求更好的目标获取和配置。 | 必须将对手视为多维行动者网络(Inglis 和 Thorpe,2019 年)。分散的效应器需要协调更多细节。 | 机器可以绘制 COA 频谱,为复杂、相互依存的系统建模,并优化小型效应器的行动。 |
分布式网络物理平台的维护需要更加灵活和专业的维护。 | 可用性或持续性关键路径的复杂性不断增加,可能会在压力下压垮认知能力。 | 通过数字孪生模型和基于场景的模拟,机器可以创建一个整体的后勤图景,并优化维护工作。 |
将感性认识下放给较低的合作层次,或提高等级较高的指挥结构的信息管理能力,就能实现感性认识。 | 社会文化结构和信仰阻碍了最佳 C2 方法的应用。 | 社会文化结构并不限制机器的行动,即使在不完整的信息环境下,机器也能行动。 |
城市化增加了熵,减缓了战术节奏,增加了伤亡,提高了对持续性的需求,并使环境和形势变得更加难以理解。 | 城市环境增加了不确定性,需要更具创新性的决策。 | 即使只有部分信息,机器也能理解复杂的情况,更快地识别不稳定的行为,并优化努力和持续。 |
在未来战场的战术场景中,当一名人类指挥官与一名前机械人上尉相遇时,作战双方的决策能力可能会有所不同。在兵力相等、条令一致、战场相当稳定的情况下,连长不可能战胜前机械人。而富有创造力的人类指挥官则可能在更加混乱的条件下,通过创新战术获得优势。我们的军事院校在培养敏捷型军官吗?不过,在《Dota 2》战略游戏中,较高的人机协作表现还是值得肯定的,但这还有待今后的文章进行研究。
图 3:战术决策中的人机对比