博弈论广泛应用于军事对抗和冲突事件建模。如何利用智能博弈相关技术与方法辅助决策是 认知智能领域的前沿课题。伴随着人工智能技术的发展,特别是大型预训练模型理论的推动,智能 博弈决策策略求解的一些新视角逐渐受到广泛关注和探讨。结合人工智能技术的发展与智能博弈决 策策略求解范式的转变,以国际象棋(两人零和完美信息博弈)、强权外交(多人一般和不完美信息 博弈)两款桌面游戏,星际争霸(多智能体马尔可夫博弈)为序贯决策实证分析研究对象,依循人 工智能发展的新视角分析策略求解新范式、新方式,从决策大模型范式、生成式人工智能模型、大 模型智能体关键技术共 3 个方面探析智能博弈决策大模型关键技术,为新技术体制下智能博弈决策 问题的研究提供借鉴。
随着人工智能、云原生、弹性通信等技术范 式的变革,博弈强对抗的多域战场未来将朝着模 块分散化、无人自主化、智能赋能化方向大步迈 进。近年来,美军陆续提出了分布式作战、联合 全域作战、马赛克战、决策中心战等新型作战概 念,为其未来的智能指控系统开发提供了蓝图引 领。基于“算力+算法+数据”三者的螺旋融合, 面向智能博弈求解的算法博弈论、强化学习、对 手建模、元学习、持续学习等方法被广泛应用于 金融、经济、交通等民用领域、指挥控制与决策 辅助等军事领域。 面对巨复杂、高动态、不确定、强对抗环境, 智能博弈技术为探索认知决策博弈制胜机理提供 了有效工具。随着人工智能技术的发展,近年来 各类不同的概念层出不穷,从“计算智能”—“感 知智能”—“认知智能”研究范式转变、认知领 域“决策智能”、“博弈智能”[1]等概念细分,直 至桥接“计算智能”与“人工智能”的“算法智 能”[2],以 ChatGPT 为代表的“生成式智能”, 当前依赖“交互”习得智能的相关研究已然取得 了突破,但如何应对不确定环境、做出鲁棒、安 全与自适应决策依然充满挑战。 本文采用实证分析视角切入,从国外兵棋推 演相关技术研究的聚焦点出发,根据智能博弈技 术研究进展,结合三类基准(国际象棋、强权外 交、星际争霸)对当前三类典型博弈(完美信息 博弈、不完美信息博弈、马尔可夫博弈)求解方 法进行了全面梳理,围绕开放式博弈问题、根据 博弈策略求解范式转变,分析了智能博弈决策大 模型相关支撑技术与智能体设计方式。