智能博弈决策策略求解新视角实证分析

博弈论广泛应用于军事对抗和冲突事件建模。如何利用智能博弈相关技术与方法辅助决策是认知智能领域的前沿课题。伴随着人工智能技术的发展，特别是大型预训练模型理论的推动，智能博弈决策策略求解的一些新视角逐渐受到广泛关注和探讨。结合人工智能技术的发展与智能博弈决策策略求解范式的转变，以国际象棋(两人零和完美信息博弈)、强权外交（多人一般和不完美信息博弈）两款桌面游戏，星际争霸（多智能体马尔可夫博弈）为序贯决策实证分析研究对象，依循人工智能发展的新视角分析策略求解新范式、新方式，从决策大模型范式、生成式人工智能模型、大模型智能体关键技术共 3 个方面探析智能博弈决策大模型关键技术，为新技术体制下智能博弈决策问题的研究提供借鉴。

随着人工智能、云原生、弹性通信等技术范式的变革，博弈强对抗的多域战场未来将朝着模块分散化、无人自主化、智能赋能化方向大步迈进。近年来，美军陆续提出了分布式作战、联合全域作战、马赛克战、决策中心战等新型作战概念，为其未来的智能指控系统开发提供了蓝图引领。基于“算力+算法+数据”三者的螺旋融合，面向智能博弈求解的算法博弈论、强化学习、对手建模、元学习、持续学习等方法被广泛应用于金融、经济、交通等民用领域、指挥控制与决策辅助等军事领域。面对巨复杂、高动态、不确定、强对抗环境，智能博弈技术为探索认知决策博弈制胜机理提供了有效工具。随着人工智能技术的发展，近年来各类不同的概念层出不穷，从“计算智能”—“感知智能”—“认知智能”研究范式转变、认知领域“决策智能”、“博弈智能”[1]等概念细分，直至桥接“计算智能”与“人工智能”的“算法智能”[2]，以 ChatGPT 为代表的“生成式智能”，当前依赖“交互”习得智能的相关研究已然取得了突破，但如何应对不确定环境、做出鲁棒、安全与自适应决策依然充满挑战。本文采用实证分析视角切入，从国外兵棋推演相关技术研究的聚焦点出发，根据智能博弈技术研究进展，结合三类基准（国际象棋、强权外交、星际争霸）对当前三类典型博弈（完美信息博弈、不完美信息博弈、马尔可夫博弈）求解方法进行了全面梳理，围绕开放式博弈问题、根据博弈策略求解范式转变，分析了智能博弈决策大模型相关支撑技术与智能体设计方式。