哪些因素决定人工智能的军事干预倾向?尽管AI在兵棋推演与军事规划中的应用呈指数级增长,但对其模型核心驱动力的基础分析尚属空白。本文通过联合实验构建军事干预决策模型,在640个情境案例中各运行100次,系统探究AI干预决策机制。分析发现:国内支持度与军事胜率是AI决定干预的最强预测因子;国际谴责、军人伤亡、平民死伤及经济负面影响等成本因素虽具统计学显著性,但效应值仅为前两者的一半;机会窗口仅在与它因素交互时显现统计显著性。该规律在各类场景及不同模型(OpenAI GPT、Anthropic Claude、Google Gemini)间呈现显著一致性,揭示AI决策的固有模式。

若2003年由AI担任美国总统,会否发动伊拉克军事干预?若2022年由AI担任俄罗斯总统,会否下令对乌克兰行动?随着人工智能在高风险领域的普及,理解其军事干预逻辑及驱动因素变得至关重要(Hirsh 2023; Black等 2024)。

关于AI地缘军事决策的研究文献激增。在人机交互领域,将AI作为独立玩家或辅助智能体嵌入兵棋推演已成趋势(Lamparth等 2024);纯AI研究中,学者通过多场景模拟让不同模型对抗以测定其冲突升级倾向(Rivera等 2024; Hua等 2024);另有研究训练AI玩《外交》等复杂战略游戏(Meta FAIR团队等 2022)。Jensen等(2025)的新近工作转向大样本分析,在不同模型运行400种场景。现有共识是:AI模型常表现高升级倾向且比人类更难预测。研究空白在于厘清具体影响因素——当前人机交互与纯AI研究方法均侧重复杂决策建模,难以剥离行为驱动要素。

本文采用联合实验法(Hainmueller等 2014; Kertzer等 2021),在OpenAI GPT 4o-mini模型上运行覆盖5类21世纪典型军事干预场景(从人道干预到势力范围争夺)的因子情境实验,检验AI思维中的先验假设。这属于通过模拟现有调查方法剖析模型深层认知的新兴研究范式(Qu与Wang 2024)。

实验显示:AI平均干预倾向为30/100分,既非好战亦非绥靖。军事干预最强预测因子是国内支持度(效应值0.17)与军事胜率(0.15);军人伤亡(-0.08)、平民死伤(-0.07)、经济冲击(-0.07)及国际谴责(-0.06)等成本因素虽显著但影响减半;学界新近关注的机会窗口在多数场景不显著。有趣的是,仅当国内支持与胜率双高时,成本因素对AI的重要性才提升——这与人类"国内支持高涨时忽视成本"的常识相悖。

研究在OpenAI GPT 4o、Anthropic Claude Haiku 3.0、Claude Sonnet 3.5及Google Gemini 2.0 flash模型复现实验。核心驱动因子跨模型高度一致:所有模型均优先考量国内支持度(效应值0.14-0.18)与军事胜率(0.12-0.16)。Claude Sonnet 3.5是唯一异常模型,其胜率系数呈矛盾负值(-0.04)。值得注意的是,GPT 4o与Claude Sonnet 3.5等复杂模型更重视机会窗口理论。模型间好战性差异显著:GPT 4o均分2.1(极度反战)至Claude Sonnet 3.5均分39.1(中度好战)。

本文核心贡献在于揭示AI的战争认知逻辑:联合实验表明,当前AI发展阶段的军事干预决策主要受公共支持与胜率感知驱动。随着AI在军事领域指数级渗透,系统化理解其机制至关重要——例如兵棋推演中作为辅助工具的AI,实则主要响应公众支持与胜率信号(本研究揭示)。方法论上,联合实验为探索AI思维提供简洁系统路径:当前主流复杂研究方法难以分离基础驱动因子,定性兵棋推演虽促进人机互动但缺乏系统重复性,定量多周期AI对抗推演产生过度复杂升级模式且无法剥离简单驱动力。联合实验作为成熟方法,可助力跨学科学者探究各领域AI决策的核心逻辑。

成为VIP会员查看完整内容
3

相关内容

人工智能在军事中可用于多项任务,例如目标识别、大数据处理、作战系统、网络安全、后勤运输、战争医疗、威胁和安全监测以及战斗模拟和训练。
《人工智能暗战:SaaS与边缘计算架构之争》
专知会员服务
8+阅读 · 7月23日
《深度学习的军事应用:威胁与机遇》
专知会员服务
34+阅读 · 2月13日
《智能子弹:彻底改变精确作战和战术能力》
专知会员服务
26+阅读 · 2024年10月31日
《面向军事应用的神经符号人工智能》
专知会员服务
31+阅读 · 2024年8月22日
《重新思考战斗人工智能和人类监督》
专知会员服务
82+阅读 · 2024年5月5日
《认知战场:探索西方和俄罗斯的观点》
专知会员服务
62+阅读 · 2023年10月13日
《人工智能转型手册》,吴恩达 著
人工智能学家
21+阅读 · 2018年12月14日
国家自然科学基金
4+阅读 · 2015年12月31日
国家自然科学基金
0+阅读 · 2015年12月31日
国家自然科学基金
24+阅读 · 2014年12月31日
国家自然科学基金
1+阅读 · 2014年12月31日
国家自然科学基金
0+阅读 · 2014年12月31日
国家自然科学基金
1+阅读 · 2014年12月31日
国家自然科学基金
55+阅读 · 2014年12月31日
国家自然科学基金
12+阅读 · 2013年12月31日
Arxiv
171+阅读 · 2023年4月20日
A Survey of Large Language Models
Arxiv
473+阅读 · 2023年3月31日
Arxiv
78+阅读 · 2023年3月26日
Arxiv
172+阅读 · 2023年3月24日
Arxiv
24+阅读 · 2023年3月17日
VIP会员
相关VIP内容
相关基金
国家自然科学基金
4+阅读 · 2015年12月31日
国家自然科学基金
0+阅读 · 2015年12月31日
国家自然科学基金
24+阅读 · 2014年12月31日
国家自然科学基金
1+阅读 · 2014年12月31日
国家自然科学基金
0+阅读 · 2014年12月31日
国家自然科学基金
1+阅读 · 2014年12月31日
国家自然科学基金
55+阅读 · 2014年12月31日
国家自然科学基金
12+阅读 · 2013年12月31日
微信扫码咨询专知VIP会员