以深度强化学习为核心的智能博弈技术在游戏领域内的突破和进展为海空兵棋 AI 的研究提供了借鉴。 智能体架构设计是需要解决的关键问题,良好的架构能够降低算法训练的复杂度和难度,加快策略收敛。 提出基于随 机博弈的海空跨域协同决策博弈模型,分析了相关的均衡解概念;在分析典型智能体框架基础上,针对海空兵棋推 演决策博弈过程,提出基于多智能体分层强化学习的智能体双层架构,能够有效解决智能体间协作和维度灾难问 题;从兵力协同、智能体网络设计、对手建模和训练机制共 4 个方面分析了关键技术。 期望为海空兵棋 AI 设计实现 提供架构指导。传统作战推演中智能体通常采用规则和分层状态 机等决策机制,推演采用基于事件驱动的仿真机制,智 能水平和灵活性较低。 近年来人工智能(Artificial In⁃ telligence, AI) 技术在围棋[1] 、德州扑克[2⁃4] 、星际争 霸[5] 、斗地主[6] 、Dota2 [7] 、王者荣耀[8] 等一系列游戏博 弈中取得重大突破和进展,其对抗水平基本达到或超 越了人类。 其中星际争霸等即时策略游戏与兵棋推演 问 题 最 为 相 似。 完 全 集 中 式 学 习 方 法 包 括 CommNet [9] 、BiCNet [10]等;集中式训练分散式执行方法 主要有反事实多智能体 ( Counterfactual Multi⁃Agent, COMA) [11] 、MADDPG [12] 、VDN [13] 、QMIX [14] 、QTRAN [15] 等。 这些以深度强化学习为核心的智能博弈技术发展 为利用兵棋的智能作战推演提供了新的解决途径。 本文首先基于随机博弈理论建立海空跨域协同决 策博弈模型及解概念;其次,在分析典型兵棋 AI 框架 的基础上,提出海空兵棋 AI“双层架构”设计方案;最 后,从兵力协同、智能体网络设计、对手建模和训练机 制方面分析了关键技术。

成为VIP会员查看完整内容
48

相关内容

人工智能在军事中可用于多项任务,例如目标识别、大数据处理、作战系统、网络安全、后勤运输、战争医疗、威胁和安全监测以及战斗模拟和训练。
军事信息系统情境计算需求一致性验证研究
专知会员服务
28+阅读 · 3月16日
下一代战略博弈推演系统研究
专知会员服务
95+阅读 · 1月27日
无人集群博弈对抗系统仿真验证及决策关键技术综述
专知会员服务
106+阅读 · 2023年11月23日
无人集群协同控制策略及军事应用
专知会员服务
101+阅读 · 2023年11月13日
信息时代指挥控制方式综述
专知会员服务
99+阅读 · 2023年10月28日
基于多智能体博弈强化学习的无人机智能攻击策略生成模型
空天防御装备作战管理发展思考
专知会员服务
69+阅读 · 2023年7月10日
知识与数据互补的战术级兵棋行为决策框架设计与实现
专知会员服务
94+阅读 · 2023年5月30日
单兵装备人机工效知识图谱构建技术
专知会员服务
58+阅读 · 2023年4月12日
无人预警机系统架构及关键技术分析
专知
12+阅读 · 2022年8月6日
深度学习研究及军事应用综述
专知
18+阅读 · 2022年7月7日
兵棋推演的智能决策技术与挑战
专知
24+阅读 · 2022年7月5日
国外有人/无人平台协同作战概述
无人机
103+阅读 · 2019年5月28日
红外弱小目标处理研究获进展
中科院之声
17+阅读 · 2017年11月19日
雷达海面目标识别技术研究进展
科技导报
18+阅读 · 2017年11月13日
DARPA征集无人集群战术思路
无人机
16+阅读 · 2017年10月18日
国家自然科学基金
23+阅读 · 2015年12月31日
国家自然科学基金
9+阅读 · 2015年12月31日
国家自然科学基金
8+阅读 · 2015年12月31日
国家自然科学基金
19+阅读 · 2015年12月31日
国家自然科学基金
21+阅读 · 2014年12月31日
国家自然科学基金
1+阅读 · 2014年12月31日
国家自然科学基金
0+阅读 · 2014年12月31日
国家自然科学基金
15+阅读 · 2013年12月31日
国家自然科学基金
25+阅读 · 2011年12月31日
Arxiv
158+阅读 · 2023年4月20日
A Survey of Large Language Models
Arxiv
408+阅读 · 2023年3月31日
Arxiv
68+阅读 · 2023年3月26日
Arxiv
147+阅读 · 2023年3月24日
Arxiv
21+阅读 · 2023年3月17日
VIP会员
相关VIP内容
军事信息系统情境计算需求一致性验证研究
专知会员服务
28+阅读 · 3月16日
下一代战略博弈推演系统研究
专知会员服务
95+阅读 · 1月27日
无人集群博弈对抗系统仿真验证及决策关键技术综述
专知会员服务
106+阅读 · 2023年11月23日
无人集群协同控制策略及军事应用
专知会员服务
101+阅读 · 2023年11月13日
信息时代指挥控制方式综述
专知会员服务
99+阅读 · 2023年10月28日
基于多智能体博弈强化学习的无人机智能攻击策略生成模型
空天防御装备作战管理发展思考
专知会员服务
69+阅读 · 2023年7月10日
知识与数据互补的战术级兵棋行为决策框架设计与实现
专知会员服务
94+阅读 · 2023年5月30日
单兵装备人机工效知识图谱构建技术
专知会员服务
58+阅读 · 2023年4月12日
相关基金
国家自然科学基金
23+阅读 · 2015年12月31日
国家自然科学基金
9+阅读 · 2015年12月31日
国家自然科学基金
8+阅读 · 2015年12月31日
国家自然科学基金
19+阅读 · 2015年12月31日
国家自然科学基金
21+阅读 · 2014年12月31日
国家自然科学基金
1+阅读 · 2014年12月31日
国家自然科学基金
0+阅读 · 2014年12月31日
国家自然科学基金
15+阅读 · 2013年12月31日
国家自然科学基金
25+阅读 · 2011年12月31日
微信扫码咨询专知VIP会员