基于未来现代化海上作战背景, 提出了利用多智能体深度强化学习方案来完成无人艇群博弈对抗中的协同围捕任务。首先, 根据不同的作战模式和应用场景, 提出基于分布式执行的多智能体深度确定性策略梯度算法, 并对其原理进行了介绍; 其次, 模拟具体作战场景平台, 设计多智能体网络模型、奖励函数机制以及训练策略。实验结果表明, 文中方法可以有效应对敌方无人艇的协同围捕决策问题, 在不同作战场景下具有较高的效率, 为未来复杂作战场景下无人艇智能决策研究提供理论参考价值。

在现代军事研究领域, 随着高新技术的快速发 展, 催化了战场中作战思想、理论和模式等方面的 迅速变革, 战争形态逐渐趋于信息化和智能化[1-3]。 人工智能和无人系统技术为未来战争中的决策分 析、指挥控制和博弈对抗等应用提供了更多智能 决策和自主作战能力, 逐渐扮演着更加重要的角 色。其中, 无人艇作为一种全自动小型水面机器 人, 具有体型小、机动灵活以及活动范围广等优势, 在情报侦查、海上巡逻以及环境检测等领域发挥 着重要作用[4]。 强化学习作为人工智能技术的重要分支, 目前 在无人艇、无人机等多智能体博弈对抗问题中具有 重要的应用价值[5-7]。李波等[8] 将多智能体深度确 定性策略梯度(multi-agent deep deterministic policy gradient, MADDPG)算法应用于多无人机的协同任 务研究, 可以解决简单的任务决策问题。刘菁等[9] 提出了博弈理论与 Q-Learning 相结合的无人机集 群协同围捕方法, 结果表明该方法可以完成对单 目标的有效围捕。Zhan 等 [10] 提出了多智能体近 端策略优化(multi-agent proximal policy optimization, MAPPO)算法, 用于实现异构无人机的分布式决策 和协作任务完成。赵伟等[11] 对无人机智能决策的 发展现状和未来挑战进行了讨论和分析。相比之 下, 目前国内外对于无人艇的博弈对抗研究工作 相对较少, 仍处于发展阶段。苏震等[12] 开展了关 于无人艇集群动态博弈对抗的研究, 提出利用深 度确定性策略梯度(deep deterministic policy gradient, DDPG)算法来设计策略求解方法, 训练得到的 智能体可以较好地完成协同围捕任务。夏家伟等[13] 则使用 MAPPO 算法完成对单一无人艇的协同围 捕任务, 通过结合围捕任务背景, 建立了伸缩性和 排列不变性的状态空间, 最后利用课程式学习训 练技巧完成对围捕策略的训练, 结果表明所提方 法在围捕成功率上相较于其他算法具有一定优势。 无人艇集群博弈对抗的研究工作仍处于起步 阶段, 存在较大的提升空间: 目前的研究中, 无人 艇博弈对抗中的敌方通常采用传统算法躲避我方 的拦截围捕, 缺乏智能化决策能力; 其次, 海上目 标行为动作较为复杂, 双方博弈过程中的当前决 策需要充分考虑前后阶段产生的影响结果; 此外, 除需要围捕的动态目标外, 海上还存在岛礁等障 碍物, 在博弈对抗中还需要考虑躲避岛礁障碍物 等问题。 受到以上启发, 文中以无人艇集群对敌方入侵 岛礁目标进行围捕拦截为背景, 开展基于多智能 体深度强化学习的无人艇集群协同围捕研究。首 先基于现代式作战需求, 合理设计作战假想, 建模 相应的围捕环境; 其次, 采用 MADDPG 算法求解 策略方法, 根据不同的围捕任务设计网络结构、奖 励函数和训练方法; 最后通过仿真实验表明, 训练 得到的我方无人艇经过博弈后能够有效完成对敌 方的围捕拦截任务。

成为VIP会员查看完整内容
56

相关内容

人工智能在军事中可用于多项任务,例如目标识别、大数据处理、作战系统、网络安全、后勤运输、战争医疗、威胁和安全监测以及战斗模拟和训练。
基于强化学习的无人机集群对抗策略推演仿真
专知会员服务
55+阅读 · 4月14日
无人空战指控建模仿真方法研究
专知会员服务
79+阅读 · 3月9日
无人机集群协同搜索研究综述
专知会员服务
65+阅读 · 3月4日
多无人机协同任务规划研究
专知会员服务
98+阅读 · 1月24日
海上跨域无人集群研究进展综述
专知会员服务
107+阅读 · 2023年11月30日
无人作战体系构建研究初探
专知会员服务
151+阅读 · 2023年11月9日
面向无人集群的边缘计算技术综述
专知会员服务
118+阅读 · 2023年10月6日
基于演化博弈的无人机集群协同应用
专知会员服务
89+阅读 · 2023年5月13日
基于深度学习及FPGA的装备目标检测研究
专知会员服务
45+阅读 · 2023年4月18日
深度学习研究及军事应用综述
专知
16+阅读 · 2022年7月7日
兵棋推演的智能决策技术与挑战
专知
24+阅读 · 2022年7月5日
多模态情绪识别研究综述
专知
22+阅读 · 2020年12月21日
基于图神经网络的知识图谱研究进展
AI科技评论
20+阅读 · 2020年8月31日
无人机蜂群作战技术与多智能体系统理论
无人机
35+阅读 · 2019年1月27日
无人机集群对抗研究的关键问题
无人机
55+阅读 · 2018年9月16日
红外弱小目标处理研究获进展
中科院之声
17+阅读 · 2017年11月19日
雷达海面目标识别技术研究进展
科技导报
17+阅读 · 2017年11月13日
国家自然科学基金
2+阅读 · 2015年12月31日
国家自然科学基金
2+阅读 · 2015年12月31日
国家自然科学基金
3+阅读 · 2015年12月31日
国家自然科学基金
12+阅读 · 2015年12月31日
国家自然科学基金
1+阅读 · 2015年12月31日
国家自然科学基金
0+阅读 · 2015年12月31日
国家自然科学基金
21+阅读 · 2014年12月31日
国家自然科学基金
14+阅读 · 2014年12月31日
国家自然科学基金
25+阅读 · 2011年12月31日
国家自然科学基金
11+阅读 · 2010年12月31日
Arxiv
155+阅读 · 2023年4月20日
A Survey of Large Language Models
Arxiv
396+阅读 · 2023年3月31日
Arxiv
66+阅读 · 2023年3月26日
Arxiv
137+阅读 · 2023年3月24日
Arxiv
19+阅读 · 2023年3月17日
VIP会员
相关VIP内容
基于强化学习的无人机集群对抗策略推演仿真
专知会员服务
55+阅读 · 4月14日
无人空战指控建模仿真方法研究
专知会员服务
79+阅读 · 3月9日
无人机集群协同搜索研究综述
专知会员服务
65+阅读 · 3月4日
多无人机协同任务规划研究
专知会员服务
98+阅读 · 1月24日
海上跨域无人集群研究进展综述
专知会员服务
107+阅读 · 2023年11月30日
无人作战体系构建研究初探
专知会员服务
151+阅读 · 2023年11月9日
面向无人集群的边缘计算技术综述
专知会员服务
118+阅读 · 2023年10月6日
基于演化博弈的无人机集群协同应用
专知会员服务
89+阅读 · 2023年5月13日
基于深度学习及FPGA的装备目标检测研究
专知会员服务
45+阅读 · 2023年4月18日
相关资讯
深度学习研究及军事应用综述
专知
16+阅读 · 2022年7月7日
兵棋推演的智能决策技术与挑战
专知
24+阅读 · 2022年7月5日
多模态情绪识别研究综述
专知
22+阅读 · 2020年12月21日
基于图神经网络的知识图谱研究进展
AI科技评论
20+阅读 · 2020年8月31日
无人机蜂群作战技术与多智能体系统理论
无人机
35+阅读 · 2019年1月27日
无人机集群对抗研究的关键问题
无人机
55+阅读 · 2018年9月16日
红外弱小目标处理研究获进展
中科院之声
17+阅读 · 2017年11月19日
雷达海面目标识别技术研究进展
科技导报
17+阅读 · 2017年11月13日
相关基金
国家自然科学基金
2+阅读 · 2015年12月31日
国家自然科学基金
2+阅读 · 2015年12月31日
国家自然科学基金
3+阅读 · 2015年12月31日
国家自然科学基金
12+阅读 · 2015年12月31日
国家自然科学基金
1+阅读 · 2015年12月31日
国家自然科学基金
0+阅读 · 2015年12月31日
国家自然科学基金
21+阅读 · 2014年12月31日
国家自然科学基金
14+阅读 · 2014年12月31日
国家自然科学基金
25+阅读 · 2011年12月31日
国家自然科学基金
11+阅读 · 2010年12月31日
微信扫码咨询专知VIP会员