摘要

先进的任务规划软件包(如 AFSIM)使用传统的人工智能方法,包括分配算法和脚本状态机来控制军用飞机、舰船和地面单位的模拟行为。我们开发了一种新颖的 AI 系统,该系统使用强化学习为军事交战生成更有效的高级策略。然而,它不是从头开始学习具有初始随机行为的策略,而是利用现有的传统 AI 方法来自动化简单的低级行为,简化问题的协作多智能体方面,并利用可用的先验知识引导学习以实现数量级更快的训练。

图 1 - 涉及空中、海上和地面单位的复杂 AFSIM 场景示例。分析师必须对所有这些平台进行建模,并使用基于规则的系统指定它们的行为。

图 2 - 我们最初探索的 AFSIM 场景的概念图。许多红色和蓝色的战斗机被放置在地图上的随机位置。基线脚本 AI 用于控制红队,我们的新混合 RL 智能体学习击败红队的策略。

图 3 - 简化的 MA2D 环境,完全用 Python 编写。此示例包含两个蓝色战斗机和两个红色战斗机。深灰色区域代表每个单位的武器区域。目标是通过让每个对手进入该区域来摧毁所有对手,同时避免类似地摧毁友军飞机。这种简化消除了对导弹飞行建模的需要。

图 4 - 我们的混合架构概述,将高级强化学习器与低级脚本行为策略配对。强化学习代理选择脚本行为,然后生成发送到环境的实际控制输出。

成为VIP会员查看完整内容
198

相关内容

人工智能在军事中可用于多项任务,例如目标识别、大数据处理、作战系统、网络安全、后勤运输、战争医疗、威胁和安全监测以及战斗模拟和训练。
专知会员服务
150+阅读 · 2021年8月3日
五分钟教你在Go-Bigger中设计自己的游戏AI智能体
THU数据派
3+阅读 · 2021年11月5日
强化学习开篇:Q-Learning原理详解
AINLP
33+阅读 · 2020年7月28日
层级强化学习概念简介
CreateAMind
14+阅读 · 2019年6月9日
使用强化学习训练机械臂完成人类任务
AI研习社
13+阅读 · 2019年3月23日
【强化学习】强化学习+深度学习=人工智能
产业智能官
51+阅读 · 2017年8月11日
国家自然科学基金
0+阅读 · 2013年12月31日
国家自然科学基金
2+阅读 · 2013年12月31日
国家自然科学基金
3+阅读 · 2013年12月31日
国家自然科学基金
3+阅读 · 2011年12月31日
国家自然科学基金
3+阅读 · 2009年12月31日
国家自然科学基金
1+阅读 · 2009年12月31日
国家自然科学基金
21+阅读 · 2009年12月31日
国家自然科学基金
0+阅读 · 2008年12月31日
国家自然科学基金
10+阅读 · 2008年12月31日
A Multi-Objective Deep Reinforcement Learning Framework
Arxiv
11+阅读 · 2018年4月25日
VIP会员
相关VIP内容
专知会员服务
150+阅读 · 2021年8月3日
相关基金
国家自然科学基金
0+阅读 · 2013年12月31日
国家自然科学基金
2+阅读 · 2013年12月31日
国家自然科学基金
3+阅读 · 2013年12月31日
国家自然科学基金
3+阅读 · 2011年12月31日
国家自然科学基金
3+阅读 · 2009年12月31日
国家自然科学基金
1+阅读 · 2009年12月31日
国家自然科学基金
21+阅读 · 2009年12月31日
国家自然科学基金
0+阅读 · 2008年12月31日
国家自然科学基金
10+阅读 · 2008年12月31日
微信扫码咨询专知VIP会员