人工智能技术的出现为空战领域的许多研究铺平了道路。学术界和许多其他研究人员对一个突出的研究方向进行了研究,即无人机的自主机动决策。形成了大量研究成果,但其中基于强化学习(RL)的决策更有效。已经有许多研究和实验使agent以最佳方式到达目标,最突出的是遗传算法(GA),A*,RRT和其他各种优化技术已经被使用。强化学习因其成功而广为人知。在DARPA阿尔法斗狗试验(Alpha Dogfight Trials)中,强化学习战胜了由波音公司培训的真正的F-16人类老飞行员。这个模型是由Heron系统公司开发的。在这一成就之后,强化学习带来了巨大的关注。在这项研究中,将无人机作为目标,该无人机有一个杜宾斯车动态特性,在二维空间中使用双延迟深确定策略梯度(TD3)以最佳路径移动到目标,并用于经验回放(HER)。首先,它的目的是让agent采取最佳路径到达目标,过程中有障碍物。在每个情节中,我们的agent从一个随机点开始,我们的目标是稳定的,其位置没有变化。它以最佳和快速的方式找到自己的路径。然后,为了测试机制的极限,使我们的agent更难达到目标,并使其执行不同的机动性,我们添加了障碍物。它表现得很好,克服了所有的障碍。现在的研究是让两个无人机作为多agent在二维空间进行斗狗。这篇研究论文提出了一种运动规划的算法,它使用了双延迟深度确定性策略梯度(TD3),这是一种为具有连续行动的MDP定制的算法,使用强化学习作为基础。

成为VIP会员查看完整内容
133

相关内容

人工智能在军事中可用于多项任务,例如目标识别、大数据处理、作战系统、网络安全、后勤运输、战争医疗、威胁和安全监测以及战斗模拟和训练。
结合进化算法的深度强化学习方法研究综述
专知会员服务
78+阅读 · 2022年7月16日
「博弈论视角下多智能体强化学习」研究综述
专知会员服务
181+阅读 · 2022年4月30日
基于强化学习的推荐研究综述
专知会员服务
83+阅读 · 2021年10月21日
专知会员服务
27+阅读 · 2021年7月20日
【斯坦福干货书】强化学习基金融领域应用,312页pdf
专知会员服务
132+阅读 · 2020年12月22日
【Texas 大学】强化学习领域的课程学习:一个框架和综述
专知会员服务
71+阅读 · 2020年3月22日
【强化学习】深度强化学习初学者指南
专知会员服务
179+阅读 · 2019年12月14日
基于自监督的可逆性强化学习方法
AI前线
4+阅读 · 2021年12月3日
深入理解强化学习,看这篇就够了
PaperWeekly
5+阅读 · 2021年11月28日
最新基于强化学习的推荐系统综述
机器学习与推荐算法
6+阅读 · 2021年9月10日
强化学习扫盲贴:从Q-learning到DQN
夕小瑶的卖萌屋
52+阅读 · 2019年10月13日
一文了解强化学习
AI100
15+阅读 · 2018年8月20日
论强化学习的根本缺陷
AI科技评论
11+阅读 · 2018年7月24日
国家自然科学基金
20+阅读 · 2015年12月31日
国家自然科学基金
0+阅读 · 2012年12月31日
国家自然科学基金
2+阅读 · 2012年12月31日
国家自然科学基金
18+阅读 · 2012年12月31日
国家自然科学基金
5+阅读 · 2012年12月31日
国家自然科学基金
15+阅读 · 2009年12月31日
国家自然科学基金
21+阅读 · 2009年12月31日
国家自然科学基金
46+阅读 · 2009年12月31日
国家自然科学基金
2+阅读 · 2008年12月31日
国家自然科学基金
11+阅读 · 2008年12月31日
Arxiv
11+阅读 · 2021年12月8日
Talking-Heads Attention
Arxiv
15+阅读 · 2020年3月5日
Deep Reinforcement Learning: An Overview
Arxiv
17+阅读 · 2018年11月26日
Arxiv
11+阅读 · 2018年4月25日
VIP会员
相关VIP内容
结合进化算法的深度强化学习方法研究综述
专知会员服务
78+阅读 · 2022年7月16日
「博弈论视角下多智能体强化学习」研究综述
专知会员服务
181+阅读 · 2022年4月30日
基于强化学习的推荐研究综述
专知会员服务
83+阅读 · 2021年10月21日
专知会员服务
27+阅读 · 2021年7月20日
【斯坦福干货书】强化学习基金融领域应用,312页pdf
专知会员服务
132+阅读 · 2020年12月22日
【Texas 大学】强化学习领域的课程学习:一个框架和综述
专知会员服务
71+阅读 · 2020年3月22日
【强化学习】深度强化学习初学者指南
专知会员服务
179+阅读 · 2019年12月14日
相关资讯
基于自监督的可逆性强化学习方法
AI前线
4+阅读 · 2021年12月3日
深入理解强化学习,看这篇就够了
PaperWeekly
5+阅读 · 2021年11月28日
最新基于强化学习的推荐系统综述
机器学习与推荐算法
6+阅读 · 2021年9月10日
强化学习扫盲贴:从Q-learning到DQN
夕小瑶的卖萌屋
52+阅读 · 2019年10月13日
一文了解强化学习
AI100
15+阅读 · 2018年8月20日
论强化学习的根本缺陷
AI科技评论
11+阅读 · 2018年7月24日
相关基金
国家自然科学基金
20+阅读 · 2015年12月31日
国家自然科学基金
0+阅读 · 2012年12月31日
国家自然科学基金
2+阅读 · 2012年12月31日
国家自然科学基金
18+阅读 · 2012年12月31日
国家自然科学基金
5+阅读 · 2012年12月31日
国家自然科学基金
15+阅读 · 2009年12月31日
国家自然科学基金
21+阅读 · 2009年12月31日
国家自然科学基金
46+阅读 · 2009年12月31日
国家自然科学基金
2+阅读 · 2008年12月31日
国家自然科学基金
11+阅读 · 2008年12月31日
相关论文
Arxiv
11+阅读 · 2021年12月8日
Talking-Heads Attention
Arxiv
15+阅读 · 2020年3月5日
Deep Reinforcement Learning: An Overview
Arxiv
17+阅读 · 2018年11月26日
Arxiv
11+阅读 · 2018年4月25日
微信扫码咨询专知VIP会员