基于强化学习的空战动作生成 - 专知VIP

会员服务 ·

80

AI与军事 · 强化学习 · 空战动作生成 · 论文 · 伊斯坦布尔理工大学 ·

2022 年 6 月 19 日

基于强化学习的空战动作生成

专知会员服务

专知，提供专业可信的知识分发服务，让认知协作更快更好！

人工智能技术的出现为空战领域的许多研究铺平了道路。学术界和许多其他研究人员对一个突出的研究方向进行了研究，即无人机的自主机动决策。形成了大量研究成果，但其中基于强化学习（RL）的决策更有效。已经有许多研究和实验使agent以最佳方式到达目标，最突出的是遗传算法（GA），A*，RRT和其他各种优化技术已经被使用。强化学习因其成功而广为人知。在DARPA阿尔法斗狗试验（Alpha Dogfight Trials）中，强化学习战胜了由波音公司培训的真正的F-16人类老飞行员。这个模型是由Heron系统公司开发的。在这一成就之后，强化学习带来了巨大的关注。在这项研究中，将无人机作为目标，该无人机有一个杜宾斯车动态特性，在二维空间中使用双延迟深确定策略梯度（TD3）以最佳路径移动到目标，并用于经验回放（HER）。首先，它的目的是让agent采取最佳路径到达目标，过程中有障碍物。在每个情节中，我们的agent从一个随机点开始，我们的目标是稳定的，其位置没有变化。它以最佳和快速的方式找到自己的路径。然后，为了测试机制的极限，使我们的agent更难达到目标，并使其执行不同的机动性，我们添加了障碍物。它表现得很好，克服了所有的障碍。现在的研究是让两个无人机作为多agent在二维空间进行斗狗。这篇研究论文提出了一种运动规划的算法，它使用了双延迟深度确定性策略梯度（TD3），这是一种为具有连续行动的MDP定制的算法，使用强化学习作为基础。

成为VIP会员查看完整内容

相关内容

AI与军事

人工智能在军事中可用于多项任务，例如目标识别、大数据处理、作战系统、网络安全、后勤运输、战争医疗、威胁和安全监测以及战斗模拟和训练。

结合进化算法的深度强化学习方法研究综述

结合进化算法的深度强化学习方法研究综述

专知会员服务

80+阅读 · 2022年7月16日

推荐！中文版《作战战略机动的多智能体协作强化学习研究综述》美国陆军研究实验室最新33页研究报告

推荐！中文版《作战战略机动的多智能体协作强化学习研究综述》美国陆军研究实验室最新33页研究报告

专知会员服务

307+阅读 · 2022年6月23日

「博弈论视角下多智能体强化学习」研究综述

「博弈论视角下多智能体强化学习」研究综述

专知会员服务

184+阅读 · 2022年4月30日

基于强化学习的推荐研究综述

基于强化学习的推荐研究综述

专知会员服务

84+阅读 · 2021年10月21日

【SIGIR2021教程】基于强化学习的信息检索

专知会员服务

28+阅读 · 2021年7月20日

强化学习如何用于信息检索？请看ECIR2021《基于强化学习的信息检索》教程，附175页ppt与视频

强化学习如何用于信息检索？请看ECIR2021《基于强化学习的信息检索》教程，附175页ppt与视频

专知会员服务

33+阅读 · 2021年4月1日

【斯坦福干货书】强化学习基金融领域应用，312页pdf

【斯坦福干货书】强化学习基金融领域应用，312页pdf

专知会员服务

134+阅读 · 2020年12月22日

【Texas 大学】强化学习领域的课程学习:一个框架和综述

【Texas 大学】强化学习领域的课程学习:一个框架和综述

专知会员服务

72+阅读 · 2020年3月22日

【新书】Python强化学习-基于Tensorflow与Keras和OpenAI Gym实战, 177页pdf

【新书】Python强化学习-基于Tensorflow与Keras和OpenAI Gym实战, 177页pdf

专知会员服务

184+阅读 · 2020年1月17日

【强化学习】深度强化学习初学者指南

【强化学习】深度强化学习初学者指南

专知会员服务

182+阅读 · 2019年12月14日

DeepMind提出强化学习新方法，可实现人机合作

DeepMind提出强化学习新方法，可实现人机合作

InfoQ

3+阅读 · 2021年12月20日

基于自监督的可逆性强化学习方法

基于自监督的可逆性强化学习方法

AI前线

4+阅读 · 2021年12月3日

深入理解强化学习，看这篇就够了

深入理解强化学习，看这篇就够了

PaperWeekly

5+阅读 · 2021年11月28日

最新基于强化学习的推荐系统综述

最新基于强化学习的推荐系统综述

机器学习与推荐算法

6+阅读 · 2021年9月10日

强化学习扫盲贴：从Q-learning到DQN

强化学习扫盲贴：从Q-learning到DQN

夕小瑶的卖萌屋

52+阅读 · 2019年10月13日

【强化学习】强化学习的应用场景、基本概念、数学模型和交易中的应用

【强化学习】强化学习的应用场景、基本概念、数学模型和交易中的应用

产业智能官

18+阅读 · 2019年1月1日

学界 | 伯克利、OpenAI等提出基于模型的元策略优化强化学习

学界 | 伯克利、OpenAI等提出基于模型的元策略优化强化学习

机器之心

15+阅读 · 2018年10月21日

一文了解强化学习

一文了解强化学习

AI100

15+阅读 · 2018年8月20日

论强化学习的根本缺陷

论强化学习的根本缺陷

AI科技评论

11+阅读 · 2018年7月24日

【强化学习实战】基于gym和tensorflow的强化学习算法实现

【强化学习实战】基于gym和tensorflow的强化学习算法实现

新智元

12+阅读 · 2017年9月12日

基于重要性采样的并行离策略强化学习方法研究

国家自然科学基金

23+阅读 · 2015年12月31日

基于参数最优的仿人机器人复杂运动规划研究

国家自然科学基金

0+阅读 · 2012年12月31日

基于近似动态规划的非线性系统鲁棒优化控制

国家自然科学基金

2+阅读 · 2012年12月31日

基于贝叶斯推理的模糊逻辑强化学习模型研究

国家自然科学基金

18+阅读 · 2012年12月31日

基于一致性理论的多无人机协同控制和决策方法

国家自然科学基金

5+阅读 · 2012年12月31日

基于群体智能的多Agent协作模型与适应性研究

国家自然科学基金

16+阅读 · 2009年12月31日

强化学习关键技术及其在机器人行为学习中的应用

国家自然科学基金

21+阅读 · 2009年12月31日

基于多智能体强化学习的多机器人系统研究

国家自然科学基金

48+阅读 · 2009年12月31日

基于自适应动态规划的波形优化方法及在雷达通信中的应用

国家自然科学基金

2+阅读 · 2008年12月31日

基于支持向量机的复杂连续系统强化学习控制研究

国家自然科学基金

11+阅读 · 2008年12月31日

Almost Envy-Freeness for Groups: Improved Bounds via Discrepancy Theory

Arxiv

0+阅读 · 2022年8月4日

On Gap-dependent Bounds for Offline Reinforcement Learning

Arxiv

0+阅读 · 2022年8月3日

Deep Reinforcement Learning for Multi-Agent Interaction

Arxiv

44+阅读 · 2022年8月2日

Reinforcement Learning based Air Combat Maneuver Generation

Reinforcement Learning based Air Combat Maneuver Generation

Arxiv

91+阅读 · 2022年1月14日

Recent Advances in Reinforcement Learning in Finance

Arxiv

11+阅读 · 2021年12月8日

Exploration-Exploitation in Multi-Agent Learning: Catastrophe Theory Meets Game Theory

Exploration-Exploitation in Multi-Agent Learning: Catastrophe Theory Meets Game Theory

Arxiv

15+阅读 · 2020年12月15日

Transfer Learning in Deep Reinforcement Learning: A Survey

Transfer Learning in Deep Reinforcement Learning: A Survey

Arxiv

23+阅读 · 2020年9月16日

Talking-Heads Attention

Talking-Heads Attention

Arxiv

15+阅读 · 2020年3月5日

Deep Reinforcement Learning: An Overview

Deep Reinforcement Learning: An Overview

Arxiv

17+阅读 · 2018年11月26日

Multiagent Soft Q-Learning

Arxiv

11+阅读 · 2018年4月25日

VIP会员

相关主题

空战动作生成

伊斯坦布尔理工大学

相关VIP内容

结合进化算法的深度强化学习方法研究综述

结合进化算法的深度强化学习方法研究综述

专知会员服务

80+阅读 · 2022年7月16日

推荐！中文版《作战战略机动的多智能体协作强化学习研究综述》美国陆军研究实验室最新33页研究报告

推荐！中文版《作战战略机动的多智能体协作强化学习研究综述》美国陆军研究实验室最新33页研究报告

专知会员服务

307+阅读 · 2022年6月23日

「博弈论视角下多智能体强化学习」研究综述

「博弈论视角下多智能体强化学习」研究综述

专知会员服务

184+阅读 · 2022年4月30日

基于强化学习的推荐研究综述

基于强化学习的推荐研究综述

专知会员服务

84+阅读 · 2021年10月21日

【SIGIR2021教程】基于强化学习的信息检索

专知会员服务

28+阅读 · 2021年7月20日

强化学习如何用于信息检索？请看ECIR2021《基于强化学习的信息检索》教程，附175页ppt与视频

强化学习如何用于信息检索？请看ECIR2021《基于强化学习的信息检索》教程，附175页ppt与视频

专知会员服务

33+阅读 · 2021年4月1日

【斯坦福干货书】强化学习基金融领域应用，312页pdf

【斯坦福干货书】强化学习基金融领域应用，312页pdf

专知会员服务

134+阅读 · 2020年12月22日

【Texas 大学】强化学习领域的课程学习:一个框架和综述

【Texas 大学】强化学习领域的课程学习:一个框架和综述

专知会员服务

72+阅读 · 2020年3月22日

【新书】Python强化学习-基于Tensorflow与Keras和OpenAI Gym实战, 177页pdf

【新书】Python强化学习-基于Tensorflow与Keras和OpenAI Gym实战, 177页pdf

专知会员服务

184+阅读 · 2020年1月17日

【强化学习】深度强化学习初学者指南

【强化学习】深度强化学习初学者指南

专知会员服务

182+阅读 · 2019年12月14日

热门VIP内容

开通专知VIP会员享更多权益服务

《物联网（IoT）中的无人机通信高效控制》135页

《在GNSS信号降级环境中利用共识实现无人机集群稳健协调》

中程单向攻击无人机的战略意义：俄乌战争启示

《面向无人机集群的避障动态传感器覆盖算法》最新38页

相关资讯

DeepMind提出强化学习新方法，可实现人机合作

DeepMind提出强化学习新方法，可实现人机合作

InfoQ

3+阅读 · 2021年12月20日

基于自监督的可逆性强化学习方法

基于自监督的可逆性强化学习方法

AI前线

4+阅读 · 2021年12月3日

深入理解强化学习，看这篇就够了

深入理解强化学习，看这篇就够了

PaperWeekly

5+阅读 · 2021年11月28日

最新基于强化学习的推荐系统综述

最新基于强化学习的推荐系统综述

机器学习与推荐算法

6+阅读 · 2021年9月10日

强化学习扫盲贴：从Q-learning到DQN

强化学习扫盲贴：从Q-learning到DQN

夕小瑶的卖萌屋

52+阅读 · 2019年10月13日

【强化学习】强化学习的应用场景、基本概念、数学模型和交易中的应用

【强化学习】强化学习的应用场景、基本概念、数学模型和交易中的应用

产业智能官

18+阅读 · 2019年1月1日

学界 | 伯克利、OpenAI等提出基于模型的元策略优化强化学习

学界 | 伯克利、OpenAI等提出基于模型的元策略优化强化学习

机器之心

15+阅读 · 2018年10月21日

一文了解强化学习

一文了解强化学习

AI100

15+阅读 · 2018年8月20日

论强化学习的根本缺陷

论强化学习的根本缺陷

AI科技评论

11+阅读 · 2018年7月24日

【强化学习实战】基于gym和tensorflow的强化学习算法实现

【强化学习实战】基于gym和tensorflow的强化学习算法实现

新智元

12+阅读 · 2017年9月12日

相关基金

基于重要性采样的并行离策略强化学习方法研究

国家自然科学基金

23+阅读 · 2015年12月31日

基于参数最优的仿人机器人复杂运动规划研究

国家自然科学基金

0+阅读 · 2012年12月31日

基于近似动态规划的非线性系统鲁棒优化控制

国家自然科学基金

2+阅读 · 2012年12月31日

基于贝叶斯推理的模糊逻辑强化学习模型研究

国家自然科学基金

18+阅读 · 2012年12月31日

基于一致性理论的多无人机协同控制和决策方法

国家自然科学基金

5+阅读 · 2012年12月31日

基于群体智能的多Agent协作模型与适应性研究

国家自然科学基金

16+阅读 · 2009年12月31日

强化学习关键技术及其在机器人行为学习中的应用

国家自然科学基金

21+阅读 · 2009年12月31日

基于多智能体强化学习的多机器人系统研究

国家自然科学基金

48+阅读 · 2009年12月31日

基于自适应动态规划的波形优化方法及在雷达通信中的应用

国家自然科学基金

2+阅读 · 2008年12月31日

基于支持向量机的复杂连续系统强化学习控制研究

国家自然科学基金

11+阅读 · 2008年12月31日

相关论文

Almost Envy-Freeness for Groups: Improved Bounds via Discrepancy Theory

Arxiv

0+阅读 · 2022年8月4日

On Gap-dependent Bounds for Offline Reinforcement Learning

Arxiv

0+阅读 · 2022年8月3日

Deep Reinforcement Learning for Multi-Agent Interaction

Arxiv

44+阅读 · 2022年8月2日

Reinforcement Learning based Air Combat Maneuver Generation

Reinforcement Learning based Air Combat Maneuver Generation

Arxiv

91+阅读 · 2022年1月14日

Recent Advances in Reinforcement Learning in Finance

Arxiv

11+阅读 · 2021年12月8日

Exploration-Exploitation in Multi-Agent Learning: Catastrophe Theory Meets Game Theory

Exploration-Exploitation in Multi-Agent Learning: Catastrophe Theory Meets Game Theory

Arxiv

15+阅读 · 2020年12月15日

Transfer Learning in Deep Reinforcement Learning: A Survey

Transfer Learning in Deep Reinforcement Learning: A Survey

Arxiv

23+阅读 · 2020年9月16日

Talking-Heads Attention

Talking-Heads Attention

Arxiv

15+阅读 · 2020年3月5日

Deep Reinforcement Learning: An Overview

Deep Reinforcement Learning: An Overview

Arxiv

17+阅读 · 2018年11月26日

Multiagent Soft Q-Learning

Arxiv

11+阅读 · 2018年4月25日

微信扫码咨询专知VIP会员