空战机动模拟《动态对抗博弈中的单目标和多目标强化学习》240页 - 专知VIP

会员服务 ·

78

AI与军事 · 多目标强化学习 · 博弈对抗 · 博士论文 · 空战机动 ·

2024 年 3 月 11 日

空战机动模拟《动态对抗博弈中的单目标和多目标强化学习》240页

专知会员服务

专知，提供专业可信的知识分发服务，让认知协作更快更好！

本论文利用强化学习（RL）来解决空战机动模拟中的动态对抗博弈问题。空战机动模拟是运筹学领域常见的一种顺序决策问题，传统上依赖于智能体编程方法，需要将大量领域知识手动编码到模拟环境中。这些方法适用于确定现有战术在不同模拟场景中的有效性。然而，为了最大限度地发挥新技术（如自动驾驶飞机）的优势，需要发现新的战术。作为解决连续决策问题的成熟技术，RL 有可能发现这些新战术。

本论文探讨了四种 RL 方法--表式、深度、离散到深度和多目标--作为在空战机动模拟中发现新行为的机制。它实现并测试了每种方法的几种方法，并从学习时间、基准和比较性能以及实现复杂性等方面对这些方法进行了比较。除了评估现有方法对空战机动这一特定任务的实用性外，本论文还提出并研究了两种新型方法，即离散到深度监督策略学习（D2D-SPL）和离散到深度监督 Q 值学习（D2D-SQL），这两种方法可以更广泛地应用。D2D-SPL 和 D2D-SQL 以更接近表格方法的成本提供了深度 RL 的通用性。

贡献

本文有助于以下研究领域：

设计奖励信号以推动空战机动领域的学习，以及确定最有效信号的相应评估。
第 6 章中介绍的结合 RL 和监督学习的新方法，可加速深度 RL 并超越基准算法。考虑到 RL 的训练是一项非常昂贵和资源密集型的操作，这些缩短学习时间的新方法是本论文最重要的贡献。
优于单目标智能体的多目标 RL 智能体，在第 7 章中介绍。这是一个非常重要的贡献，因为它证明了多目标 RL 这一相对较新的发明可以在不增加学习时间的情况下超越单目标 RL 的性能。
用于训练和测试单目标和多目标 RL 智能体的开源框架。

成为VIP会员查看完整内容

相关内容

AI与军事

人工智能在军事中可用于多项任务，例如目标识别、大数据处理、作战系统、网络安全、后勤运输、战争医疗、威胁和安全监测以及战斗模拟和训练。

《有限时间范围鲁棒性在导弹交战中的应用》165页

《有限时间范围鲁棒性在导弹交战中的应用》165页

专知会员服务

37+阅读 · 2024年4月8日

计算机生成兵力《计算生成动作：生成空战行为》249页

计算机生成兵力《计算生成动作：生成空战行为》249页

专知会员服务

105+阅读 · 2024年3月20日

《利用人工神经网络进行雷达信号处理》253页

《利用人工神经网络进行雷达信号处理》253页

专知会员服务

69+阅读 · 2024年3月15日

《视距内空对空作战中遥控飞机指挥和控制延迟的影响》122页

《视距内空对空作战中遥控飞机指挥和控制延迟的影响》122页

专知会员服务

67+阅读 · 2024年3月13日

《作战飞行员在模拟环境中的决策、情绪和认知表现》65页论文

《作战飞行员在模拟环境中的决策、情绪和认知表现》65页论文

专知会员服务

43+阅读 · 2023年12月24日

《分布式海战中的人机协同作战》142页报告

《分布式海战中的人机协同作战》142页报告

专知会员服务

210+阅读 · 2023年9月19日

《基于强化学习的雷达资源管理任务选择与调度》2023最新38页报告

《基于强化学习的雷达资源管理任务选择与调度》2023最新38页报告

专知会员服务

103+阅读 · 2023年9月7日

自动空中加油《用深度学习技术来估计立体图像中的3D位置》美空军94页论文

自动空中加油《用深度学习技术来估计立体图像中的3D位置》美空军94页论文

专知会员服务

33+阅读 · 2023年6月24日

《利用边缘高性能计算 (HPC) 加速战术决策过程》美国陆军，43页报告

《利用边缘高性能计算 (HPC) 加速战术决策过程》美国陆军，43页报告

专知会员服务

154+阅读 · 2023年4月3日

《基于强化学习开发战斗行为》美国海军研究生院

《基于强化学习开发战斗行为》美国海军研究生院

专知会员服务

97+阅读 · 2022年6月27日

《基于模型的系统工程方法应用于任务工程建模用例》169页报告

《基于模型的系统工程方法应用于任务工程建模用例》169页报告

专知

54+阅读 · 2023年4月6日

《利用边缘高性能计算 (HPC) 加速战术决策过程》美国陆军，43页报告

《利用边缘高性能计算 (HPC) 加速战术决策过程》美国陆军，43页报告

专知

103+阅读 · 2023年4月5日

《定位、导航和授时的作战理解》美国陆军57页技术报告

《定位、导航和授时的作战理解》美国陆军57页技术报告

专知

134+阅读 · 2022年11月29日

《使用机器学习智能体设计基于模拟的空战飞行员训练系统》2022瑞典林雪平大学页论文

《使用机器学习智能体设计基于模拟的空战飞行员训练系统》2022瑞典林雪平大学页论文

专知

37+阅读 · 2022年10月30日

《开发新型飞行器数字孪生原型的框架》北约科学与技术组织2022最新14页技术报告

《开发新型飞行器数字孪生原型的框架》北约科学与技术组织2022最新14页技术报告

专知

22+阅读 · 2022年10月24日

《综述：多智能体系统（MAS）中的任务分配技术》美国空军项目支持

《综述：多智能体系统（MAS）中的任务分配技术》美国空军项目支持

专知

47+阅读 · 2022年10月6日

【自适应雷达294页】《推进用于实时参数调整和决策的完全自适应雷达概念》美国空军研究实验室赞助

【自适应雷达294页】《推进用于实时参数调整和决策的完全自适应雷达概念》美国空军研究实验室赞助

专知

23+阅读 · 2022年9月4日

【美国陆军】《人工智能系统能否提高陆军任务指挥过程中的信息收集效率？》39页技术报告

【美国陆军】《人工智能系统能否提高陆军任务指挥过程中的信息收集效率？》39页技术报告

专知

44+阅读 · 2022年8月31日

《基于多智能体深度强化学习的空战模拟智能体协作》瑞典林雪平大学

《基于多智能体深度强化学习的空战模拟智能体协作》瑞典林雪平大学

专知

57+阅读 · 2022年8月25日

基于模型的强化学习综述

基于模型的强化学习综述

专知

42+阅读 · 2022年7月13日

改进智能优化策略多机动目标跟踪方法研究

国家自然科学基金

17+阅读 · 2015年12月31日

风切变诱发飞行失控的包线估计及保护控制研究

国家自然科学基金

0+阅读 · 2015年12月31日

基于多轴飞行器航拍数据的植物生长分析与建模

国家自然科学基金

0+阅读 · 2015年12月31日

基于势场法的多智能体系统鲁棒自适应刚性编队控制

国家自然科学基金

3+阅读 · 2015年12月31日

CGF战场空间认知行为建模研究

国家自然科学基金

49+阅读 · 2014年12月31日

复杂战场环境下的几个目标跟踪新问题研究

国家自然科学基金

60+阅读 · 2014年12月31日

面向主体行为网的自适应作战机理研究

国家自然科学基金

24+阅读 · 2014年12月31日

基于动态贝叶斯网络的空天态势评估方法研究

国家自然科学基金

44+阅读 · 2014年12月31日

面向武器系统协同的态势感知一致性计算方法研究

国家自然科学基金

53+阅读 · 2011年12月31日

支持多信息融合的装备体系作战效能评估方法研究

国家自然科学基金

36+阅读 · 2008年12月31日

Is ChatGPT a Good Recommender? A Preliminary Study

Arxiv

171+阅读 · 2023年4月20日

NeuralField-LDM: Scene Generation with Hierarchical Latent Diffusion Models

Arxiv

42+阅读 · 2023年4月19日

A Comprehensive Survey on Deep Graph Representation Learning

Arxiv

103+阅读 · 2023年4月11日

On Efficient Training of Large-Scale Deep Learning Models: A Literature Review

Arxiv

216+阅读 · 2023年4月7日

A Survey of Large Language Models

A Survey of Large Language Models

Arxiv

476+阅读 · 2023年3月31日

Unleashing the Power of Edge-Cloud Generative AI in Mobile Networks: A Survey of AIGC Services

Arxiv

147+阅读 · 2023年3月29日

ChatGPT is a Knowledgeable but Inexperienced Solver: An Investigation of Commonsense Problem in Large Language Models

Arxiv

61+阅读 · 2023年3月29日

Nature Language Reasoning, A Survey

Arxiv

78+阅读 · 2023年3月26日

Knowledge Graphs: Opportunities and Challenges

Arxiv

173+阅读 · 2023年3月24日

Data-centric Artificial Intelligence: A Survey

Arxiv

24+阅读 · 2023年3月17日

VIP会员

相关主题

多目标强化学习

相关VIP内容

《有限时间范围鲁棒性在导弹交战中的应用》165页

《有限时间范围鲁棒性在导弹交战中的应用》165页

专知会员服务

37+阅读 · 2024年4月8日

计算机生成兵力《计算生成动作：生成空战行为》249页

计算机生成兵力《计算生成动作：生成空战行为》249页

专知会员服务

105+阅读 · 2024年3月20日

《利用人工神经网络进行雷达信号处理》253页

《利用人工神经网络进行雷达信号处理》253页

专知会员服务

69+阅读 · 2024年3月15日

《视距内空对空作战中遥控飞机指挥和控制延迟的影响》122页

《视距内空对空作战中遥控飞机指挥和控制延迟的影响》122页

专知会员服务

67+阅读 · 2024年3月13日

《作战飞行员在模拟环境中的决策、情绪和认知表现》65页论文

《作战飞行员在模拟环境中的决策、情绪和认知表现》65页论文

专知会员服务

43+阅读 · 2023年12月24日

《分布式海战中的人机协同作战》142页报告

《分布式海战中的人机协同作战》142页报告

专知会员服务

210+阅读 · 2023年9月19日

《基于强化学习的雷达资源管理任务选择与调度》2023最新38页报告

《基于强化学习的雷达资源管理任务选择与调度》2023最新38页报告

专知会员服务

103+阅读 · 2023年9月7日

自动空中加油《用深度学习技术来估计立体图像中的3D位置》美空军94页论文

自动空中加油《用深度学习技术来估计立体图像中的3D位置》美空军94页论文

专知会员服务

33+阅读 · 2023年6月24日

《利用边缘高性能计算 (HPC) 加速战术决策过程》美国陆军，43页报告

《利用边缘高性能计算 (HPC) 加速战术决策过程》美国陆军，43页报告

专知会员服务

154+阅读 · 2023年4月3日

《基于强化学习开发战斗行为》美国海军研究生院

《基于强化学习开发战斗行为》美国海军研究生院

专知会员服务

97+阅读 · 2022年6月27日

热门VIP内容

开通专知VIP会员享更多权益服务

【CMU博士论文】数据驱动决策中的激励、信息与不确定性

DGP双粒度提示框架：图增强大模型助力欺诈检测

【ICCV2025】ESSENTIAL：用于视频类增量学习的情景记忆与语义记忆整合

唯快不破：大型语言模型高效架构综述

相关资讯

《基于模型的系统工程方法应用于任务工程建模用例》169页报告

《基于模型的系统工程方法应用于任务工程建模用例》169页报告

专知

54+阅读 · 2023年4月6日

《利用边缘高性能计算 (HPC) 加速战术决策过程》美国陆军，43页报告

《利用边缘高性能计算 (HPC) 加速战术决策过程》美国陆军，43页报告

专知

103+阅读 · 2023年4月5日

《定位、导航和授时的作战理解》美国陆军57页技术报告

《定位、导航和授时的作战理解》美国陆军57页技术报告

专知

134+阅读 · 2022年11月29日

《使用机器学习智能体设计基于模拟的空战飞行员训练系统》2022瑞典林雪平大学页论文

《使用机器学习智能体设计基于模拟的空战飞行员训练系统》2022瑞典林雪平大学页论文

专知

37+阅读 · 2022年10月30日

《开发新型飞行器数字孪生原型的框架》北约科学与技术组织2022最新14页技术报告

《开发新型飞行器数字孪生原型的框架》北约科学与技术组织2022最新14页技术报告

专知

22+阅读 · 2022年10月24日

《综述：多智能体系统（MAS）中的任务分配技术》美国空军项目支持

《综述：多智能体系统（MAS）中的任务分配技术》美国空军项目支持

专知

47+阅读 · 2022年10月6日

【自适应雷达294页】《推进用于实时参数调整和决策的完全自适应雷达概念》美国空军研究实验室赞助

【自适应雷达294页】《推进用于实时参数调整和决策的完全自适应雷达概念》美国空军研究实验室赞助

专知

23+阅读 · 2022年9月4日

【美国陆军】《人工智能系统能否提高陆军任务指挥过程中的信息收集效率？》39页技术报告

【美国陆军】《人工智能系统能否提高陆军任务指挥过程中的信息收集效率？》39页技术报告

专知

44+阅读 · 2022年8月31日

《基于多智能体深度强化学习的空战模拟智能体协作》瑞典林雪平大学

《基于多智能体深度强化学习的空战模拟智能体协作》瑞典林雪平大学

专知

57+阅读 · 2022年8月25日

基于模型的强化学习综述

基于模型的强化学习综述

专知

42+阅读 · 2022年7月13日

相关基金

改进智能优化策略多机动目标跟踪方法研究

国家自然科学基金

17+阅读 · 2015年12月31日

风切变诱发飞行失控的包线估计及保护控制研究

国家自然科学基金

0+阅读 · 2015年12月31日

基于多轴飞行器航拍数据的植物生长分析与建模

国家自然科学基金

0+阅读 · 2015年12月31日

基于势场法的多智能体系统鲁棒自适应刚性编队控制

国家自然科学基金

3+阅读 · 2015年12月31日

CGF战场空间认知行为建模研究

国家自然科学基金

49+阅读 · 2014年12月31日

复杂战场环境下的几个目标跟踪新问题研究

国家自然科学基金

60+阅读 · 2014年12月31日

面向主体行为网的自适应作战机理研究

国家自然科学基金

24+阅读 · 2014年12月31日

基于动态贝叶斯网络的空天态势评估方法研究

国家自然科学基金

44+阅读 · 2014年12月31日

面向武器系统协同的态势感知一致性计算方法研究

国家自然科学基金

53+阅读 · 2011年12月31日

支持多信息融合的装备体系作战效能评估方法研究

国家自然科学基金

36+阅读 · 2008年12月31日

相关论文

Is ChatGPT a Good Recommender? A Preliminary Study

Arxiv

171+阅读 · 2023年4月20日

NeuralField-LDM: Scene Generation with Hierarchical Latent Diffusion Models

Arxiv

42+阅读 · 2023年4月19日

A Comprehensive Survey on Deep Graph Representation Learning

Arxiv

103+阅读 · 2023年4月11日

On Efficient Training of Large-Scale Deep Learning Models: A Literature Review

Arxiv

216+阅读 · 2023年4月7日

A Survey of Large Language Models

A Survey of Large Language Models

Arxiv

476+阅读 · 2023年3月31日

Unleashing the Power of Edge-Cloud Generative AI in Mobile Networks: A Survey of AIGC Services

Arxiv

147+阅读 · 2023年3月29日

ChatGPT is a Knowledgeable but Inexperienced Solver: An Investigation of Commonsense Problem in Large Language Models

Arxiv

61+阅读 · 2023年3月29日

Nature Language Reasoning, A Survey

Arxiv

78+阅读 · 2023年3月26日

Knowledge Graphs: Opportunities and Challenges

Arxiv

173+阅读 · 2023年3月24日

Data-centric Artificial Intelligence: A Survey

Arxiv

24+阅读 · 2023年3月17日

微信扫码咨询专知VIP会员