《强化学习作为空战管理规划的预演（RARL）》2023最新27页技术报告 - 专知VIP

会员服务 ·

39

AI与军事 · 强化学习 · 空战规划 · 美国空军研究实验室（AFRL） · 兵棋推演 ·

2023 年 6 月 28 日

《强化学习作为空战管理规划的预演（RARL）》2023最新27页技术报告

专知会员服务

专知，提供专业可信的知识分发服务，让认知协作更快更好！

这个项目利用RL的一些最新进展来开发实时战略游戏的规划器，特别是MicroRTS来代替Stratagem计划的兵棋。PI实验室的这些进展之一被称为强化学习作为预演（RLaR）。在此之前，RLaR只在玩具基准任务中进行了评估，以确定其在减少样本复杂性方面的功效。这个项目为行为者-评论者架构开发了RLaR，并首次将其应用于具有不完整信息的复杂领域，如MicroRTS。本项目中应用的另一项技术源于最近在复杂的《星际争霸II》游戏中多智能体学习的成功，特别是多阶段训练的架构，在训练稳健策略的中间阶段发展联盟和联盟开拓者策略。

我们针对MicroPhantom--最近MicroRTS比赛的亚军--对RLaR进行了训练，结果表明它能够对这个对手进行有效的计划，但使用的样本比相关基线少。另外，我们使用4个阶段的训练方案在自我博弈中训练RLaR，并针对MentalSeal（冠军程序）和MicroPhantom评估了训练后的策略。虽然该策略在面对MicroPhantom时再次显示出良好的性能，但它在面对MentalSeal时却没有表现得很好。根据先前的初步发现，针对MentalSeal的训练是非常缓慢的，我们推测需要大量的训练时间，而不是我们在这个项目的延长期内能够投入到这个步骤中的。

成为VIP会员查看完整内容

65

相关内容

AI与军事

人工智能在军事中可用于多项任务，例如目标识别、大数据处理、作战系统、网络安全、后勤运输、战争医疗、威胁和安全监测以及战斗模拟和训练。

美空军FAST项目《基于智能体的系统技术基础》2023最新31页技术报告

美空军FAST项目《基于智能体的系统技术基础》2023最新31页技术报告

专知会员服务

164+阅读 · 2023年3月27日

《战斗管理：美国防部和空军继续定义联合指挥与控制工作》2023最新32页报告，美国政府问责局（GAO）

《战斗管理：美国防部和空军继续定义联合指挥与控制工作》2023最新32页报告，美国政府问责局（GAO）

专知会员服务

106+阅读 · 2023年1月15日

《单兵携带防空系统相关的人为因素问题》加拿大国防研究与发展部2022最新78页技术报告

《单兵携带防空系统相关的人为因素问题》加拿大国防研究与发展部2022最新78页技术报告

专知会员服务

26+阅读 · 2023年1月10日

《通过强化训练改善漂移——惯性传感器》2022最新64页技术报告，美太平洋海军信息战中心

《通过强化训练改善漂移——惯性传感器》2022最新64页技术报告，美太平洋海军信息战中心

专知会员服务

24+阅读 · 2022年11月23日

《利用时间模式注意机制和超深度集成改进数字航空战备技术引擎(DARTE)》2022最新36页技术报告，美海军信息战中心

《利用时间模式注意机制和超深度集成改进数字航空战备技术引擎(DARTE)》2022最新36页技术报告，美海军信息战中心

专知会员服务

20+阅读 · 2022年11月4日

《无人机系统 (UAS) 与下一代战车 (NGCV) 的集成》2022最新15页报告，美国陆军研究实验室

《无人机系统 (UAS) 与下一代战车 (NGCV) 的集成》2022最新15页报告，美国陆军研究实验室

专知会员服务

47+阅读 · 2022年10月22日

《在北约演习中评估新兴和破坏性海事技术的合成兵棋推演环境》北约STO，2022最新技术报告

《在北约演习中评估新兴和破坏性海事技术的合成兵棋推演环境》北约STO，2022最新技术报告

专知会员服务

26+阅读 · 2022年10月17日

《微型浮动航天器模拟器的原型设计和测试》美国海军2022最新117页报告

《微型浮动航天器模拟器的原型设计和测试》美国海军2022最新117页报告

专知会员服务

30+阅读 · 2022年9月12日

《在战斗模拟中建立天基情报、监视和侦察（ISR）模型》美国陆军研究实验室29页最新报告

《在战斗模拟中建立天基情报、监视和侦察（ISR）模型》美国陆军研究实验室29页最新报告

专知会员服务

121+阅读 · 2022年6月27日

《用于空对空战斗的分层强化学习》美国洛马公司与美国空军

《用于空对空战斗的分层强化学习》美国洛马公司与美国空军

专知会员服务

189+阅读 · 2022年6月15日

《美国国防部（DoD）联合能力集成与开发系统（JCIDS）报告》

《美国国防部（DoD）联合能力集成与开发系统（JCIDS）报告》

专知

33+阅读 · 2023年4月13日

《定位、导航和授时的作战理解》美国陆军57页技术报告

《定位、导航和授时的作战理解》美国陆军57页技术报告

专知

134+阅读 · 2022年11月29日

《基于近端策略优化(PPO)算法的制导弹体控制行为学习》美国陆军2022最新27页技术报告

《基于近端策略优化(PPO)算法的制导弹体控制行为学习》美国陆军2022最新27页技术报告

专知

12+阅读 · 2022年11月25日

《半机械士兵2050：人机融合及其对美国防部未来的影响》美国陆军研究实验室42页技术报告

《半机械士兵2050：人机融合及其对美国防部未来的影响》美国陆军研究实验室42页技术报告

专知

25+阅读 · 2022年11月20日

《确保美国防御系统作战优势的必要美国防部射程能力：对未来战斗的测试》美国国家科学院151页报告

《确保美国防御系统作战优势的必要美国防部射程能力：对未来战斗的测试》美国国家科学院151页报告

专知

45+阅读 · 2022年11月12日

【美海军系统工程顶点分析报告】《针对混合部队2025 的任务工程》2022美国海军130页论文

【美海军系统工程顶点分析报告】《针对混合部队2025 的任务工程》2022美国海军130页论文

专知

60+阅读 · 2022年10月29日

《开发新型飞行器数字孪生原型的框架》北约科学与技术组织2022最新14页技术报告

《开发新型飞行器数字孪生原型的框架》北约科学与技术组织2022最新14页技术报告

专知

22+阅读 · 2022年10月24日

《人工智能开发的严谨度》美国海军空战中心武器部 2022最新71页报告

《人工智能开发的严谨度》美国海军空战中心武器部 2022最新71页报告

专知

52+阅读 · 2022年9月25日

【完整译文】《在复杂陆基场景中对中间部队能力进行兵棋推演》加拿大国防研究与发展部技术报告

【完整译文】《在复杂陆基场景中对中间部队能力进行兵棋推演》加拿大国防研究与发展部技术报告

专知

27+阅读 · 2022年9月5日

推荐！《基于人工智能（AI）的空中和导弹防御（AMD）：以结果为导向的辅助决策》美国海军研究生院系统工程顶点报告145页

推荐！《基于人工智能（AI）的空中和导弹防御（AMD）：以结果为导向的辅助决策》美国海军研究生院系统工程顶点报告145页

专知

104+阅读 · 2022年9月1日

基于地形辅助的深海长航时ARV自主导航技术研究

国家自然科学基金

12+阅读 · 2017年12月31日

不确定环境下的自主移动机器人目标搜索问题研究

国家自然科学基金

43+阅读 · 2015年12月31日

空间非合作目标基于点云模型的视觉与惯性融合相对导航方法与实验研究

国家自然科学基金

17+阅读 · 2015年12月31日

基于非圆信号的UUV舷侧阵水下目标探测技术研究

国家自然科学基金

10+阅读 · 2015年12月31日

零辅助数据MIMO雷达自适应检测问题研究

国家自然科学基金

6+阅读 · 2015年12月31日

无人机视频快速4-D重建及时空自适应索引方法研究

国家自然科学基金

7+阅读 · 2015年12月31日

协同特征CAD中支持多用户意图融合的关键技术研究

国家自然科学基金

3+阅读 · 2015年12月31日

可证明的网络和数据匿名性及隐私增强身份管理关键技术研究

国家自然科学基金

3+阅读 · 2014年12月31日

CGF战场空间认知行为建模研究

国家自然科学基金

49+阅读 · 2014年12月31日

基于BIM的建筑生命周期环境与经济评价及优化设计方法研究

国家自然科学基金

3+阅读 · 2014年12月31日

Test-time augmentation-based active learning and self-training for label-efficient segmentation

Test-time augmentation-based active learning and self-training for label-efficient segmentation

Arxiv

0+阅读 · 2023年8月21日

Context-aware multi-head self-attentional neural network model for next location prediction

Arxiv

0+阅读 · 2023年8月21日

A hybrid Decoder-DeepONet operator regression framework for unaligned observation data

Arxiv

0+阅读 · 2023年8月18日

Learning representations by forward-propagating errors

Arxiv

0+阅读 · 2023年8月17日

Never-ending Learning of User Interfaces

Arxiv

0+阅读 · 2023年8月17日

Is ChatGPT a Good Recommender? A Preliminary Study

Arxiv

171+阅读 · 2023年4月20日

On Efficient Training of Large-Scale Deep Learning Models: A Literature Review

Arxiv

216+阅读 · 2023年4月7日

One Small Step for Generative AI, One Giant Leap for AGI: A Complete Survey on ChatGPT in AIGC Era

Arxiv

49+阅读 · 2023年4月4日

A Survey of Large Language Models

A Survey of Large Language Models

Arxiv

476+阅读 · 2023年3月31日

Sparks of Artificial General Intelligence: Early experiments with GPT-4

Arxiv

51+阅读 · 2023年3月22日

VIP会员

相关主题

美国空军研究实验室（AFRL）

相关VIP内容

美空军FAST项目《基于智能体的系统技术基础》2023最新31页技术报告

美空军FAST项目《基于智能体的系统技术基础》2023最新31页技术报告

专知会员服务

164+阅读 · 2023年3月27日

《战斗管理：美国防部和空军继续定义联合指挥与控制工作》2023最新32页报告，美国政府问责局（GAO）

《战斗管理：美国防部和空军继续定义联合指挥与控制工作》2023最新32页报告，美国政府问责局（GAO）

专知会员服务

106+阅读 · 2023年1月15日

《单兵携带防空系统相关的人为因素问题》加拿大国防研究与发展部2022最新78页技术报告

《单兵携带防空系统相关的人为因素问题》加拿大国防研究与发展部2022最新78页技术报告

专知会员服务

26+阅读 · 2023年1月10日

《通过强化训练改善漂移——惯性传感器》2022最新64页技术报告，美太平洋海军信息战中心

《通过强化训练改善漂移——惯性传感器》2022最新64页技术报告，美太平洋海军信息战中心

专知会员服务

24+阅读 · 2022年11月23日

《利用时间模式注意机制和超深度集成改进数字航空战备技术引擎(DARTE)》2022最新36页技术报告，美海军信息战中心

《利用时间模式注意机制和超深度集成改进数字航空战备技术引擎(DARTE)》2022最新36页技术报告，美海军信息战中心

专知会员服务

20+阅读 · 2022年11月4日

《无人机系统 (UAS) 与下一代战车 (NGCV) 的集成》2022最新15页报告，美国陆军研究实验室

《无人机系统 (UAS) 与下一代战车 (NGCV) 的集成》2022最新15页报告，美国陆军研究实验室

专知会员服务

47+阅读 · 2022年10月22日

《在北约演习中评估新兴和破坏性海事技术的合成兵棋推演环境》北约STO，2022最新技术报告

《在北约演习中评估新兴和破坏性海事技术的合成兵棋推演环境》北约STO，2022最新技术报告

专知会员服务

26+阅读 · 2022年10月17日

《微型浮动航天器模拟器的原型设计和测试》美国海军2022最新117页报告

《微型浮动航天器模拟器的原型设计和测试》美国海军2022最新117页报告

专知会员服务

30+阅读 · 2022年9月12日

《在战斗模拟中建立天基情报、监视和侦察（ISR）模型》美国陆军研究实验室29页最新报告

《在战斗模拟中建立天基情报、监视和侦察（ISR）模型》美国陆军研究实验室29页最新报告

专知会员服务

121+阅读 · 2022年6月27日

《用于空对空战斗的分层强化学习》美国洛马公司与美国空军

《用于空对空战斗的分层强化学习》美国洛马公司与美国空军

专知会员服务

189+阅读 · 2022年6月15日

热门VIP内容

开通专知VIP会员享更多权益服务

【CMU博士论文】数据驱动决策中的激励、信息与不确定性

DGP双粒度提示框架：图增强大模型助力欺诈检测

【ICCV2025】ESSENTIAL：用于视频类增量学习的情景记忆与语义记忆整合

唯快不破：大型语言模型高效架构综述

相关资讯

《美国国防部（DoD）联合能力集成与开发系统（JCIDS）报告》

《美国国防部（DoD）联合能力集成与开发系统（JCIDS）报告》

专知

33+阅读 · 2023年4月13日

《定位、导航和授时的作战理解》美国陆军57页技术报告

《定位、导航和授时的作战理解》美国陆军57页技术报告

专知

134+阅读 · 2022年11月29日

《基于近端策略优化(PPO)算法的制导弹体控制行为学习》美国陆军2022最新27页技术报告

《基于近端策略优化(PPO)算法的制导弹体控制行为学习》美国陆军2022最新27页技术报告

专知

12+阅读 · 2022年11月25日

《半机械士兵2050：人机融合及其对美国防部未来的影响》美国陆军研究实验室42页技术报告

《半机械士兵2050：人机融合及其对美国防部未来的影响》美国陆军研究实验室42页技术报告

专知

25+阅读 · 2022年11月20日

《确保美国防御系统作战优势的必要美国防部射程能力：对未来战斗的测试》美国国家科学院151页报告

《确保美国防御系统作战优势的必要美国防部射程能力：对未来战斗的测试》美国国家科学院151页报告

专知

45+阅读 · 2022年11月12日

【美海军系统工程顶点分析报告】《针对混合部队2025 的任务工程》2022美国海军130页论文

【美海军系统工程顶点分析报告】《针对混合部队2025 的任务工程》2022美国海军130页论文

专知

60+阅读 · 2022年10月29日

《开发新型飞行器数字孪生原型的框架》北约科学与技术组织2022最新14页技术报告

《开发新型飞行器数字孪生原型的框架》北约科学与技术组织2022最新14页技术报告

专知

22+阅读 · 2022年10月24日

《人工智能开发的严谨度》美国海军空战中心武器部 2022最新71页报告

《人工智能开发的严谨度》美国海军空战中心武器部 2022最新71页报告

专知

52+阅读 · 2022年9月25日

【完整译文】《在复杂陆基场景中对中间部队能力进行兵棋推演》加拿大国防研究与发展部技术报告

【完整译文】《在复杂陆基场景中对中间部队能力进行兵棋推演》加拿大国防研究与发展部技术报告

专知

27+阅读 · 2022年9月5日

推荐！《基于人工智能（AI）的空中和导弹防御（AMD）：以结果为导向的辅助决策》美国海军研究生院系统工程顶点报告145页

推荐！《基于人工智能（AI）的空中和导弹防御（AMD）：以结果为导向的辅助决策》美国海军研究生院系统工程顶点报告145页

专知

104+阅读 · 2022年9月1日

相关基金

基于地形辅助的深海长航时ARV自主导航技术研究

国家自然科学基金

12+阅读 · 2017年12月31日

不确定环境下的自主移动机器人目标搜索问题研究

国家自然科学基金

43+阅读 · 2015年12月31日

空间非合作目标基于点云模型的视觉与惯性融合相对导航方法与实验研究

国家自然科学基金

17+阅读 · 2015年12月31日

基于非圆信号的UUV舷侧阵水下目标探测技术研究

国家自然科学基金

10+阅读 · 2015年12月31日

零辅助数据MIMO雷达自适应检测问题研究

国家自然科学基金

6+阅读 · 2015年12月31日

无人机视频快速4-D重建及时空自适应索引方法研究

国家自然科学基金

7+阅读 · 2015年12月31日

协同特征CAD中支持多用户意图融合的关键技术研究

国家自然科学基金

3+阅读 · 2015年12月31日

可证明的网络和数据匿名性及隐私增强身份管理关键技术研究

国家自然科学基金

3+阅读 · 2014年12月31日

CGF战场空间认知行为建模研究

国家自然科学基金

49+阅读 · 2014年12月31日

基于BIM的建筑生命周期环境与经济评价及优化设计方法研究

国家自然科学基金

3+阅读 · 2014年12月31日

相关论文

Test-time augmentation-based active learning and self-training for label-efficient segmentation

Test-time augmentation-based active learning and self-training for label-efficient segmentation

Arxiv

0+阅读 · 2023年8月21日

Context-aware multi-head self-attentional neural network model for next location prediction

Arxiv

0+阅读 · 2023年8月21日

A hybrid Decoder-DeepONet operator regression framework for unaligned observation data

Arxiv

0+阅读 · 2023年8月18日

Learning representations by forward-propagating errors

Arxiv

0+阅读 · 2023年8月17日

Never-ending Learning of User Interfaces

Arxiv

0+阅读 · 2023年8月17日

Is ChatGPT a Good Recommender? A Preliminary Study

Arxiv

171+阅读 · 2023年4月20日

On Efficient Training of Large-Scale Deep Learning Models: A Literature Review

Arxiv

216+阅读 · 2023年4月7日

One Small Step for Generative AI, One Giant Leap for AGI: A Complete Survey on ChatGPT in AIGC Era

Arxiv

49+阅读 · 2023年4月4日

A Survey of Large Language Models

A Survey of Large Language Models

Arxiv

476+阅读 · 2023年3月31日

Sparks of Artificial General Intelligence: Early experiments with GPT-4

Arxiv

51+阅读 · 2023年3月22日

微信扫码咨询专知VIP会员