《弹性控制和协调的深度终身强化学习》美国空军研究实验室30页技术总结报告 - 专知VIP

会员服务 ·

29

AI与军事 · 深度终身强化学习 · 美国空军研究实验室（AFRL） · 反卷积因子卷积神经网络（DFCNN） · 情报、监视、侦察 (ISR) ·

2022 年 7 月 15 日

《弹性控制和协调的深度终身强化学习》美国空军研究实验室30页技术总结报告

专知会员服务

专知，提供专业可信的知识分发服务，让认知协作更快更好！

这项工作的目的是开发能够成功处理复杂动态环境中顺序决策的深度终身学习方法，重点是多Agent情报、监视和侦察（ISR）场景。我们为深度卷积神经网络开发了一个新的架构，支持通过去卷积因子化的终身学习（DF-CNN），探索了通过Distral和Sobolev训练的策略提炼的组合，并开发了一个混合控制器，将深度学习应用于ISR智能体。我们的方法在标准基准深度学习数据集、DOOM环境和ATE3模拟环境中的ISR场景中进行了评估。

我们的主要贡献是反卷积因子卷积神经网络（DFCNN）。DF-CNN框架调整了标准卷积神经网络（CNN）框架，以实现任务之间的转移。它在每个CNN层维护一个共享知识库，并通过这个共享知识促进不同任务的CNN之间的转移。每个具体任务的CNN模型的各个过滤层都是由这个共享知识库重建的，随着网络在多个任务中的训练，这个知识库会随着时间的推移而调整。DF-CNN代表了ELLA终身学习框架对深度网络的概括。

实验表明，DF-CNN在终身中的基准识别任务上的表现优于其他方法（包括单任务学习、低层的硬参数共享和渐进式神经网络）。此外，该框架能够抵抗灾难性遗忘，同时仍然允许从未来的学习中反向转移到以前学习的模型。

对于深度强化学习，我们研究了将Sobolev训练整合到Distral多任务框架中，以努力改善转移和训练，探索了DF-CNN在深度RL中的应用，并开发了一个混合控制器，将本地学习的深度RL策略结合在一起，在ATE3仿真环境中完成ISR场景。

成为VIP会员查看完整内容

45

相关内容

AI与军事

人工智能在军事中可用于多项任务，例如目标识别、大数据处理、作战系统、网络安全、后勤运输、战争医疗、威胁和安全监测以及战斗模拟和训练。

《美国国防部：反小型无人机系统战略》38页报告

《美国国防部：反小型无人机系统战略》38页报告

专知会员服务

273+阅读 · 2022年8月12日

北约114页技术总结报告《无人地面系统和C2内互操作性的能力概念演示》

北约114页技术总结报告《无人地面系统和C2内互操作性的能力概念演示》

专知会员服务

106+阅读 · 2022年7月19日

北约162页技术报告《指挥与控制仿真（C2SIM）互操作性标准的实施》，北约9个国家15位作者联合发布

北约162页技术报告《指挥与控制仿真（C2SIM）互操作性标准的实施》，北约9个国家15位作者联合发布

专知会员服务

155+阅读 · 2022年7月18日

俄亥俄州立大学294页博士论文《推进用于实时参数调整和决策的完全自适应雷达概念》美国空军研究实验室赞助

俄亥俄州立大学294页博士论文《推进用于实时参数调整和决策的完全自适应雷达概念》美国空军研究实验室赞助

专知会员服务

125+阅读 · 2022年7月13日

美国空军研究实验室《探索深度学习系统的脆弱性和稳健性》2022年最新85页技术报告

美国空军研究实验室《探索深度学习系统的脆弱性和稳健性》2022年最新85页技术报告

专知会员服务

110+阅读 · 2022年7月5日

美国国防部《联合全域指挥与控制（JADC2）战略概要》

美国国防部《联合全域指挥与控制（JADC2）战略概要》

专知会员服务

320+阅读 · 2022年6月13日

挪威皇家空军《第五代空军的指挥与控制：F-35空中行动的协调要求和挪威武装部队的指挥和控制系统》

挪威皇家空军《第五代空军的指挥与控制：F-35空中行动的协调要求和挪威武装部队的指挥和控制系统》

专知会员服务

85+阅读 · 2022年5月28日

【新情报概念】美国陆军未来司令部《情报2028概念》107页报告

【新情报概念】美国陆军未来司令部《情报2028概念》107页报告

专知会员服务

234+阅读 · 2022年5月13日

美国国防部《指挥、控制和通信 (C3)现代化战略》

美国国防部《指挥、控制和通信 (C3)现代化战略》

专知会员服务

228+阅读 · 2022年5月9日

【AI+兵棋推演】最新paper速读：美国陆军将游戏和模拟器作为平台开发用于指挥和控制的人工智能

【AI+兵棋推演】最新paper速读：美国陆军将游戏和模拟器作为平台开发用于指挥和控制的人工智能

专知会员服务

117+阅读 · 2022年3月15日

推荐！【中文版】《人工智能在指挥和控制系统中的决策支持》瑞典国防研究局

推荐！【中文版】《人工智能在指挥和控制系统中的决策支持》瑞典国防研究局

专知

33+阅读 · 2022年7月31日

北约162页技术报告《指挥与控制仿真（C2SIM）互操作性标准的实施》，北约9个国家15位作者联合发布

北约162页技术报告《指挥与控制仿真（C2SIM）互操作性标准的实施》，北约9个国家15位作者联合发布

专知

48+阅读 · 2022年7月21日

AI如何促进空军？麻省理工(DAF-MIT)发布《为美国空军开发一系列人工智能挑战》报告，发布挑战数据集和代码库，总结经验教训

AI如何促进空军？麻省理工(DAF-MIT)发布《为美国空军开发一系列人工智能挑战》报告，发布挑战数据集和代码库，总结经验教训

专知

13+阅读 · 2022年7月19日

俄亥俄州立大学294页博士论文《推进用于实时参数调整和决策的完全自适应雷达概念》美国空军研究实验室赞助

俄亥俄州立大学294页博士论文《推进用于实时参数调整和决策的完全自适应雷达概念》美国空军研究实验室赞助

专知

7+阅读 · 2022年7月14日

推荐！【中文版】美国陆军《用于决策动力学、欺骗和博弈论的新型人工智能决策辅助工具》52页技术总结报告

推荐！【中文版】美国陆军《用于决策动力学、欺骗和博弈论的新型人工智能决策辅助工具》52页技术总结报告

专知

83+阅读 · 2022年7月7日

美国空军研究实验室《探索深度学习系统的脆弱性和稳健性》2022年最新85页技术报告

美国空军研究实验室《探索深度学习系统的脆弱性和稳健性》2022年最新85页技术报告

专知

9+阅读 · 2022年7月6日

【万字长文】《21世纪的指挥与控制要求：ABMS和JADC2的下一个增长领域》美国空军米切尔研究所

【万字长文】《21世纪的指挥与控制要求：ABMS和JADC2的下一个增长领域》美国空军米切尔研究所

专知

70+阅读 · 2022年6月7日

中文版《作战云：在军事行动范围内实现多域指挥与控制》美国空军

中文版《作战云：在军事行动范围内实现多域指挥与控制》美国空军

专知

134+阅读 · 2022年5月31日

【AI+军事】《群体自主系统的态势感知》北约最新技术报告

【AI+军事】《群体自主系统的态势感知》北约最新技术报告

专知

128+阅读 · 2022年4月2日

美国「联合全域指挥与控制 (JADC2)」战略发展最新总结报告，12页pdf

美国「联合全域指挥与控制 (JADC2)」战略发展最新总结报告，12页pdf

专知

176+阅读 · 2022年3月23日

基于认知学习的智能机器人控制系统关键问题的研究

国家自然科学基金

7+阅读 · 2014年12月31日

舰面旋翼瞬态气动弹性响应及其控制研究

国家自然科学基金

2+阅读 · 2014年12月31日

指挥控制任务共同体的机制和模型研究

国家自然科学基金

35+阅读 · 2013年12月31日

混杂Lagrange网络系统协调动力学的分析与控制

国家自然科学基金

0+阅读 · 2012年12月31日

多子体灵活收放的子母式机器人控制与协调研究

国家自然科学基金

0+阅读 · 2012年12月31日

施工计划中的复杂时间关系表述及施工顺序优化

国家自然科学基金

1+阅读 · 2012年12月31日

不确定环境下集装箱码头物流运作能力仿真建模与动态评估

国家自然科学基金

0+阅读 · 2011年12月31日

基于智能模糊动态特征模型的高超声速飞行器先进控制

国家自然科学基金

1+阅读 · 2010年12月31日

分布式集成协作控制在大规模多智能体系统中的设计

国家自然科学基金

8+阅读 · 2009年12月31日

一体化联合作战中装备保障信息网络的抗毁能力分析与优化方法研究

国家自然科学基金

8+阅读 · 2009年12月31日

Adversarial Examples in Constrained Domains

Adversarial Examples in Constrained Domains

Arxiv

0+阅读 · 2022年9月9日

Model- and Acceleration-based Pursuit Controller for High-Performance Autonomous Racing

Model- and Acceleration-based Pursuit Controller for High-Performance Autonomous Racing

Arxiv

0+阅读 · 2022年9月9日

Levenshtein OCR

Arxiv

0+阅读 · 2022年9月8日

Same Coverage, Less Bloat: Accelerating Binary-only Fuzzing with Coverage-preserving Coverage-guided Tracing

Arxiv

0+阅读 · 2022年9月7日

Modular Federated Learning

Arxiv

0+阅读 · 2022年9月7日

Cerberus: Exploring Federated Prediction of Security Events

Arxiv

0+阅读 · 2022年9月7日

Optimizing Demonstrated Robot Manipulation Skills for Temporal Logic Constraints

Arxiv

0+阅读 · 2022年9月7日

Can GAN-induced Attribute Manipulations Impact Face Recognition?

Arxiv

0+阅读 · 2022年9月7日

DAVE Aquatic Virtual Environment: Toward a General Underwater Robotics Simulator

Arxiv

0+阅读 · 2022年9月6日

Doc2EDAG: An End-to-End Document-level Framework for Chinese Financial Event Extraction

Doc2EDAG: An End-to-End Document-level Framework for Chinese Financial Event Extraction

Arxiv

11+阅读 · 2019年9月23日

VIP会员

相关主题

深度终身强化学习

美国空军研究实验室（AFRL）

反卷积因子卷积神经网络（DFCNN）

情报、监视、侦察 (ISR)

相关VIP内容

《美国国防部：反小型无人机系统战略》38页报告

《美国国防部：反小型无人机系统战略》38页报告

专知会员服务

273+阅读 · 2022年8月12日

北约114页技术总结报告《无人地面系统和C2内互操作性的能力概念演示》

北约114页技术总结报告《无人地面系统和C2内互操作性的能力概念演示》

专知会员服务

106+阅读 · 2022年7月19日

北约162页技术报告《指挥与控制仿真（C2SIM）互操作性标准的实施》，北约9个国家15位作者联合发布

北约162页技术报告《指挥与控制仿真（C2SIM）互操作性标准的实施》，北约9个国家15位作者联合发布

专知会员服务

155+阅读 · 2022年7月18日

俄亥俄州立大学294页博士论文《推进用于实时参数调整和决策的完全自适应雷达概念》美国空军研究实验室赞助

俄亥俄州立大学294页博士论文《推进用于实时参数调整和决策的完全自适应雷达概念》美国空军研究实验室赞助

专知会员服务

125+阅读 · 2022年7月13日

美国空军研究实验室《探索深度学习系统的脆弱性和稳健性》2022年最新85页技术报告

美国空军研究实验室《探索深度学习系统的脆弱性和稳健性》2022年最新85页技术报告

专知会员服务

110+阅读 · 2022年7月5日

美国国防部《联合全域指挥与控制（JADC2）战略概要》

美国国防部《联合全域指挥与控制（JADC2）战略概要》

专知会员服务

320+阅读 · 2022年6月13日

挪威皇家空军《第五代空军的指挥与控制：F-35空中行动的协调要求和挪威武装部队的指挥和控制系统》

挪威皇家空军《第五代空军的指挥与控制：F-35空中行动的协调要求和挪威武装部队的指挥和控制系统》

专知会员服务

85+阅读 · 2022年5月28日

【新情报概念】美国陆军未来司令部《情报2028概念》107页报告

【新情报概念】美国陆军未来司令部《情报2028概念》107页报告

专知会员服务

234+阅读 · 2022年5月13日

美国国防部《指挥、控制和通信 (C3)现代化战略》

美国国防部《指挥、控制和通信 (C3)现代化战略》

专知会员服务

228+阅读 · 2022年5月9日

【AI+兵棋推演】最新paper速读：美国陆军将游戏和模拟器作为平台开发用于指挥和控制的人工智能

【AI+兵棋推演】最新paper速读：美国陆军将游戏和模拟器作为平台开发用于指挥和控制的人工智能

专知会员服务

117+阅读 · 2022年3月15日

热门VIP内容

开通专知VIP会员享更多权益服务

《俄乌战争中的无人系统：新的战争方式与新兴趋势——来自前线的印象》报告

《海上自主水面船舶远程操作中心：安全可持续运行的多维度分析》

多模态大语言模型下游调优中“保持自我”的重要性

隐身自主无人水下航行器技术如何变革水下作战并重塑海军竞争

相关资讯

推荐！【中文版】《人工智能在指挥和控制系统中的决策支持》瑞典国防研究局

推荐！【中文版】《人工智能在指挥和控制系统中的决策支持》瑞典国防研究局

专知

33+阅读 · 2022年7月31日

北约162页技术报告《指挥与控制仿真（C2SIM）互操作性标准的实施》，北约9个国家15位作者联合发布

北约162页技术报告《指挥与控制仿真（C2SIM）互操作性标准的实施》，北约9个国家15位作者联合发布

专知

48+阅读 · 2022年7月21日

AI如何促进空军？麻省理工(DAF-MIT)发布《为美国空军开发一系列人工智能挑战》报告，发布挑战数据集和代码库，总结经验教训

AI如何促进空军？麻省理工(DAF-MIT)发布《为美国空军开发一系列人工智能挑战》报告，发布挑战数据集和代码库，总结经验教训

专知

13+阅读 · 2022年7月19日

俄亥俄州立大学294页博士论文《推进用于实时参数调整和决策的完全自适应雷达概念》美国空军研究实验室赞助

俄亥俄州立大学294页博士论文《推进用于实时参数调整和决策的完全自适应雷达概念》美国空军研究实验室赞助

专知

7+阅读 · 2022年7月14日

推荐！【中文版】美国陆军《用于决策动力学、欺骗和博弈论的新型人工智能决策辅助工具》52页技术总结报告

推荐！【中文版】美国陆军《用于决策动力学、欺骗和博弈论的新型人工智能决策辅助工具》52页技术总结报告

专知

83+阅读 · 2022年7月7日

美国空军研究实验室《探索深度学习系统的脆弱性和稳健性》2022年最新85页技术报告

美国空军研究实验室《探索深度学习系统的脆弱性和稳健性》2022年最新85页技术报告

专知

9+阅读 · 2022年7月6日

【万字长文】《21世纪的指挥与控制要求：ABMS和JADC2的下一个增长领域》美国空军米切尔研究所

【万字长文】《21世纪的指挥与控制要求：ABMS和JADC2的下一个增长领域》美国空军米切尔研究所

专知

70+阅读 · 2022年6月7日

中文版《作战云：在军事行动范围内实现多域指挥与控制》美国空军

中文版《作战云：在军事行动范围内实现多域指挥与控制》美国空军

专知

134+阅读 · 2022年5月31日

【AI+军事】《群体自主系统的态势感知》北约最新技术报告

【AI+军事】《群体自主系统的态势感知》北约最新技术报告

专知

128+阅读 · 2022年4月2日

美国「联合全域指挥与控制 (JADC2)」战略发展最新总结报告，12页pdf

美国「联合全域指挥与控制 (JADC2)」战略发展最新总结报告，12页pdf

专知

176+阅读 · 2022年3月23日

相关基金

基于认知学习的智能机器人控制系统关键问题的研究

国家自然科学基金

7+阅读 · 2014年12月31日

舰面旋翼瞬态气动弹性响应及其控制研究

国家自然科学基金

2+阅读 · 2014年12月31日

指挥控制任务共同体的机制和模型研究

国家自然科学基金

35+阅读 · 2013年12月31日

混杂Lagrange网络系统协调动力学的分析与控制

国家自然科学基金

0+阅读 · 2012年12月31日

多子体灵活收放的子母式机器人控制与协调研究

国家自然科学基金

0+阅读 · 2012年12月31日

施工计划中的复杂时间关系表述及施工顺序优化

国家自然科学基金

1+阅读 · 2012年12月31日

不确定环境下集装箱码头物流运作能力仿真建模与动态评估

国家自然科学基金

0+阅读 · 2011年12月31日

基于智能模糊动态特征模型的高超声速飞行器先进控制

国家自然科学基金

1+阅读 · 2010年12月31日

分布式集成协作控制在大规模多智能体系统中的设计

国家自然科学基金

8+阅读 · 2009年12月31日

一体化联合作战中装备保障信息网络的抗毁能力分析与优化方法研究

国家自然科学基金

8+阅读 · 2009年12月31日

相关论文

Adversarial Examples in Constrained Domains

Adversarial Examples in Constrained Domains

Arxiv

0+阅读 · 2022年9月9日

Model- and Acceleration-based Pursuit Controller for High-Performance Autonomous Racing

Model- and Acceleration-based Pursuit Controller for High-Performance Autonomous Racing

Arxiv

0+阅读 · 2022年9月9日

Levenshtein OCR

Arxiv

0+阅读 · 2022年9月8日

Same Coverage, Less Bloat: Accelerating Binary-only Fuzzing with Coverage-preserving Coverage-guided Tracing

Arxiv

0+阅读 · 2022年9月7日

Modular Federated Learning

Arxiv

0+阅读 · 2022年9月7日

Cerberus: Exploring Federated Prediction of Security Events

Arxiv

0+阅读 · 2022年9月7日

Optimizing Demonstrated Robot Manipulation Skills for Temporal Logic Constraints

Arxiv

0+阅读 · 2022年9月7日

Can GAN-induced Attribute Manipulations Impact Face Recognition?

Arxiv

0+阅读 · 2022年9月7日

DAVE Aquatic Virtual Environment: Toward a General Underwater Robotics Simulator

Arxiv

0+阅读 · 2022年9月6日

Doc2EDAG: An End-to-End Document-level Framework for Chinese Financial Event Extraction

Doc2EDAG: An End-to-End Document-level Framework for Chinese Financial Event Extraction

Arxiv

11+阅读 · 2019年9月23日

微信扫码咨询专知VIP会员