《战斗模拟中的强化学习》 - 专知VIP

会员服务 ·

22

AI与军事 · 作战模拟 · 强化学习 ·

2024 年 12 月 10 日

《战斗模拟中的强化学习》

专知会员服务

专知，提供专业可信的知识分发服务，让认知协作更快更好！

在战斗模拟领域，由于此类环境的动态性和复杂性，深度强化学习（RL）智能体的训练和部署仍面临巨大挑战。不幸的是，随着场景和可用信息复杂性的增加，达到一定性能阈值所需的训练时间不仅会增加，而且往往会呈指数级增长。这种关系凸显了复杂性对训练 RL 智能体的深远影响。本文介绍了一种新颖的方法，可以解决使用 RL 训练AI智能体的这一局限性。由于现实世界的计算限制和已知的 RL 样本低效难题，传统的 RL 方法在这些高维动态环境中已被证明难以奏效。为了克服这些限制，我们提出了一种利用片断线性空间衰减进行局部观测抽象的方法。这种技术简化了状态空间，降低了计算需求，同时还保留了基本信息，从而在空间关系往往至关重要的动态环境中提高了人工智能训练效率。分析表明，在场景复杂度不断增加的情况下，这种局部观测方法始终优于传统的全局观测方法。本文推进了对 RL 观察抽象的研究，说明了局部观察与片断线性空间衰减如何为动态环境中的大型状态表示挑战提供有效的解决方案。

成为VIP会员查看完整内容

40

相关内容

AI与军事

人工智能在军事中可用于多项任务，例如目标识别、大数据处理、作战系统、网络安全、后勤运输、战争医疗、威胁和安全监测以及战斗模拟和训练。

《生成式人工智能和情报评估》

《生成式人工智能和情报评估》

专知会员服务

80+阅读 · 2024年7月22日

《高超音速攻击中武器与目标分配的深度强化学习》

《高超音速攻击中武器与目标分配的深度强化学习》

专知会员服务

60+阅读 · 2024年6月22日

《基于模拟探索新颖的战斗机作战机动：模拟测试飞行员的创造力》

《基于模拟探索新颖的战斗机作战机动：模拟测试飞行员的创造力》

专知会员服务

35+阅读 · 2024年5月28日

《在兵棋推演的战斗模拟中扩展智能体》

《在兵棋推演的战斗模拟中扩展智能体》

专知会员服务

88+阅读 · 2024年4月17日

《面向定义跨域的领域复杂性度量》 DARPA 和美陆军

《面向定义跨域的领域复杂性度量》 DARPA 和美陆军

专知会员服务

36+阅读 · 2024年2月25日

《基于开源软件强化学习的计算机生成兵力》

《基于开源软件强化学习的计算机生成兵力》

专知会员服务

72+阅读 · 2024年1月21日

《现实型环境中基于深度强化学习的空对空作战机动生成》

《现实型环境中基于深度强化学习的空对空作战机动生成》

专知会员服务

48+阅读 · 2023年10月26日

《用于空战机动的分层多智能体强化学习》

《用于空战机动的分层多智能体强化学习》

专知会员服务

63+阅读 · 2023年10月5日

《超视距空战中计算机生成兵力的行为建模》

《超视距空战中计算机生成兵力的行为建模》

专知会员服务

89+阅读 · 2023年7月10日

《用于 ISR 操作的增强现实协作和分析工具》美空军大学25页报告

《用于 ISR 操作的增强现实协作和分析工具》美空军大学25页报告

专知会员服务

39+阅读 · 2022年12月1日

【2023新书】深度学习与计算机视觉在遥感中的应用，572页pdf

【2023新书】深度学习与计算机视觉在遥感中的应用，572页pdf

专知

27+阅读 · 2023年4月6日

《利用边缘高性能计算 (HPC) 加速战术决策过程》美国陆军，43页报告

《利用边缘高性能计算 (HPC) 加速战术决策过程》美国陆军，43页报告

专知

98+阅读 · 2023年4月5日

「基于通信的多智能体强化学习」进展综述

「基于通信的多智能体强化学习」进展综述

专知

28+阅读 · 2022年11月12日

《使用机器学习智能体设计基于模拟的空战飞行员训练系统》2022瑞典林雪平大学页论文

《使用机器学习智能体设计基于模拟的空战飞行员训练系统》2022瑞典林雪平大学页论文

专知

35+阅读 · 2022年10月30日

《人工智能开发的严谨度》美国海军空战中心武器部 2022最新71页报告

《人工智能开发的严谨度》美国海军空战中心武器部 2022最新71页报告

专知

48+阅读 · 2022年9月25日

《基于多智能体深度强化学习的空战模拟智能体协作》瑞典林雪平大学

《基于多智能体深度强化学习的空战模拟智能体协作》瑞典林雪平大学

专知

55+阅读 · 2022年8月25日

基于模型的强化学习综述

基于模型的强化学习综述

专知

36+阅读 · 2022年7月13日

《面向军事应用的数据驱动的行为建模》荷兰应用科学研究组织（NTO）

《面向军事应用的数据驱动的行为建模》荷兰应用科学研究组织（NTO）

专知

37+阅读 · 2022年6月2日

《美国陆军和JADC2：通过融合实现决策优势》完整译文

《美国陆军和JADC2：通过融合实现决策优势》完整译文

专知

166+阅读 · 2022年5月26日

机器学习必备手册

机器学习必备手册

机器学习研究会

19+阅读 · 2017年10月24日

针对大规模环境下复杂任务的策略搜索强化学习方法研究

国家自然科学基金

41+阅读 · 2015年12月31日

基于抽象语义切片和后向求精分析的静态分析警报自动确认研究

国家自然科学基金

1+阅读 · 2015年12月31日

基于深度学习的复杂场景下人体行为识别研究

国家自然科学基金

9+阅读 · 2015年12月31日

基于深度表达和迁移学习的人体检测研究

国家自然科学基金

4+阅读 · 2015年12月31日

基于稀疏表示和低秩矩阵分解的鲁棒人脸识别研究

国家自然科学基金

2+阅读 · 2015年12月31日

基于支撑函数的不规则形态扩展目标建模和估计研究

国家自然科学基金

0+阅读 · 2015年12月31日

基于自主学习的Ad hoc Agent序贯决策研究

国家自然科学基金

43+阅读 · 2015年12月31日

面向异分布数据的主动学习方法

国家自然科学基金

12+阅读 · 2015年12月31日

开放动态环境下在线机器学习理论与方法

国家自然科学基金

10+阅读 · 2013年12月31日

基于融合先验知识的机器学习的多传感器融合研究

国家自然科学基金

16+阅读 · 2013年12月31日

Is ChatGPT a Good Recommender? A Preliminary Study

Arxiv

165+阅读 · 2023年4月20日

NeuralField-LDM: Scene Generation with Hierarchical Latent Diffusion Models

Arxiv

37+阅读 · 2023年4月19日

On Efficient Training of Large-Scale Deep Learning Models: A Literature Review

Arxiv

204+阅读 · 2023年4月7日

A Survey of Large Language Models

A Survey of Large Language Models

Arxiv

452+阅读 · 2023年3月31日

Unleashing the Power of Edge-Cloud Generative AI in Mobile Networks: A Survey of AIGC Services

Arxiv

140+阅读 · 2023年3月29日

ChatGPT is a Knowledgeable but Inexperienced Solver: An Investigation of Commonsense Problem in Large Language Models

Arxiv

61+阅读 · 2023年3月29日

Nature Language Reasoning, A Survey

Arxiv

76+阅读 · 2023年3月26日

Knowledge Graphs: Opportunities and Challenges

Arxiv

165+阅读 · 2023年3月24日

Sparks of Artificial General Intelligence: Early experiments with GPT-4

Arxiv

47+阅读 · 2023年3月22日

Data-centric Artificial Intelligence: A Survey

Arxiv

24+阅读 · 2023年3月17日

VIP会员

相关主题

相关VIP内容

《生成式人工智能和情报评估》

《生成式人工智能和情报评估》

专知会员服务

80+阅读 · 2024年7月22日

《高超音速攻击中武器与目标分配的深度强化学习》

《高超音速攻击中武器与目标分配的深度强化学习》

专知会员服务

60+阅读 · 2024年6月22日

《基于模拟探索新颖的战斗机作战机动：模拟测试飞行员的创造力》

《基于模拟探索新颖的战斗机作战机动：模拟测试飞行员的创造力》

专知会员服务

35+阅读 · 2024年5月28日

《在兵棋推演的战斗模拟中扩展智能体》

《在兵棋推演的战斗模拟中扩展智能体》

专知会员服务

88+阅读 · 2024年4月17日

《面向定义跨域的领域复杂性度量》 DARPA 和美陆军

《面向定义跨域的领域复杂性度量》 DARPA 和美陆军

专知会员服务

36+阅读 · 2024年2月25日

《基于开源软件强化学习的计算机生成兵力》

《基于开源软件强化学习的计算机生成兵力》

专知会员服务

72+阅读 · 2024年1月21日

《现实型环境中基于深度强化学习的空对空作战机动生成》

《现实型环境中基于深度强化学习的空对空作战机动生成》

专知会员服务

48+阅读 · 2023年10月26日

《用于空战机动的分层多智能体强化学习》

《用于空战机动的分层多智能体强化学习》

专知会员服务

63+阅读 · 2023年10月5日

《超视距空战中计算机生成兵力的行为建模》

《超视距空战中计算机生成兵力的行为建模》

专知会员服务

89+阅读 · 2023年7月10日

《用于 ISR 操作的增强现实协作和分析工具》美空军大学25页报告

《用于 ISR 操作的增强现实协作和分析工具》美空军大学25页报告

专知会员服务

39+阅读 · 2022年12月1日

热门VIP内容

开通专知VIP会员享更多权益服务

中文版 | 美国新型反导系统解析：五角大楼的"金穹"

美国陆军授予Duality AI公司合同：开发XM30战车人工智能反无人机系统

《自主侦察任务的最优策略研究》36页干货报告

中文版 | 美总统暗示1万亿美元国防预算——实际意味着什么？

相关资讯

【2023新书】深度学习与计算机视觉在遥感中的应用，572页pdf

【2023新书】深度学习与计算机视觉在遥感中的应用，572页pdf

专知

27+阅读 · 2023年4月6日

《利用边缘高性能计算 (HPC) 加速战术决策过程》美国陆军，43页报告

《利用边缘高性能计算 (HPC) 加速战术决策过程》美国陆军，43页报告

专知

98+阅读 · 2023年4月5日

「基于通信的多智能体强化学习」进展综述

「基于通信的多智能体强化学习」进展综述

专知

28+阅读 · 2022年11月12日

《使用机器学习智能体设计基于模拟的空战飞行员训练系统》2022瑞典林雪平大学页论文

《使用机器学习智能体设计基于模拟的空战飞行员训练系统》2022瑞典林雪平大学页论文

专知

35+阅读 · 2022年10月30日

《人工智能开发的严谨度》美国海军空战中心武器部 2022最新71页报告

《人工智能开发的严谨度》美国海军空战中心武器部 2022最新71页报告

专知

48+阅读 · 2022年9月25日

《基于多智能体深度强化学习的空战模拟智能体协作》瑞典林雪平大学

《基于多智能体深度强化学习的空战模拟智能体协作》瑞典林雪平大学

专知

55+阅读 · 2022年8月25日

基于模型的强化学习综述

基于模型的强化学习综述

专知

36+阅读 · 2022年7月13日

《面向军事应用的数据驱动的行为建模》荷兰应用科学研究组织（NTO）

《面向军事应用的数据驱动的行为建模》荷兰应用科学研究组织（NTO）

专知

37+阅读 · 2022年6月2日

《美国陆军和JADC2：通过融合实现决策优势》完整译文

《美国陆军和JADC2：通过融合实现决策优势》完整译文

专知

166+阅读 · 2022年5月26日

机器学习必备手册

机器学习必备手册

机器学习研究会

19+阅读 · 2017年10月24日

相关基金

针对大规模环境下复杂任务的策略搜索强化学习方法研究

国家自然科学基金

41+阅读 · 2015年12月31日

基于抽象语义切片和后向求精分析的静态分析警报自动确认研究

国家自然科学基金

1+阅读 · 2015年12月31日

基于深度学习的复杂场景下人体行为识别研究

国家自然科学基金

9+阅读 · 2015年12月31日

基于深度表达和迁移学习的人体检测研究

国家自然科学基金

4+阅读 · 2015年12月31日

基于稀疏表示和低秩矩阵分解的鲁棒人脸识别研究

国家自然科学基金

2+阅读 · 2015年12月31日

基于支撑函数的不规则形态扩展目标建模和估计研究

国家自然科学基金

0+阅读 · 2015年12月31日

基于自主学习的Ad hoc Agent序贯决策研究

国家自然科学基金

43+阅读 · 2015年12月31日

面向异分布数据的主动学习方法

国家自然科学基金

12+阅读 · 2015年12月31日

开放动态环境下在线机器学习理论与方法

国家自然科学基金

10+阅读 · 2013年12月31日

基于融合先验知识的机器学习的多传感器融合研究

国家自然科学基金

16+阅读 · 2013年12月31日

相关论文

Is ChatGPT a Good Recommender? A Preliminary Study

Arxiv

165+阅读 · 2023年4月20日

NeuralField-LDM: Scene Generation with Hierarchical Latent Diffusion Models

Arxiv

37+阅读 · 2023年4月19日

On Efficient Training of Large-Scale Deep Learning Models: A Literature Review

Arxiv

204+阅读 · 2023年4月7日

A Survey of Large Language Models

A Survey of Large Language Models

Arxiv

452+阅读 · 2023年3月31日

Unleashing the Power of Edge-Cloud Generative AI in Mobile Networks: A Survey of AIGC Services

Arxiv

140+阅读 · 2023年3月29日

ChatGPT is a Knowledgeable but Inexperienced Solver: An Investigation of Commonsense Problem in Large Language Models

Arxiv

61+阅读 · 2023年3月29日

Nature Language Reasoning, A Survey

Arxiv

76+阅读 · 2023年3月26日

Knowledge Graphs: Opportunities and Challenges

Arxiv

165+阅读 · 2023年3月24日

Sparks of Artificial General Intelligence: Early experiments with GPT-4

Arxiv

47+阅读 · 2023年3月22日

Data-centric Artificial Intelligence: A Survey

Arxiv

24+阅读 · 2023年3月17日

微信扫码咨询专知VIP会员