《战斗决策中的人工智能：基于强化学习和图神经网络的武器目标分配》 - 专知VIP

会员服务 ·

74

AI与军事 · 人工智能 · 强化学习 · 图神经网络 · 武器目标分配 ·

2024 年 10 月 11 日

《战斗决策中的人工智能：基于强化学习和图神经网络的武器目标分配》

专知会员服务

专知，提供专业可信的知识分发服务，让认知协作更快更好！

选择要攻击的威胁是战场上最重要的决策之一。该决策问题表现为武器-目标分配问题（WTA）。在以往的研究中，动态编程、线性规划、元启发式和启发式方法已被用于解决这一问题。然而，以往的研究因建模过于简化、计算负担重、缺乏对干扰事件的适应性以及问题规模变化时的重新计算等问题而受到限制。为了克服这些局限性，本研究旨在利用强化学习和图神经网络来解决 WTA 问题。所提出的方法反映了现实世界的决策框架--OODA-loop（观察-定向-决策），具有很高的实用性。在各种环境中进行了实验，并通过与现有的启发式和元启发式方法进行比较，证明了所提方法的有效性。所提出的方法为战术指挥与控制中的智能决策引入了一种开创性的方法，传统上被认为是人类专家的专属方法。

本研究将强化学习与图形神经网络（GNN）相结合。强化学习与 GNN 的结合是最有前途的领域之一，因为 GNN 能有效地表示复杂的交互作用。为了应用强化学习，DWTA 被建模为 POMDP（部分可观测马尔可夫决策过程）。为了优化强化学习智能体的策略，采用了近端策略优化（PPO）。学习环境是一个仿真模型，反映了对真实世界的详细描述。本研究的贡献如下。

本研究利用深度强化学习和图神经网络在各种情况下做出优化决策，为复杂性和不确定性主导的情况提供丰富的目标导向表征。
图神经网络有助于提高我们方法的可扩展性，从而增强其实际用途。
提出的方法通过人工智能技术的增强，为传统上由人类专家主导的领域（如战术指挥和控制）的决策制定带来了创新。
从整数编程中定义的问题出发，利用马尔可夫状态的理论基础和图建模技术系统地构建了 POMDP。与依靠直觉和经验法则推导 POMDP 的传统方法相比，这是一种更有条理的方法，更容易看出 POMDP 与所定义问题之间的联系。

成为VIP会员查看完整内容

相关内容

AI与军事

人工智能在军事中可用于多项任务，例如目标识别、大数据处理、作战系统、网络安全、后勤运输、战争医疗、威胁和安全监测以及战斗模拟和训练。

《基于深度学习的多导弹规避态势感知技术》

《基于深度学习的多导弹规避态势感知技术》

专知会员服务

36+阅读 · 2024年11月20日

《开发和优化在游戏场景中控制虚拟炮兵单元的仿真模型和方法》

《开发和优化在游戏场景中控制虚拟炮兵单元的仿真模型和方法》

专知会员服务

17+阅读 · 2024年11月4日

《军事危机模拟中语言模型自由决策不一致性度量》

《军事危机模拟中语言模型自由决策不一致性度量》

专知会员服务

20+阅读 · 2024年10月29日

《考虑航向误差的武器目标分配问题研究》

《考虑航向误差的武器目标分配问题研究》

专知会员服务

28+阅读 · 2024年10月12日

《基于动机的战术空对空训练和通用架构下机器学习的计算机生成部队（CGF）建模》

《基于动机的战术空对空训练和通用架构下机器学习的计算机生成部队（CGF）建模》

专知会员服务

34+阅读 · 2024年6月29日

《无人机的人机协作：实验平台》

《无人机的人机协作：实验平台》

专知会员服务

89+阅读 · 2024年6月11日

《改进事后分析（AAR）：自然语言处理和机器学习的军事训练应用》

《改进事后分析（AAR）：自然语言处理和机器学习的军事训练应用》

专知会员服务

43+阅读 · 2024年2月25日

《计算机视觉在战争战术边缘的适应性：应对作战环境的不确定性》

《计算机视觉在战争战术边缘的适应性：应对作战环境的不确定性》

专知会员服务

71+阅读 · 2023年12月19日

《现代游戏和仿真的军事应用》

《现代游戏和仿真的军事应用》

专知会员服务

68+阅读 · 2023年11月27日

《可信深度强化学习用于多效协同防御作战：综述》

《可信深度强化学习用于多效协同防御作战：综述》

专知会员服务

70+阅读 · 2023年6月19日

《多域作战环境下的军事决策过程》

《多域作战环境下的军事决策过程》

专知

112+阅读 · 2023年4月12日

《网络化传感器集成架构：未来多传感器多平台运行的赋能器》

《网络化传感器集成架构：未来多传感器多平台运行的赋能器》

专知

32+阅读 · 2023年4月11日

《可解释人工智能在多域作战中的智能增强》美国陆军、IBM、卡迪夫大学等论文

《可解释人工智能在多域作战中的智能增强》美国陆军、IBM、卡迪夫大学等论文

专知

67+阅读 · 2022年11月2日

《未来之战：作战层面的网络战》美国陆军，67页PDF

《未来之战：作战层面的网络战》美国陆军，67页PDF

专知

115+阅读 · 2022年8月13日

北约384页技术报告《评估和沟通情报中的不确定性以支持决策》

北约384页技术报告《评估和沟通情报中的不确定性以支持决策》

专知

36+阅读 · 2022年7月26日

【2022新书】机器学习中的概率数值计算，412页pdf

【2022新书】机器学习中的概率数值计算，412页pdf

专知

32+阅读 · 2022年7月7日

美国国防部《图论在建模、仿真、分析OODA环路和信任中的应用：量化任务的成功率》30页报告

美国国防部《图论在建模、仿真、分析OODA环路和信任中的应用：量化任务的成功率》30页报告

专知

25+阅读 · 2022年7月5日

《面向军事应用的数据驱动的行为建模》荷兰应用科学研究组织（NTO）

《面向军事应用的数据驱动的行为建模》荷兰应用科学研究组织（NTO）

专知

50+阅读 · 2022年6月2日

最新《图嵌入组合优化》综述论文，40页pdf

最新《图嵌入组合优化》综述论文，40页pdf

专知

41+阅读 · 2020年8月31日

【KDD2020-Tutorial】深度学习异常检测，180页ppt

【KDD2020-Tutorial】深度学习异常检测，180页ppt

专知

49+阅读 · 2020年8月28日

基于进化算法的大规模本体匹配问题研究

国家自然科学基金

3+阅读 · 2015年12月31日

基于对称识别方法的贝叶斯probit模型稳健性研究

国家自然科学基金

3+阅读 · 2015年12月31日

基于多样化查询的多标记主动学习研究

国家自然科学基金

0+阅读 · 2015年12月31日

基于支撑函数的不规则形态扩展目标建模和估计研究

国家自然科学基金

0+阅读 · 2015年12月31日

一类不确定非线性大系统的非光滑分散控制研究

国家自然科学基金

0+阅读 · 2015年12月31日

基于神经网络的无约束0-1二次规划全局最优算法研究

国家自然科学基金

3+阅读 · 2015年12月31日

面向大规模多步学习问题的学习分类元系统技术研究

国家自然科学基金

5+阅读 · 2015年12月31日

基于低维连续表示的启发式智能规划技术研究

国家自然科学基金

4+阅读 · 2015年12月31日

CGF战场空间认知行为建模研究

国家自然科学基金

51+阅读 · 2014年12月31日

解决地图要素空间冲突的智能化协同模型和算法

国家自然科学基金

6+阅读 · 2014年12月31日

Closed-loop multi-step planning with innate physics knowledge

Arxiv

0+阅读 · 2024年11月18日

A survey and taxonomy of loss functions in machine learning

Arxiv

0+阅读 · 2024年11月18日

PickScan: Object discovery and reconstruction from handheld interactions

Arxiv

0+阅读 · 2024年11月17日

Physics-informed neural networks (PINNs) for numerical model error approximation and superresolution

Arxiv

0+阅读 · 2024年11月14日

A Comprehensive Survey on Deep Graph Representation Learning

Arxiv

106+阅读 · 2023年4月11日

On Efficient Training of Large-Scale Deep Learning Models: A Literature Review

Arxiv

224+阅读 · 2023年4月7日

A Survey of Large Language Models

A Survey of Large Language Models

Arxiv

494+阅读 · 2023年3月31日

Data-centric Artificial Intelligence: A Survey

Arxiv

25+阅读 · 2023年3月17日

On games and simulators as a platform for development of artificial intelligence for command and control

On games and simulators as a platform for development of artificial intelligence for command and control

Arxiv

89+阅读 · 2021年10月21日

Interpretable machine learning: definitions, methods, and applications

Interpretable machine learning: definitions, methods, and applications

Arxiv

19+阅读 · 2019年1月14日

VIP会员

相关主题

图神经网络

武器目标分配

相关VIP内容

《基于深度学习的多导弹规避态势感知技术》

《基于深度学习的多导弹规避态势感知技术》

专知会员服务

36+阅读 · 2024年11月20日

《开发和优化在游戏场景中控制虚拟炮兵单元的仿真模型和方法》

《开发和优化在游戏场景中控制虚拟炮兵单元的仿真模型和方法》

专知会员服务

17+阅读 · 2024年11月4日

《军事危机模拟中语言模型自由决策不一致性度量》

《军事危机模拟中语言模型自由决策不一致性度量》

专知会员服务

20+阅读 · 2024年10月29日

《考虑航向误差的武器目标分配问题研究》

《考虑航向误差的武器目标分配问题研究》

专知会员服务

28+阅读 · 2024年10月12日

《基于动机的战术空对空训练和通用架构下机器学习的计算机生成部队（CGF）建模》

《基于动机的战术空对空训练和通用架构下机器学习的计算机生成部队（CGF）建模》

专知会员服务

34+阅读 · 2024年6月29日

《无人机的人机协作：实验平台》

《无人机的人机协作：实验平台》

专知会员服务

89+阅读 · 2024年6月11日

《改进事后分析（AAR）：自然语言处理和机器学习的军事训练应用》

《改进事后分析（AAR）：自然语言处理和机器学习的军事训练应用》

专知会员服务

43+阅读 · 2024年2月25日

《计算机视觉在战争战术边缘的适应性：应对作战环境的不确定性》

《计算机视觉在战争战术边缘的适应性：应对作战环境的不确定性》

专知会员服务

71+阅读 · 2023年12月19日

《现代游戏和仿真的军事应用》

《现代游戏和仿真的军事应用》

专知会员服务

68+阅读 · 2023年11月27日

《可信深度强化学习用于多效协同防御作战：综述》

《可信深度强化学习用于多效协同防御作战：综述》

专知会员服务

70+阅读 · 2023年6月19日

热门VIP内容

开通专知VIP会员享更多权益服务

大语言模型智能体强化学习：全景综述

《城市滨海地区：理解复杂多变环境下的指挥控制框架》50页报告

【伯克利博士论文】从推理服务到训练：面向大规模 LLM 智能体的高效系统

美空军“顶点2025”实验：推进AI在C2、动态目标锁定与联盟集成中的应用

相关资讯

《多域作战环境下的军事决策过程》

《多域作战环境下的军事决策过程》

专知

112+阅读 · 2023年4月12日

《网络化传感器集成架构：未来多传感器多平台运行的赋能器》

《网络化传感器集成架构：未来多传感器多平台运行的赋能器》

专知

32+阅读 · 2023年4月11日

《可解释人工智能在多域作战中的智能增强》美国陆军、IBM、卡迪夫大学等论文

《可解释人工智能在多域作战中的智能增强》美国陆军、IBM、卡迪夫大学等论文

专知

67+阅读 · 2022年11月2日

《未来之战：作战层面的网络战》美国陆军，67页PDF

《未来之战：作战层面的网络战》美国陆军，67页PDF

专知

115+阅读 · 2022年8月13日

北约384页技术报告《评估和沟通情报中的不确定性以支持决策》

北约384页技术报告《评估和沟通情报中的不确定性以支持决策》

专知

36+阅读 · 2022年7月26日

【2022新书】机器学习中的概率数值计算，412页pdf

【2022新书】机器学习中的概率数值计算，412页pdf

专知

32+阅读 · 2022年7月7日

美国国防部《图论在建模、仿真、分析OODA环路和信任中的应用：量化任务的成功率》30页报告

美国国防部《图论在建模、仿真、分析OODA环路和信任中的应用：量化任务的成功率》30页报告

专知

25+阅读 · 2022年7月5日

《面向军事应用的数据驱动的行为建模》荷兰应用科学研究组织（NTO）

《面向军事应用的数据驱动的行为建模》荷兰应用科学研究组织（NTO）

专知

50+阅读 · 2022年6月2日

最新《图嵌入组合优化》综述论文，40页pdf

最新《图嵌入组合优化》综述论文，40页pdf

专知

41+阅读 · 2020年8月31日

【KDD2020-Tutorial】深度学习异常检测，180页ppt

【KDD2020-Tutorial】深度学习异常检测，180页ppt

专知

49+阅读 · 2020年8月28日

相关基金

基于进化算法的大规模本体匹配问题研究

国家自然科学基金

3+阅读 · 2015年12月31日

基于对称识别方法的贝叶斯probit模型稳健性研究

国家自然科学基金

3+阅读 · 2015年12月31日

基于多样化查询的多标记主动学习研究

国家自然科学基金

0+阅读 · 2015年12月31日

基于支撑函数的不规则形态扩展目标建模和估计研究

国家自然科学基金

0+阅读 · 2015年12月31日

一类不确定非线性大系统的非光滑分散控制研究

国家自然科学基金

0+阅读 · 2015年12月31日

基于神经网络的无约束0-1二次规划全局最优算法研究

国家自然科学基金

3+阅读 · 2015年12月31日

面向大规模多步学习问题的学习分类元系统技术研究

国家自然科学基金

5+阅读 · 2015年12月31日

基于低维连续表示的启发式智能规划技术研究

国家自然科学基金

4+阅读 · 2015年12月31日

CGF战场空间认知行为建模研究

国家自然科学基金

51+阅读 · 2014年12月31日

解决地图要素空间冲突的智能化协同模型和算法

国家自然科学基金

6+阅读 · 2014年12月31日

相关论文

Closed-loop multi-step planning with innate physics knowledge

Arxiv

0+阅读 · 2024年11月18日

A survey and taxonomy of loss functions in machine learning

Arxiv

0+阅读 · 2024年11月18日

PickScan: Object discovery and reconstruction from handheld interactions

Arxiv

0+阅读 · 2024年11月17日

Physics-informed neural networks (PINNs) for numerical model error approximation and superresolution

Arxiv

0+阅读 · 2024年11月14日

A Comprehensive Survey on Deep Graph Representation Learning

Arxiv

106+阅读 · 2023年4月11日

On Efficient Training of Large-Scale Deep Learning Models: A Literature Review

Arxiv

224+阅读 · 2023年4月7日

A Survey of Large Language Models

A Survey of Large Language Models

Arxiv

494+阅读 · 2023年3月31日

Data-centric Artificial Intelligence: A Survey

Arxiv

25+阅读 · 2023年3月17日

On games and simulators as a platform for development of artificial intelligence for command and control

On games and simulators as a platform for development of artificial intelligence for command and control

Arxiv

89+阅读 · 2021年10月21日

Interpretable machine learning: definitions, methods, and applications

Interpretable machine learning: definitions, methods, and applications

Arxiv

19+阅读 · 2019年1月14日

微信扫码咨询专知VIP会员