《基于强化学习开发战斗行为》美国海军研究生院 - 专知VIP

会员服务 ·

56

AI与军事 · 强化学习 · 美国海军研究生院 · 论文 ·

2022 年 6 月 27 日

《基于强化学习开发战斗行为》美国海军研究生院

专知会员服务

专知，提供专业可信的知识分发服务，让认知协作更快更好！

强化学习在最近的学术和商业研究项目中的应用已经产生了能够达到或超过人类性能水平的强大系统。本论文的目的是确定通过强化学习训练的智能体是否能够在小型战斗场景中实现最佳性能。在一组计算实验中，训练是在一个简单的总体层面上进行的，模拟能够实现确定性和随机性的战斗模型，神经网络的性能被验证为质量和武力经济性战术原则。总的来说，神经网络能够学习到理想的行为，其中作战模型和强化学习算法对性能的影响最为显著。此外，在集结是最佳战术的情况下，训练时间和学习率被确定为最重要的训练超参数。然而，当武力的经济性是理想的时候，折扣系数是唯一有重大影响的超参数。综上所述，本论文得出结论，强化学习为发展战斗模拟中的智能行为提供了一种有前途的手段，它可以应用于训练或分析领域。建议未来的研究对更大、更复杂的训练场景进行研究，以充分了解强化学习的能力和局限性。

成为VIP会员查看完整内容

96

相关内容

AI与军事

人工智能在军事中可用于多项任务，例如目标识别、大数据处理、作战系统、网络安全、后勤运输、战争医疗、威胁和安全监测以及战斗模拟和训练。

美国空军大学《使用基于模型的强化学习进行团队空战》100页学位论文

美国空军大学《使用基于模型的强化学习进行团队空战》100页学位论文

专知会员服务

141+阅读 · 2022年7月15日

推荐！中文版《作战战略机动的多智能体协作强化学习研究综述》美国陆军研究实验室最新33页研究报告

推荐！中文版《作战战略机动的多智能体协作强化学习研究综述》美国陆军研究实验室最新33页研究报告

专知会员服务

307+阅读 · 2022年6月23日

《在兵棋推演和模拟中应用强化学习开发作战实体行为》美国海军陆战队、海军研究生院

《在兵棋推演和模拟中应用强化学习开发作战实体行为》美国海军陆战队、海军研究生院

专知会员服务

100+阅读 · 2022年6月16日

《敏捷、抗脆弱、以人工智能为基础的指挥和控制》万字长文，中文版，新南威尔士大学

《敏捷、抗脆弱、以人工智能为基础的指挥和控制》万字长文，中文版，新南威尔士大学

专知会员服务

77+阅读 · 2022年5月18日

《军事作战研究中的近似动态规划（强化学习）应用综述》加拿大国防研究与发展部、加拿大联合作战司令部

《军事作战研究中的近似动态规划（强化学习）应用综述》加拿大国防研究与发展部、加拿大联合作战司令部

专知会员服务

139+阅读 · 2022年5月17日

使用博弈论进行国防资源分配管理

使用博弈论进行国防资源分配管理

专知会员服务

84+阅读 · 2022年5月6日

【AI+军事】附论文+PPT 《用于战术分析、训练和优化的深度自我优化人工智能》

【AI+军事】附论文+PPT 《用于战术分析、训练和优化的深度自我优化人工智能》

专知会员服务

82+阅读 · 2022年4月17日

【AI+军事】14页ppt为讲解《混合作战兵棋推演》概念，美国海军研究生院

【AI+军事】14页ppt为讲解《混合作战兵棋推演》概念，美国海军研究生院

专知会员服务

142+阅读 · 2022年4月7日

捷克国防大学《作战环境联合情报准备在支持未来军事行动中的作用》最新论文

捷克国防大学《作战环境联合情报准备在支持未来军事行动中的作用》最新论文

专知会员服务

103+阅读 · 2022年4月6日

最新论文《战术网络的强化学习环境：基于多智能体的场景生成》德国弗劳恩霍夫研究所

最新论文《战术网络的强化学习环境：基于多智能体的场景生成》德国弗劳恩霍夫研究所

专知会员服务

146+阅读 · 2022年4月5日

推荐！【中文版】《人工智能在指挥和控制系统中的决策支持》瑞典国防研究局

推荐！【中文版】《人工智能在指挥和控制系统中的决策支持》瑞典国防研究局

专知

33+阅读 · 2022年7月31日

DeepMind最新114页报告《多智能体强化学习中的新兴易货贸易行为》

DeepMind最新114页报告《多智能体强化学习中的新兴易货贸易行为》

专知

4+阅读 · 2022年7月16日

只需1次演示，1小时在线训练，机器人真就做到看一遍就会了

只需1次演示，1小时在线训练，机器人真就做到看一遍就会了

机器之心

1+阅读 · 2022年7月15日

【军事博弈论】在大规模战斗行动中为旅级作战部队制定有效的优先情报需求

【军事博弈论】在大规模战斗行动中为旅级作战部队制定有效的优先情报需求

专知

56+阅读 · 2022年6月9日

《人工智能在空战指挥与控制中的应用》中文版，美国空军大学空军指挥参谋学院

《人工智能在空战指挥与控制中的应用》中文版，美国空军大学空军指挥参谋学院

专知

102+阅读 · 2022年4月28日

美国海军研究生院《人工智能系统：国防应用的独特挑战》中文版（含16页PDF、23页讲解ppt）

美国海军研究生院《人工智能系统：国防应用的独特挑战》中文版（含16页PDF、23页讲解ppt）

专知

30+阅读 · 2022年4月19日

【AI+军事】《用于威胁评估的人工智能工具》加拿大国防研究和发展部技术报告，附中文版pdf

【AI+军事】《用于威胁评估的人工智能工具》加拿大国防研究和发展部技术报告，附中文版pdf

专知

89+阅读 · 2022年4月17日

DeepMind提出强化学习新方法，可实现人机合作

DeepMind提出强化学习新方法，可实现人机合作

AI前线

8+阅读 · 2021年12月13日

学界 | 伯克利、OpenAI等提出基于模型的元策略优化强化学习

学界 | 伯克利、OpenAI等提出基于模型的元策略优化强化学习

机器之心

15+阅读 · 2018年10月21日

关于强化学习（附代码，练习和解答）

关于强化学习（附代码，练习和解答）

深度学习

37+阅读 · 2018年1月30日

基于Markov博弈的计算机网络对抗行动策略分析与建模研究

国家自然科学基金

17+阅读 · 2013年12月31日

基于代理模型的实用多目标演化算法研究

国家自然科学基金

0+阅读 · 2013年12月31日

应急情景下民航管制员安全行为能力综合测评研究

国家自然科学基金

0+阅读 · 2013年12月31日

不确定环境下强化学习和决策的神经机制

国家自然科学基金

11+阅读 · 2012年12月31日

不确定环境下集装箱码头物流运作能力仿真建模与动态评估

国家自然科学基金

0+阅读 · 2011年12月31日

可变工作条件下复杂系统维修决策技术研究

国家自然科学基金

0+阅读 · 2009年12月31日

基于训练效果的部队作战效能评估及作战计划制订方法研究

国家自然科学基金

95+阅读 · 2009年12月31日

基于多智能体强化学习的多机器人系统研究

国家自然科学基金

48+阅读 · 2009年12月31日

基于动态分层与自学习的多智能体自适应协作模型

国家自然科学基金

17+阅读 · 2008年12月31日

仿驾驶员轨迹决策行为的无人驾驶车辆局部路径规划

国家自然科学基金

2+阅读 · 2008年12月31日

Model-Free Generative Replay for Lifelong Reinforcement Learning: Application to Starcraft-2

Arxiv

0+阅读 · 2022年8月16日

MACE: Multi-Agent Autonomous Collaborative Exploration of Unknown Environments

MACE: Multi-Agent Autonomous Collaborative Exploration of Unknown Environments

Arxiv

0+阅读 · 2022年8月16日

Combining Gradients and Probabilities for Heterogeneous Approximation of Neural Networks

Arxiv

0+阅读 · 2022年8月15日

Energy Savings When Migrating Workloads to the Cloud

Arxiv

0+阅读 · 2022年8月15日

Emergent Bartering Behaviour in Multi-Agent Reinforcement Learning

Emergent Bartering Behaviour in Multi-Agent Reinforcement Learning

Arxiv

19+阅读 · 2022年5月13日

Recent Advances in Reinforcement Learning in Finance

Arxiv

11+阅读 · 2021年12月8日

Multi-Agent Simulation for AI Behaviour Discovery in Operations Research

Arxiv

39+阅读 · 2021年8月30日

Optimization for deep learning: theory and algorithms

Optimization for deep learning: theory and algorithms

Arxiv

106+阅读 · 2019年12月19日

Multimodal Model-Agnostic Meta-Learning via Task-Aware Modulation

Multimodal Model-Agnostic Meta-Learning via Task-Aware Modulation

Arxiv

25+阅读 · 2019年10月30日

Learning Heuristics over Large Graphs via Deep Reinforcement Learning

Arxiv

12+阅读 · 2019年3月8日

VIP会员

相关主题

美国海军研究生院

相关VIP内容

美国空军大学《使用基于模型的强化学习进行团队空战》100页学位论文

美国空军大学《使用基于模型的强化学习进行团队空战》100页学位论文

专知会员服务

141+阅读 · 2022年7月15日

推荐！中文版《作战战略机动的多智能体协作强化学习研究综述》美国陆军研究实验室最新33页研究报告

推荐！中文版《作战战略机动的多智能体协作强化学习研究综述》美国陆军研究实验室最新33页研究报告

专知会员服务

307+阅读 · 2022年6月23日

《在兵棋推演和模拟中应用强化学习开发作战实体行为》美国海军陆战队、海军研究生院

《在兵棋推演和模拟中应用强化学习开发作战实体行为》美国海军陆战队、海军研究生院

专知会员服务

100+阅读 · 2022年6月16日

《敏捷、抗脆弱、以人工智能为基础的指挥和控制》万字长文，中文版，新南威尔士大学

《敏捷、抗脆弱、以人工智能为基础的指挥和控制》万字长文，中文版，新南威尔士大学

专知会员服务

77+阅读 · 2022年5月18日

《军事作战研究中的近似动态规划（强化学习）应用综述》加拿大国防研究与发展部、加拿大联合作战司令部

《军事作战研究中的近似动态规划（强化学习）应用综述》加拿大国防研究与发展部、加拿大联合作战司令部

专知会员服务

139+阅读 · 2022年5月17日

使用博弈论进行国防资源分配管理

使用博弈论进行国防资源分配管理

专知会员服务

84+阅读 · 2022年5月6日

【AI+军事】附论文+PPT 《用于战术分析、训练和优化的深度自我优化人工智能》

【AI+军事】附论文+PPT 《用于战术分析、训练和优化的深度自我优化人工智能》

专知会员服务

82+阅读 · 2022年4月17日

【AI+军事】14页ppt为讲解《混合作战兵棋推演》概念，美国海军研究生院

【AI+军事】14页ppt为讲解《混合作战兵棋推演》概念，美国海军研究生院

专知会员服务

142+阅读 · 2022年4月7日

捷克国防大学《作战环境联合情报准备在支持未来军事行动中的作用》最新论文

捷克国防大学《作战环境联合情报准备在支持未来军事行动中的作用》最新论文

专知会员服务

103+阅读 · 2022年4月6日

最新论文《战术网络的强化学习环境：基于多智能体的场景生成》德国弗劳恩霍夫研究所

最新论文《战术网络的强化学习环境：基于多智能体的场景生成》德国弗劳恩霍夫研究所

专知会员服务

146+阅读 · 2022年4月5日

热门VIP内容

开通专知VIP会员享更多权益服务

操作系统智能体：基于多模态大模型（MLLM）的通用计算设备智能体综述

《美国太空军系统全生命周期建模、仿真与分析效能提升方案》最新84页报告

【博士论文】推进数据高效的深度学习：非参数 Transformer、主动测试与上下文学习

自主人工智能：未来战争是否将是自主化的？

相关资讯

推荐！【中文版】《人工智能在指挥和控制系统中的决策支持》瑞典国防研究局

推荐！【中文版】《人工智能在指挥和控制系统中的决策支持》瑞典国防研究局

专知

33+阅读 · 2022年7月31日

DeepMind最新114页报告《多智能体强化学习中的新兴易货贸易行为》

DeepMind最新114页报告《多智能体强化学习中的新兴易货贸易行为》

专知

4+阅读 · 2022年7月16日

只需1次演示，1小时在线训练，机器人真就做到看一遍就会了

只需1次演示，1小时在线训练，机器人真就做到看一遍就会了

机器之心

1+阅读 · 2022年7月15日

【军事博弈论】在大规模战斗行动中为旅级作战部队制定有效的优先情报需求

【军事博弈论】在大规模战斗行动中为旅级作战部队制定有效的优先情报需求

专知

56+阅读 · 2022年6月9日

《人工智能在空战指挥与控制中的应用》中文版，美国空军大学空军指挥参谋学院

《人工智能在空战指挥与控制中的应用》中文版，美国空军大学空军指挥参谋学院

专知

102+阅读 · 2022年4月28日

美国海军研究生院《人工智能系统：国防应用的独特挑战》中文版（含16页PDF、23页讲解ppt）

美国海军研究生院《人工智能系统：国防应用的独特挑战》中文版（含16页PDF、23页讲解ppt）

专知

30+阅读 · 2022年4月19日

【AI+军事】《用于威胁评估的人工智能工具》加拿大国防研究和发展部技术报告，附中文版pdf

【AI+军事】《用于威胁评估的人工智能工具》加拿大国防研究和发展部技术报告，附中文版pdf

专知

89+阅读 · 2022年4月17日

DeepMind提出强化学习新方法，可实现人机合作

DeepMind提出强化学习新方法，可实现人机合作

AI前线

8+阅读 · 2021年12月13日

学界 | 伯克利、OpenAI等提出基于模型的元策略优化强化学习

学界 | 伯克利、OpenAI等提出基于模型的元策略优化强化学习

机器之心

15+阅读 · 2018年10月21日

关于强化学习（附代码，练习和解答）

关于强化学习（附代码，练习和解答）

深度学习

37+阅读 · 2018年1月30日

相关基金

基于Markov博弈的计算机网络对抗行动策略分析与建模研究

国家自然科学基金

17+阅读 · 2013年12月31日

基于代理模型的实用多目标演化算法研究

国家自然科学基金

0+阅读 · 2013年12月31日

应急情景下民航管制员安全行为能力综合测评研究

国家自然科学基金

0+阅读 · 2013年12月31日

不确定环境下强化学习和决策的神经机制

国家自然科学基金

11+阅读 · 2012年12月31日

不确定环境下集装箱码头物流运作能力仿真建模与动态评估

国家自然科学基金

0+阅读 · 2011年12月31日

可变工作条件下复杂系统维修决策技术研究

国家自然科学基金

0+阅读 · 2009年12月31日

基于训练效果的部队作战效能评估及作战计划制订方法研究

国家自然科学基金

95+阅读 · 2009年12月31日

基于多智能体强化学习的多机器人系统研究

国家自然科学基金

48+阅读 · 2009年12月31日

基于动态分层与自学习的多智能体自适应协作模型

国家自然科学基金

17+阅读 · 2008年12月31日

仿驾驶员轨迹决策行为的无人驾驶车辆局部路径规划

国家自然科学基金

2+阅读 · 2008年12月31日

相关论文

Model-Free Generative Replay for Lifelong Reinforcement Learning: Application to Starcraft-2

Arxiv

0+阅读 · 2022年8月16日

MACE: Multi-Agent Autonomous Collaborative Exploration of Unknown Environments

MACE: Multi-Agent Autonomous Collaborative Exploration of Unknown Environments

Arxiv

0+阅读 · 2022年8月16日

Combining Gradients and Probabilities for Heterogeneous Approximation of Neural Networks

Arxiv

0+阅读 · 2022年8月15日

Energy Savings When Migrating Workloads to the Cloud

Arxiv

0+阅读 · 2022年8月15日

Emergent Bartering Behaviour in Multi-Agent Reinforcement Learning

Emergent Bartering Behaviour in Multi-Agent Reinforcement Learning

Arxiv

19+阅读 · 2022年5月13日

Recent Advances in Reinforcement Learning in Finance

Arxiv

11+阅读 · 2021年12月8日

Multi-Agent Simulation for AI Behaviour Discovery in Operations Research

Arxiv

39+阅读 · 2021年8月30日

Optimization for deep learning: theory and algorithms

Optimization for deep learning: theory and algorithms

Arxiv

106+阅读 · 2019年12月19日

Multimodal Model-Agnostic Meta-Learning via Task-Aware Modulation

Multimodal Model-Agnostic Meta-Learning via Task-Aware Modulation

Arxiv

25+阅读 · 2019年10月30日

Learning Heuristics over Large Graphs via Deep Reinforcement Learning

Arxiv

12+阅读 · 2019年3月8日

微信扫码咨询专知VIP会员