对抗环境下的智能兵棋系统设计及其关键技术 - 专知VIP

会员服务 ·

28

AI与军事 · 智能博弈 · 智能兵棋 · 强化学习 ·

2024 年 5 月 31 日

对抗环境下的智能兵棋系统设计及其关键技术

专知会员服务

专知，提供专业可信的知识分发服务，让认知协作更快更好！

智能博弈对抗领域已成为当前研究的热门领域之一。侧重在兵棋推演系统的体系构建和模块设计，分析了兵棋推演系统的建模要素，包括兵棋要素、兵棋规则及智能接口设计，构建了智能兵棋推演系统的整体架构。通过 A3C 强化学习智能算法对系统设计进行可行性验证。其中，改进了强化学习训练过程的奖励设置，明确智能兵棋环境的状态输入、算法驱动过程及动作输出过程，通过自主实现的智能兵棋推演系统，验证了所提的系统理论与工作。该工作为基于强化学习的智能博弈系统的设计与实现提供了可行路径，并为以后基于强化学习的智能博弈对抗研究提供了基础平台。

近年来人工智能技术突飞猛进，尤其在智能博弈对抗领域取得了一系列的关键进展。2016 年，AlphaGo 与李胜石进行了一场万众瞩目的围棋大战，最终人工智能 AlphaGo 以 4∶1 的结果完胜人类，一时间掀起了社会上的广泛热议，推动了人工智能技术的又一次发展浪潮［ 1-2］。随后，AlphaGo 的研制团队 DeepMind 趁热打铁，在《星际争霸》游戏上进一步取得明显突破，研制成功 AlphaStar［3］。中国腾讯 AI Lab 利用深度强化学习技术，在《王者荣耀》游戏虚拟环境中构建“觉悟 AI”，开发高扩展、低耦合的强化训练系统，使得“觉悟 AI”能够具有进攻、诱导、防御、欺骗和技能连续释放的能力［ 4］。智能博弈系统虽然取得了显著成就，但是依然有很多问题亟待进一步研究。虽然人工智能的概念早在 1956 年就被提出，但是由于计算机性能的不足以及理论基础的缺失，人工智能还远远没有达到可以挑战人类思维的地步［5］。随着对于智能化研究的逐渐深入，各种算法的实现以及在围棋上 AlphaGo 的出现［6-7］，对智能博弈系统进行智能化研究已经是一种趋势。智能辅助决策是制约智能博弈系统升级换代的瓶颈问题，是一个不容忽视甚至是需要争分夺秒去解决的问题。由于智能博弈系统特点，深度学习和强化学习的算法效果依然有很大的提升空间。这里以最经典的博弈系统“兵棋推演”为例，简述基于强化学习的智能博弈系统的构建思路及仿真验证。本研究设计的算法模型为设计适用于复杂环境的智能兵棋系统提供了思路：建立智能兵棋系统通用的体系架构，并针对每个模块进行功能解释。针对智能兵棋系统的核心模块，建立智能决策算法模型，通过典型实验环境来验证建模思路。其中，智能决策模型以 A3C 算法为代表的强化学习驱动，进而从原理和实践上，验证了智能决策算法模型在智能兵棋推演系统的可行性。

成为VIP会员查看完整内容

50

相关内容

AI与军事

人工智能在军事中可用于多项任务，例如目标识别、大数据处理、作战系统、网络安全、后勤运输、战争医疗、威胁和安全监测以及战斗模拟和训练。

基于博弈论的弹目攻防决策方法研究

基于博弈论的弹目攻防决策方法研究

专知会员服务

49+阅读 · 2024年7月11日

智能博弈决策大模型智能体技术综述

智能博弈决策大模型智能体技术综述

专知会员服务

113+阅读 · 2024年6月29日

无人集群体系设计与仿真评估方法

无人集群体系设计与仿真评估方法

专知会员服务

99+阅读 · 2024年6月22日

任务级兵棋智能决策技术框架设计与关键问题分析

任务级兵棋智能决策技术框架设计与关键问题分析

专知会员服务

63+阅读 · 2024年5月13日

海空跨域协同兵棋AI架构设计及关键技术分析

海空跨域协同兵棋AI架构设计及关键技术分析

专知会员服务

55+阅读 · 2024年4月10日

引入反事实基线的无人机集群对抗博弈方法

引入反事实基线的无人机集群对抗博弈方法

专知会员服务

64+阅读 · 2024年3月13日

下一代战略博弈推演系统研究

下一代战略博弈推演系统研究

专知会员服务

109+阅读 · 2024年1月27日

无人集群博弈对抗系统仿真验证及决策关键技术综述

无人集群博弈对抗系统仿真验证及决策关键技术综述

专知会员服务

113+阅读 · 2023年11月23日

基于图神经网络GraphVAE的兵棋态势预测方法

基于图神经网络GraphVAE的兵棋态势预测方法

专知会员服务

84+阅读 · 2023年11月11日

知识与数据互补的战术级兵棋行为决策框架设计与实现

知识与数据互补的战术级兵棋行为决策框架设计与实现

专知会员服务

105+阅读 · 2023年5月30日

无人预警机系统架构及关键技术分析

无人预警机系统架构及关键技术分析

专知

13+阅读 · 2022年8月6日

基于模型的强化学习综述

基于模型的强化学习综述

专知

42+阅读 · 2022年7月13日

兵棋推演的智能决策技术与挑战

兵棋推演的智能决策技术与挑战

专知

27+阅读 · 2022年7月5日

【AI与军事】机器学习的军事应用，一种文献计量视角

【AI与军事】机器学习的军事应用，一种文献计量视角

专知

52+阅读 · 2022年4月25日

基于知识图谱的问答系统

基于知识图谱的问答系统

PaperWeekly

21+阅读 · 2021年2月8日

Distributional Soft Actor-Critic (DSAC)强化学习算法的设计与验证

Distributional Soft Actor-Critic (DSAC)强化学习算法的设计与验证

深度强化学习实验室

18+阅读 · 2020年8月11日

自动驾驶汽车技术路线简介

自动驾驶汽车技术路线简介

智能交通技术

15+阅读 · 2019年4月25日

自动驾驶车载激光雷达技术现状分析

自动驾驶车载激光雷达技术现状分析

智能交通技术

17+阅读 · 2019年4月9日

边缘计算应用：传感数据异常实时检测算法

边缘计算应用：传感数据异常实时检测算法

计算机研究与发展

11+阅读 · 2018年4月10日

雷达海面目标识别技术研究进展

雷达海面目标识别技术研究进展

科技导报

21+阅读 · 2017年11月13日

网络化非线性系统的协调控制及其在分布式可重构航天器中的应用

国家自然科学基金

0+阅读 · 2015年12月31日

基于演化博弈的多智能体环形编队的理论与实验研究

国家自然科学基金

23+阅读 · 2015年12月31日

基于大数据的运载火箭总装系统智能优化调度理论与方法

国家自然科学基金

0+阅读 · 2015年12月31日

面向空间自组网的低功耗理论与技术研究

国家自然科学基金

0+阅读 · 2015年12月31日

多元质量特性下兵器装备协同研制能力网络形成与动态演化机理

国家自然科学基金

2+阅读 · 2015年12月31日

面向主体行为网的自适应作战机理研究

国家自然科学基金

24+阅读 · 2014年12月31日

基于神经网络和强化学习的车辆装配系统中的多载量小车实时调度方法

国家自然科学基金

4+阅读 · 2014年12月31日

过程感知信息系统的跨组织业务过程建模与分析研究

国家自然科学基金

0+阅读 · 2014年12月31日

基于Markov博弈的计算机网络对抗行动策略分析与建模研究

国家自然科学基金

17+阅读 · 2013年12月31日

网络化环境下面向态势感知的多无人机协同控制与管理方法

国家自然科学基金

24+阅读 · 2011年12月31日

Is ChatGPT a Good Recommender? A Preliminary Study

Arxiv

171+阅读 · 2023年4月20日

NeuralField-LDM: Scene Generation with Hierarchical Latent Diffusion Models

Arxiv

42+阅读 · 2023年4月19日

On Efficient Training of Large-Scale Deep Learning Models: A Literature Review

Arxiv

216+阅读 · 2023年4月7日

A Survey of Large Language Models

A Survey of Large Language Models

Arxiv

476+阅读 · 2023年3月31日

Unleashing the Power of Edge-Cloud Generative AI in Mobile Networks: A Survey of AIGC Services

Arxiv

147+阅读 · 2023年3月29日

Nature Language Reasoning, A Survey

Arxiv

78+阅读 · 2023年3月26日

Knowledge Graphs: Opportunities and Challenges

Arxiv

173+阅读 · 2023年3月24日

Sparks of Artificial General Intelligence: Early experiments with GPT-4

Arxiv

51+阅读 · 2023年3月22日

Data-centric Artificial Intelligence: A Survey

Arxiv

24+阅读 · 2023年3月17日

A survey and taxonomy of loss functions in machine learning

Arxiv

26+阅读 · 2023年1月13日

VIP会员

相关主题

相关VIP内容

基于博弈论的弹目攻防决策方法研究

基于博弈论的弹目攻防决策方法研究

专知会员服务

49+阅读 · 2024年7月11日

智能博弈决策大模型智能体技术综述

智能博弈决策大模型智能体技术综述

专知会员服务

113+阅读 · 2024年6月29日

无人集群体系设计与仿真评估方法

无人集群体系设计与仿真评估方法

专知会员服务

99+阅读 · 2024年6月22日

任务级兵棋智能决策技术框架设计与关键问题分析

任务级兵棋智能决策技术框架设计与关键问题分析

专知会员服务

63+阅读 · 2024年5月13日

海空跨域协同兵棋AI架构设计及关键技术分析

海空跨域协同兵棋AI架构设计及关键技术分析

专知会员服务

55+阅读 · 2024年4月10日

引入反事实基线的无人机集群对抗博弈方法

引入反事实基线的无人机集群对抗博弈方法

专知会员服务

64+阅读 · 2024年3月13日

下一代战略博弈推演系统研究

下一代战略博弈推演系统研究

专知会员服务

109+阅读 · 2024年1月27日

无人集群博弈对抗系统仿真验证及决策关键技术综述

无人集群博弈对抗系统仿真验证及决策关键技术综述

专知会员服务

113+阅读 · 2023年11月23日

基于图神经网络GraphVAE的兵棋态势预测方法

基于图神经网络GraphVAE的兵棋态势预测方法

专知会员服务

84+阅读 · 2023年11月11日

知识与数据互补的战术级兵棋行为决策框架设计与实现

知识与数据互补的战术级兵棋行为决策框架设计与实现

专知会员服务

105+阅读 · 2023年5月30日

热门VIP内容

开通专知VIP会员享更多权益服务

【CMU博士论文】数据驱动决策中的激励、信息与不确定性

DGP双粒度提示框架：图增强大模型助力欺诈检测

【ICCV2025】ESSENTIAL：用于视频类增量学习的情景记忆与语义记忆整合

唯快不破：大型语言模型高效架构综述

相关资讯

无人预警机系统架构及关键技术分析

无人预警机系统架构及关键技术分析

专知

13+阅读 · 2022年8月6日

基于模型的强化学习综述

基于模型的强化学习综述

专知

42+阅读 · 2022年7月13日

兵棋推演的智能决策技术与挑战

兵棋推演的智能决策技术与挑战

专知

27+阅读 · 2022年7月5日

【AI与军事】机器学习的军事应用，一种文献计量视角

【AI与军事】机器学习的军事应用，一种文献计量视角

专知

52+阅读 · 2022年4月25日

基于知识图谱的问答系统

基于知识图谱的问答系统

PaperWeekly

21+阅读 · 2021年2月8日

Distributional Soft Actor-Critic (DSAC)强化学习算法的设计与验证

Distributional Soft Actor-Critic (DSAC)强化学习算法的设计与验证

深度强化学习实验室

18+阅读 · 2020年8月11日

自动驾驶汽车技术路线简介

自动驾驶汽车技术路线简介

智能交通技术

15+阅读 · 2019年4月25日

自动驾驶车载激光雷达技术现状分析

自动驾驶车载激光雷达技术现状分析

智能交通技术

17+阅读 · 2019年4月9日

边缘计算应用：传感数据异常实时检测算法

边缘计算应用：传感数据异常实时检测算法

计算机研究与发展

11+阅读 · 2018年4月10日

雷达海面目标识别技术研究进展

雷达海面目标识别技术研究进展

科技导报

21+阅读 · 2017年11月13日

相关基金

网络化非线性系统的协调控制及其在分布式可重构航天器中的应用

国家自然科学基金

0+阅读 · 2015年12月31日

基于演化博弈的多智能体环形编队的理论与实验研究

国家自然科学基金

23+阅读 · 2015年12月31日

基于大数据的运载火箭总装系统智能优化调度理论与方法

国家自然科学基金

0+阅读 · 2015年12月31日

面向空间自组网的低功耗理论与技术研究

国家自然科学基金

0+阅读 · 2015年12月31日

多元质量特性下兵器装备协同研制能力网络形成与动态演化机理

国家自然科学基金

2+阅读 · 2015年12月31日

面向主体行为网的自适应作战机理研究

国家自然科学基金

24+阅读 · 2014年12月31日

基于神经网络和强化学习的车辆装配系统中的多载量小车实时调度方法

国家自然科学基金

4+阅读 · 2014年12月31日

过程感知信息系统的跨组织业务过程建模与分析研究

国家自然科学基金

0+阅读 · 2014年12月31日

基于Markov博弈的计算机网络对抗行动策略分析与建模研究

国家自然科学基金

17+阅读 · 2013年12月31日

网络化环境下面向态势感知的多无人机协同控制与管理方法

国家自然科学基金

24+阅读 · 2011年12月31日

相关论文

Is ChatGPT a Good Recommender? A Preliminary Study

Arxiv

171+阅读 · 2023年4月20日

NeuralField-LDM: Scene Generation with Hierarchical Latent Diffusion Models

Arxiv

42+阅读 · 2023年4月19日

On Efficient Training of Large-Scale Deep Learning Models: A Literature Review

Arxiv

216+阅读 · 2023年4月7日

A Survey of Large Language Models

A Survey of Large Language Models

Arxiv

476+阅读 · 2023年3月31日

Unleashing the Power of Edge-Cloud Generative AI in Mobile Networks: A Survey of AIGC Services

Arxiv

147+阅读 · 2023年3月29日

Nature Language Reasoning, A Survey

Arxiv

78+阅读 · 2023年3月26日

Knowledge Graphs: Opportunities and Challenges

Arxiv

173+阅读 · 2023年3月24日

Sparks of Artificial General Intelligence: Early experiments with GPT-4

Arxiv

51+阅读 · 2023年3月22日

Data-centric Artificial Intelligence: A Survey

Arxiv

24+阅读 · 2023年3月17日

A survey and taxonomy of loss functions in machine learning

Arxiv

26+阅读 · 2023年1月13日

微信扫码咨询专知VIP会员