在战斗模拟领域,由于此类环境的动态性和复杂性,深度强化学习(RL)智能体的训练和部署仍面临巨大挑战。不幸的是,随着场景和可用信息复杂性的增加,达到一定性能阈值所需的训练时间不仅会增加,而且往往会呈指数级增长。这种关系凸显了复杂性对训练 RL 智能体的深远影响。本文介绍了一种新颖的方法,可以解决使用 RL 训练AI智能体的这一局限性。由于现实世界的计算限制和已知的 RL 样本低效难题,传统的 RL 方法在这些高维动态环境中已被证明难以奏效。为了克服这些限制,我们提出了一种利用片断线性空间衰减进行局部观测抽象的方法。这种技术简化了状态空间,降低了计算需求,同时还保留了基本信息,从而在空间关系往往至关重要的动态环境中提高了人工智能训练效率。分析表明,在场景复杂度不断增加的情况下,这种局部观测方法始终优于传统的全局观测方法。本文推进了对 RL 观察抽象的研究,说明了局部观察与片断线性空间衰减如何为动态环境中的大型状态表示挑战提供有效的解决方案。

成为VIP会员查看完整内容
28

相关内容

人工智能在军事中可用于多项任务,例如目标识别、大数据处理、作战系统、网络安全、后勤运输、战争医疗、威胁和安全监测以及战斗模拟和训练。
《生成式人工智能和情报评估》
专知会员服务
72+阅读 · 7月22日
《在兵棋推演的战斗模拟中扩展智能体》
专知会员服务
81+阅读 · 4月17日
《基于开源软件强化学习的计算机生成兵力》
专知会员服务
67+阅读 · 1月21日
《用于空战机动的分层多智能体强化学习》
专知会员服务
58+阅读 · 2023年10月5日
《超视距空战中计算机生成兵力的行为建模》
专知会员服务
84+阅读 · 2023年7月10日
「基于通信的多智能体强化学习」 进展综述
基于模型的强化学习综述
专知
33+阅读 · 2022年7月13日
机器学习必备手册
机器学习研究会
19+阅读 · 2017年10月24日
国家自然科学基金
41+阅读 · 2015年12月31日
国家自然科学基金
9+阅读 · 2015年12月31日
国家自然科学基金
4+阅读 · 2015年12月31日
国家自然科学基金
2+阅读 · 2015年12月31日
国家自然科学基金
0+阅读 · 2015年12月31日
国家自然科学基金
38+阅读 · 2015年12月31日
国家自然科学基金
12+阅读 · 2015年12月31日
国家自然科学基金
10+阅读 · 2013年12月31日
国家自然科学基金
15+阅读 · 2013年12月31日
Arxiv
158+阅读 · 2023年4月20日
A Survey of Large Language Models
Arxiv
408+阅读 · 2023年3月31日
Arxiv
68+阅读 · 2023年3月26日
Arxiv
147+阅读 · 2023年3月24日
Arxiv
21+阅读 · 2023年3月17日
VIP会员
相关VIP内容
《生成式人工智能和情报评估》
专知会员服务
72+阅读 · 7月22日
《在兵棋推演的战斗模拟中扩展智能体》
专知会员服务
81+阅读 · 4月17日
《基于开源软件强化学习的计算机生成兵力》
专知会员服务
67+阅读 · 1月21日
《用于空战机动的分层多智能体强化学习》
专知会员服务
58+阅读 · 2023年10月5日
《超视距空战中计算机生成兵力的行为建模》
专知会员服务
84+阅读 · 2023年7月10日
相关基金
国家自然科学基金
41+阅读 · 2015年12月31日
国家自然科学基金
9+阅读 · 2015年12月31日
国家自然科学基金
4+阅读 · 2015年12月31日
国家自然科学基金
2+阅读 · 2015年12月31日
国家自然科学基金
0+阅读 · 2015年12月31日
国家自然科学基金
38+阅读 · 2015年12月31日
国家自然科学基金
12+阅读 · 2015年12月31日
国家自然科学基金
10+阅读 · 2013年12月31日
国家自然科学基金
15+阅读 · 2013年12月31日
微信扫码咨询专知VIP会员