在战斗模拟领域,由于此类环境的动态性和复杂性,深度强化学习(RL)智能体的训练和部署仍面临巨大挑战。不幸的是,随着场景和可用信息复杂性的增加,达到一定性能阈值所需的训练时间不仅会增加,而且往往会呈指数级增长。这种关系凸显了复杂性对训练 RL 智能体的深远影响。本文介绍了一种新颖的方法,可以解决使用 RL 训练AI智能体的这一局限性。由于现实世界的计算限制和已知的 RL 样本低效难题,传统的 RL 方法在这些高维动态环境中已被证明难以奏效。为了克服这些限制,我们提出了一种利用片断线性空间衰减进行局部观测抽象的方法。这种技术简化了状态空间,降低了计算需求,同时还保留了基本信息,从而在空间关系往往至关重要的动态环境中提高了人工智能训练效率。分析表明,在场景复杂度不断增加的情况下,这种局部观测方法始终优于传统的全局观测方法。本文推进了对 RL 观察抽象的研究,说明了局部观察与片断线性空间衰减如何为动态环境中的大型状态表示挑战提供有效的解决方案。