强化学习在最近的学术和商业研究项目中的应用已经产生了能够达到或超过人类性能水平的强大系统。本论文的目的是确定通过强化学习训练的智能体是否能够在小型战斗场景中实现最佳性能。在一组计算实验中,训练是在一个简单的总体层面上进行的,模拟能够实现确定性和随机性的战斗模型,神经网络的性能被验证为质量和武力经济性战术原则。总的来说,神经网络能够学习到理想的行为,其中作战模型和强化学习算法对性能的影响最为显著。此外,在集结是最佳战术的情况下,训练时间和学习率被确定为最重要的训练超参数。然而,当武力的经济性是理想的时候,折扣系数是唯一有重大影响的超参数。综上所述,本论文得出结论,强化学习为发展战斗模拟中的智能行为提供了一种有前途的手段,它可以应用于训练或分析领域。建议未来的研究对更大、更复杂的训练场景进行研究,以充分了解强化学习的能力和局限性。

成为VIP会员查看完整内容
91

相关内容

人工智能在军事中可用于多项任务,例如目标识别、大数据处理、作战系统、网络安全、后勤运输、战争医疗、威胁和安全监测以及战斗模拟和训练。
使用博弈论进行国防资源分配管理
专知会员服务
80+阅读 · 2022年5月6日
DeepMind提出强化学习新方法,可实现人机合作
关于强化学习(附代码,练习和解答)
深度学习
37+阅读 · 2018年1月30日
国家自然科学基金
15+阅读 · 2013年12月31日
国家自然科学基金
0+阅读 · 2013年12月31日
国家自然科学基金
0+阅读 · 2013年12月31日
国家自然科学基金
10+阅读 · 2012年12月31日
国家自然科学基金
0+阅读 · 2011年12月31日
国家自然科学基金
0+阅读 · 2009年12月31日
国家自然科学基金
94+阅读 · 2009年12月31日
国家自然科学基金
47+阅读 · 2009年12月31日
国家自然科学基金
17+阅读 · 2008年12月31日
国家自然科学基金
2+阅读 · 2008年12月31日
Arxiv
0+阅读 · 2022年8月15日
Arxiv
11+阅读 · 2021年12月8日
Optimization for deep learning: theory and algorithms
Arxiv
105+阅读 · 2019年12月19日
VIP会员
相关VIP内容
使用博弈论进行国防资源分配管理
专知会员服务
80+阅读 · 2022年5月6日
相关基金
国家自然科学基金
15+阅读 · 2013年12月31日
国家自然科学基金
0+阅读 · 2013年12月31日
国家自然科学基金
0+阅读 · 2013年12月31日
国家自然科学基金
10+阅读 · 2012年12月31日
国家自然科学基金
0+阅读 · 2011年12月31日
国家自然科学基金
0+阅读 · 2009年12月31日
国家自然科学基金
94+阅读 · 2009年12月31日
国家自然科学基金
47+阅读 · 2009年12月31日
国家自然科学基金
17+阅读 · 2008年12月31日
国家自然科学基金
2+阅读 · 2008年12月31日
微信扫码咨询专知VIP会员