本文介绍了一种通过整合领域知识和基于注意力的策略机制来增强多智能体强化学习(MARL)的替代方法。方法侧重于将特定领域的专业知识融入学习过程,从而简化协作行为的开发。这种方法旨在通过使智能体专注于复杂任务的重要方面,从而优化学习曲线,降低与 MARL 相关的复杂性和学习开销。在我们的模型中,注意力机制的利用起到了关键作用。它可以有效处理动态上下文数据和智能体之间细微的互动,从而做出更精细的决策。在斯坦福智能系统实验室(SISL)“追逐 ”和 “多粒子环境”(MPE)“简单扩展 ”等标准 MARL 场景中的应用表明,我们的方法既能提高学习效率,又能提高协作行为的有效性。结果表明,我们基于注意力的方法可以在行动层面整合特定领域的知识,是提高 MARL 训练过程效率的可行方法。

成为VIP会员查看完整内容
50

相关内容

人工智能在军事中可用于多项任务,例如目标识别、大数据处理、作战系统、网络安全、后勤运输、战争医疗、威胁和安全监测以及战斗模拟和训练。
《解码人工智能的结构性风险动态》
专知会员服务
33+阅读 · 7月13日
《重新思考战斗人工智能和人类监督》
专知会员服务
73+阅读 · 5月5日
《生成式人工智能模型:机遇与风险》
专知会员服务
72+阅读 · 4月22日
《深度学习: 整合领域知识,解读网络决策》
专知会员服务
36+阅读 · 1月9日
《人工智能对战略和业务决策的影响》
专知会员服务
56+阅读 · 2023年12月17日
《通过自适应蜂群智能实现认知物联网系统》
专知会员服务
41+阅读 · 2023年10月29日
《应对人工智能系统测试和评估新挑战的最佳实践》
专知会员服务
79+阅读 · 2023年8月7日
【2022新书】深度学习归一化技术,117页pdf
专知
24+阅读 · 2022年11月25日
【干货书】优化算法,232页pdf
专知
25+阅读 · 2022年9月8日
基于模型的强化学习综述
专知
33+阅读 · 2022年7月13日
国家自然科学基金
25+阅读 · 2015年12月31日
国家自然科学基金
10+阅读 · 2015年12月31日
国家自然科学基金
0+阅读 · 2015年12月31日
国家自然科学基金
38+阅读 · 2015年12月31日
国家自然科学基金
12+阅读 · 2015年12月31日
国家自然科学基金
4+阅读 · 2015年12月31日
国家自然科学基金
0+阅读 · 2014年12月31日
国家自然科学基金
15+阅读 · 2013年12月31日
国家自然科学基金
18+阅读 · 2012年12月31日
国家自然科学基金
15+阅读 · 2008年12月31日
Arxiv
158+阅读 · 2023年4月20日
A Survey of Large Language Models
Arxiv
408+阅读 · 2023年3月31日
Arxiv
68+阅读 · 2023年3月26日
Arxiv
148+阅读 · 2023年3月24日
Arxiv
21+阅读 · 2023年3月17日
VIP会员
相关VIP内容
相关基金
国家自然科学基金
25+阅读 · 2015年12月31日
国家自然科学基金
10+阅读 · 2015年12月31日
国家自然科学基金
0+阅读 · 2015年12月31日
国家自然科学基金
38+阅读 · 2015年12月31日
国家自然科学基金
12+阅读 · 2015年12月31日
国家自然科学基金
4+阅读 · 2015年12月31日
国家自然科学基金
0+阅读 · 2014年12月31日
国家自然科学基金
15+阅读 · 2013年12月31日
国家自然科学基金
18+阅读 · 2012年12月31日
国家自然科学基金
15+阅读 · 2008年12月31日
微信扫码咨询专知VIP会员