尽管多智能体深度强化学习(MADRL)在解决复杂的现实世界问题方面表现出了很好的效果,但MADRL模型的适用性和可靠性往往由于缺乏对其内部工作原理的理解而受到限制,无法解释所做的决定。为了解决这个问题,本文提出了一种解释MADRL的新方法,即利用空间-时间神经网络模型将智能体执行的行动事件序列概括为高级抽象策略。具体来说,开发了一个基于区间的记忆检索程序,将编码的行动事件序列随时间推移概括为短的顺序模式。此外,还引入了两种抽象算法,一种用于抽象跨越多个智能体的行动事件,另一种用于将随时间变化的事件进一步抽象为短的顺序模式,然后可以将其转化为符号形式进行解释。我们使用 "星际争霸多智能体挑战"(SMAC)基准任务来评估所提出的方法,这表明该方法能够在不同的粒度水平上得出MADRL模型的高级解释。

成为VIP会员查看完整内容
28

相关内容

【AAAI2023】基于序图的因果结构强化学习
专知会员服务
23+阅读 · 2022年11月25日
【NeurIPS 2022】子等变图神经网络学习物理动态
专知会员服务
16+阅读 · 2022年11月16日
【ICML2022】药物结合结构预测的几何深度学习
专知会员服务
25+阅读 · 2022年5月24日
AAAI 2022 | ProtGNN:自解释图神经网络
专知会员服务
39+阅读 · 2022年2月28日
【AAAI 2022】 GeomGCL:用于分子性质预测的几何图对比学习
专知会员服务
23+阅读 · 2022年2月27日
专知会员服务
141+阅读 · 2021年8月12日
专知会员服务
40+阅读 · 2021年2月12日
【AAAI2023】基于序图的因果结构强化学习
专知
4+阅读 · 2022年11月25日
综述 | 分布式GNN训练算法和系统,35页pdf
图与推荐
4+阅读 · 2022年11月2日
国家自然科学基金
0+阅读 · 2017年12月31日
国家自然科学基金
2+阅读 · 2015年12月31日
国家自然科学基金
36+阅读 · 2015年12月31日
国家自然科学基金
7+阅读 · 2015年12月31日
国家自然科学基金
1+阅读 · 2015年12月31日
国家自然科学基金
5+阅读 · 2015年12月31日
国家自然科学基金
2+阅读 · 2015年12月31日
国家自然科学基金
40+阅读 · 2014年12月31日
国家自然科学基金
1+阅读 · 2014年12月31日
国家自然科学基金
0+阅读 · 2014年12月31日
A Survey of Large Language Models
Arxiv
392+阅读 · 2023年3月31日
VIP会员
相关VIP内容
【AAAI2023】基于序图的因果结构强化学习
专知会员服务
23+阅读 · 2022年11月25日
【NeurIPS 2022】子等变图神经网络学习物理动态
专知会员服务
16+阅读 · 2022年11月16日
【ICML2022】药物结合结构预测的几何深度学习
专知会员服务
25+阅读 · 2022年5月24日
AAAI 2022 | ProtGNN:自解释图神经网络
专知会员服务
39+阅读 · 2022年2月28日
【AAAI 2022】 GeomGCL:用于分子性质预测的几何图对比学习
专知会员服务
23+阅读 · 2022年2月27日
专知会员服务
141+阅读 · 2021年8月12日
专知会员服务
40+阅读 · 2021年2月12日
相关基金
国家自然科学基金
0+阅读 · 2017年12月31日
国家自然科学基金
2+阅读 · 2015年12月31日
国家自然科学基金
36+阅读 · 2015年12月31日
国家自然科学基金
7+阅读 · 2015年12月31日
国家自然科学基金
1+阅读 · 2015年12月31日
国家自然科学基金
5+阅读 · 2015年12月31日
国家自然科学基金
2+阅读 · 2015年12月31日
国家自然科学基金
40+阅读 · 2014年12月31日
国家自然科学基金
1+阅读 · 2014年12月31日
国家自然科学基金
0+阅读 · 2014年12月31日
微信扫码咨询专知VIP会员