《多智能体深度强化学习模型中动作序列的解释》AAMAS 2023 - 专知VIP

会员服务 ·

13

多智能体 · 深度强化学习 · 可解释性 · AI与军事 · AAMAS 2023 ·

2023 年 6 月 18 日

《多智能体深度强化学习模型中动作序列的解释》AAMAS 2023

专知会员服务

专知，提供专业可信的知识分发服务，让认知协作更快更好！

尽管多智能体深度强化学习（MADRL）在解决复杂的现实世界问题方面表现出了很好的效果，但MADRL模型的适用性和可靠性往往由于缺乏对其内部工作原理的理解而受到限制，无法解释所做的决定。为了解决这个问题，本文提出了一种解释MADRL的新方法，即利用空间-时间神经网络模型将智能体执行的行动事件序列概括为高级抽象策略。具体来说，开发了一个基于区间的记忆检索程序，将编码的行动事件序列随时间推移概括为短的顺序模式。此外，还引入了两种抽象算法，一种用于抽象跨越多个智能体的行动事件，另一种用于将随时间变化的事件进一步抽象为短的顺序模式，然后可以将其转化为符号形式进行解释。我们使用 "星际争霸多智能体挑战"（SMAC）基准任务来评估所提出的方法，这表明该方法能够在不同的粒度水平上得出MADRL模型的高级解释。

成为VIP会员查看完整内容

30

相关内容

多智能体

【KAUST博士论文】面向3D理解的鲁棒深度学习模型设计，190页pdf

【KAUST博士论文】面向3D理解的鲁棒深度学习模型设计，190页pdf

专知会员服务

31+阅读 · 2023年4月27日

51页《基于Transformer的多模态与自监督学习》最新报告，Google Xiaohua Zhai

51页《基于Transformer的多模态与自监督学习》最新报告，Google Xiaohua Zhai

专知会员服务

68+阅读 · 2023年2月24日

《因果ABM：基于智能体的建模以学习可靠因果模型》2022美国南佛罗里达大学等26页论文

《因果ABM：基于智能体的建模以学习可靠因果模型》2022美国南佛罗里达大学等26页论文

专知会员服务

46+阅读 · 2023年1月5日

【AAAI2023】基于序图的因果结构强化学习

【AAAI2023】基于序图的因果结构强化学习

专知会员服务

24+阅读 · 2022年11月25日

【NeurIPS 2022】子等变图神经网络学习物理动态

【NeurIPS 2022】子等变图神经网络学习物理动态

专知会员服务

17+阅读 · 2022年11月16日

【ICML2022】药物结合结构预测的几何深度学习

【ICML2022】药物结合结构预测的几何深度学习

专知会员服务

26+阅读 · 2022年5月24日

AAAI 2022 | ProtGNN：自解释图神经网络

AAAI 2022 | ProtGNN：自解释图神经网络

专知会员服务

40+阅读 · 2022年2月28日

【AAAI 2022】 GeomGCL:用于分子性质预测的几何图对比学习

【AAAI 2022】 GeomGCL:用于分子性质预测的几何图对比学习

专知会员服务

24+阅读 · 2022年2月27日

【硬核书】机器学习随机矩阵理论，472页pdf

专知会员服务

147+阅读 · 2021年8月12日

AAAI 2021 | 稀疏胜负多智能体博弈中的纳什均衡解计算

专知会员服务

41+阅读 · 2021年2月12日

【AAAI2023】基于序图的因果结构强化学习

【AAAI2023】基于序图的因果结构强化学习

专知

5+阅读 · 2022年11月25日

【NeurIPS 2022】子等变图神经网络学习物理动态

【NeurIPS 2022】子等变图神经网络学习物理动态

专知

1+阅读 · 2022年11月16日

综述 | 分布式GNN训练算法和系统，35页pdf

综述 | 分布式GNN训练算法和系统，35页pdf

图与推荐

5+阅读 · 2022年11月2日

【2022新书】算法高维鲁棒统计，296页pdf与98页ppt

【2022新书】算法高维鲁棒统计，296页pdf与98页ppt

专知

4+阅读 · 2022年10月21日

【NeurIPS2022】通过模型转换的可解释强化学习

【NeurIPS2022】通过模型转换的可解释强化学习

专知

1+阅读 · 2022年10月4日

【MIT博士论文】实用机器学习的高效鲁棒算法，142页pdf

【MIT博士论文】实用机器学习的高效鲁棒算法，142页pdf

专知

5+阅读 · 2022年9月7日

《知识表示工具在感知支持系统中的应用》加拿大国防研究与发展部（DRDC）

《知识表示工具在感知支持系统中的应用》加拿大国防研究与发展部（DRDC）

专知

6+阅读 · 2022年8月27日

【2022新书】机器学习中的概率数值计算，412页pdf

【2022新书】机器学习中的概率数值计算，412页pdf

专知

31+阅读 · 2022年7月7日

元迁移学习的小样本学习，Meta-transfer Learning for Few-shot Learning，33页ppt

元迁移学习的小样本学习，Meta-transfer Learning for Few-shot Learning，33页ppt

专知

71+阅读 · 2020年2月29日

论文浅尝 | 当知识图谱遇上零样本学习——零样本学习综述

论文浅尝 | 当知识图谱遇上零样本学习——零样本学习综述

开放知识图谱

20+阅读 · 2018年9月26日

半线性广义Tricomi方程Cauchy问题解的生命跨度估计研究

国家自然科学基金

0+阅读 · 2017年12月31日

基于对称识别方法的贝叶斯probit模型稳健性研究

国家自然科学基金

3+阅读 · 2015年12月31日

基于自主学习的Ad hoc Agent序贯决策研究

国家自然科学基金

44+阅读 · 2015年12月31日

模糊认知集群优化的聚类算法

国家自然科学基金

8+阅读 · 2015年12月31日

基于相依数据的梯度学习理论研究

国家自然科学基金

1+阅读 · 2015年12月31日

面向大规模多步学习问题的学习分类元系统技术研究

国家自然科学基金

5+阅读 · 2015年12月31日

基于决策模型和预备电位的运动想象BCI研究

国家自然科学基金

3+阅读 · 2015年12月31日

CGF战场空间认知行为建模研究

国家自然科学基金

49+阅读 · 2014年12月31日

插值条件下DEM误差的空间自相关模型研究

国家自然科学基金

1+阅读 · 2014年12月31日

基于结构学习的非平行支持向量机最优化方法研究

国家自然科学基金

0+阅读 · 2014年12月31日

PMU measurements based short-term voltage stability assessment of power systems via deep transfer learning

Arxiv

0+阅读 · 2023年8月7日

Online learning techniques for prediction of temporal tabular datasets with regime changes

Arxiv

0+阅读 · 2023年8月7日

Robust estimation for semi-functional linear regression models

Arxiv

0+阅读 · 2023年8月5日

A Comprehensive Survey on Deep Graph Representation Learning

Arxiv

103+阅读 · 2023年4月11日

On Efficient Training of Large-Scale Deep Learning Models: A Literature Review

Arxiv

216+阅读 · 2023年4月7日

A Survey of Large Language Models

A Survey of Large Language Models

Arxiv

476+阅读 · 2023年3月31日

A survey and taxonomy of loss functions in machine learning

Arxiv

26+阅读 · 2023年1月13日

Characterizing and overcoming the greedy nature of learning in multi-modal deep neural networks

Arxiv

10+阅读 · 2022年2月10日

Sparsity in Deep Learning: Pruning and growth for efficient inference and training in neural networks

Arxiv

14+阅读 · 2021年1月31日

Hyper-SAGNN: a self-attention based graph neural network for hypergraphs

Hyper-SAGNN: a self-attention based graph neural network for hypergraphs

Arxiv

17+阅读 · 2019年11月6日

VIP会员

相关主题

深度强化学习

相关VIP内容

【KAUST博士论文】面向3D理解的鲁棒深度学习模型设计，190页pdf

【KAUST博士论文】面向3D理解的鲁棒深度学习模型设计，190页pdf

专知会员服务

31+阅读 · 2023年4月27日

51页《基于Transformer的多模态与自监督学习》最新报告，Google Xiaohua Zhai

51页《基于Transformer的多模态与自监督学习》最新报告，Google Xiaohua Zhai

专知会员服务

68+阅读 · 2023年2月24日

《因果ABM：基于智能体的建模以学习可靠因果模型》2022美国南佛罗里达大学等26页论文

《因果ABM：基于智能体的建模以学习可靠因果模型》2022美国南佛罗里达大学等26页论文

专知会员服务

46+阅读 · 2023年1月5日

【AAAI2023】基于序图的因果结构强化学习

【AAAI2023】基于序图的因果结构强化学习

专知会员服务

24+阅读 · 2022年11月25日

【NeurIPS 2022】子等变图神经网络学习物理动态

【NeurIPS 2022】子等变图神经网络学习物理动态

专知会员服务

17+阅读 · 2022年11月16日

【ICML2022】药物结合结构预测的几何深度学习

【ICML2022】药物结合结构预测的几何深度学习

专知会员服务

26+阅读 · 2022年5月24日

AAAI 2022 | ProtGNN：自解释图神经网络

AAAI 2022 | ProtGNN：自解释图神经网络

专知会员服务

40+阅读 · 2022年2月28日

【AAAI 2022】 GeomGCL:用于分子性质预测的几何图对比学习

【AAAI 2022】 GeomGCL:用于分子性质预测的几何图对比学习

专知会员服务

24+阅读 · 2022年2月27日

【硬核书】机器学习随机矩阵理论，472页pdf

专知会员服务

147+阅读 · 2021年8月12日

AAAI 2021 | 稀疏胜负多智能体博弈中的纳什均衡解计算

专知会员服务

41+阅读 · 2021年2月12日

热门VIP内容

开通专知VIP会员享更多权益服务

【CMU博士论文】数据驱动决策中的激励、信息与不确定性

DGP双粒度提示框架：图增强大模型助力欺诈检测

【ICCV2025】ESSENTIAL：用于视频类增量学习的情景记忆与语义记忆整合

唯快不破：大型语言模型高效架构综述

相关资讯

【AAAI2023】基于序图的因果结构强化学习

【AAAI2023】基于序图的因果结构强化学习

专知

5+阅读 · 2022年11月25日

【NeurIPS 2022】子等变图神经网络学习物理动态

【NeurIPS 2022】子等变图神经网络学习物理动态

专知

1+阅读 · 2022年11月16日

综述 | 分布式GNN训练算法和系统，35页pdf

综述 | 分布式GNN训练算法和系统，35页pdf

图与推荐

5+阅读 · 2022年11月2日

【2022新书】算法高维鲁棒统计，296页pdf与98页ppt

【2022新书】算法高维鲁棒统计，296页pdf与98页ppt

专知

4+阅读 · 2022年10月21日

【NeurIPS2022】通过模型转换的可解释强化学习

【NeurIPS2022】通过模型转换的可解释强化学习

专知

1+阅读 · 2022年10月4日

【MIT博士论文】实用机器学习的高效鲁棒算法，142页pdf

【MIT博士论文】实用机器学习的高效鲁棒算法，142页pdf

专知

5+阅读 · 2022年9月7日

《知识表示工具在感知支持系统中的应用》加拿大国防研究与发展部（DRDC）

《知识表示工具在感知支持系统中的应用》加拿大国防研究与发展部（DRDC）

专知

6+阅读 · 2022年8月27日

【2022新书】机器学习中的概率数值计算，412页pdf

【2022新书】机器学习中的概率数值计算，412页pdf

专知

31+阅读 · 2022年7月7日

元迁移学习的小样本学习，Meta-transfer Learning for Few-shot Learning，33页ppt

元迁移学习的小样本学习，Meta-transfer Learning for Few-shot Learning，33页ppt

专知

71+阅读 · 2020年2月29日

论文浅尝 | 当知识图谱遇上零样本学习——零样本学习综述

论文浅尝 | 当知识图谱遇上零样本学习——零样本学习综述

开放知识图谱

20+阅读 · 2018年9月26日

相关基金

半线性广义Tricomi方程Cauchy问题解的生命跨度估计研究

国家自然科学基金

0+阅读 · 2017年12月31日

基于对称识别方法的贝叶斯probit模型稳健性研究

国家自然科学基金

3+阅读 · 2015年12月31日

基于自主学习的Ad hoc Agent序贯决策研究

国家自然科学基金

44+阅读 · 2015年12月31日

模糊认知集群优化的聚类算法

国家自然科学基金

8+阅读 · 2015年12月31日

基于相依数据的梯度学习理论研究

国家自然科学基金

1+阅读 · 2015年12月31日

面向大规模多步学习问题的学习分类元系统技术研究

国家自然科学基金

5+阅读 · 2015年12月31日

基于决策模型和预备电位的运动想象BCI研究

国家自然科学基金

3+阅读 · 2015年12月31日

CGF战场空间认知行为建模研究

国家自然科学基金

49+阅读 · 2014年12月31日

插值条件下DEM误差的空间自相关模型研究

国家自然科学基金

1+阅读 · 2014年12月31日

基于结构学习的非平行支持向量机最优化方法研究

国家自然科学基金

0+阅读 · 2014年12月31日

相关论文

PMU measurements based short-term voltage stability assessment of power systems via deep transfer learning

Arxiv

0+阅读 · 2023年8月7日

Online learning techniques for prediction of temporal tabular datasets with regime changes

Arxiv

0+阅读 · 2023年8月7日

Robust estimation for semi-functional linear regression models

Arxiv

0+阅读 · 2023年8月5日

A Comprehensive Survey on Deep Graph Representation Learning

Arxiv

103+阅读 · 2023年4月11日

On Efficient Training of Large-Scale Deep Learning Models: A Literature Review

Arxiv

216+阅读 · 2023年4月7日

A Survey of Large Language Models

A Survey of Large Language Models

Arxiv

476+阅读 · 2023年3月31日

A survey and taxonomy of loss functions in machine learning

Arxiv

26+阅读 · 2023年1月13日

Characterizing and overcoming the greedy nature of learning in multi-modal deep neural networks

Arxiv

10+阅读 · 2022年2月10日

Sparsity in Deep Learning: Pruning and growth for efficient inference and training in neural networks

Arxiv

14+阅读 · 2021年1月31日

Hyper-SAGNN: a self-attention based graph neural network for hypergraphs

Hyper-SAGNN: a self-attention based graph neural network for hypergraphs

Arxiv

17+阅读 · 2019年11月6日

微信扫码咨询专知VIP会员