【NeurIPS2022】协作多智能体强化学习中个体全局最大值的再思考

2022 年 9 月 23 日 专知


在协同多智能体强化学习中,集中训练和分散执行(CTDE)取得了显著的成功。IGM (Individual Global Max)分解是CTDE的重要组成部分,用来衡量局部策略与联合策略之间的一致性。大多数基于IGM的研究关注于如何建立这种一致的关系,但很少关注检查IGM的潜在缺陷。在这项工作中,我们揭示了IGM条件是一个有损分解,并且有损分解的误差会在基于超网络的方法中积累。针对上述问题,本文提出采用模仿学习策略将有损分解与Bellman迭代分离,从而避免误差累积。在零视点的《星际争霸》多智能体挑战赛基准问题上,对所提策略进行了理论验证和实证验证。结果也证实了提出的方法优于最先进的基于IGM的方法。
https://www.zhuanzhi.ai/paper/acf4a4b734b3127ef7ad948ba9fdda23


专知便捷查看

便捷下载,请关注专知公众号(点击上方蓝色专知关注)

  • 后台回复“CMAL” 就可以获取【NeurIPS2022】协作多智能体强化学习中个体全局最大值的再思考》专知下载链接

                       
专知,专业可信的人工智能知识分发 ,让认知协作更快更好!欢迎注册登录专知www.zhuanzhi.ai,获取100000+AI(AI与军事、医药、公安等)主题干货知识资料!
欢迎微信扫一扫加入专知人工智能知识星球群,获取最新AI专业干货知识教程资料和与专家交流咨询
点击“ 阅读原文 ”,了解使用 专知 ,查看获取100000+AI主题知识资料
登录查看更多
2

相关内容

【NeurIPS2022】解决持续学习问题的理论研究
专知会员服务
29+阅读 · 2022年11月7日
《分布式多智能体强化学习的编码》加州大学等
专知会员服务
53+阅读 · 2022年11月2日
【NeurIPS 2022】带有自适应节点采样的层次图Transformer
专知会员服务
28+阅读 · 2022年10月11日
【NeurIPS2022】VICRegL:局部视觉特征的自监督学习
专知会员服务
31+阅读 · 2022年10月6日
【ICML2022】DRIBO:基于多视图信息瓶颈的鲁棒深度强化学习
【NeurIPS 2021】设置多智能体策略梯度的方差
专知会员服务
20+阅读 · 2021年10月24日
专知会员服务
22+阅读 · 2021年10月6日
【CVPR2021】现实世界域泛化的自适应方法
专知会员服务
55+阅读 · 2021年3月31日
【NeurIPS2020】图神经网络中的池化再思考
专知会员服务
51+阅读 · 2020年10月25日
【NeurIPS2022】分布式自适应元强化学习
专知
3+阅读 · 2022年10月8日
【CVPR2022】视频对比学习的概率表示
专知
1+阅读 · 2022年4月12日
国家自然科学基金
0+阅读 · 2013年12月31日
国家自然科学基金
1+阅读 · 2013年12月31日
国家自然科学基金
1+阅读 · 2012年12月31日
国家自然科学基金
3+阅读 · 2012年12月31日
国家自然科学基金
0+阅读 · 2012年12月31日
国家自然科学基金
0+阅读 · 2009年12月31日
国家自然科学基金
2+阅读 · 2009年12月31日
国家自然科学基金
13+阅读 · 2008年12月31日
Arxiv
0+阅读 · 2022年11月22日
Personal Privacy Protection Problems in the Digital Age
A Multi-Objective Deep Reinforcement Learning Framework
VIP会员
相关VIP内容
【NeurIPS2022】解决持续学习问题的理论研究
专知会员服务
29+阅读 · 2022年11月7日
《分布式多智能体强化学习的编码》加州大学等
专知会员服务
53+阅读 · 2022年11月2日
【NeurIPS 2022】带有自适应节点采样的层次图Transformer
专知会员服务
28+阅读 · 2022年10月11日
【NeurIPS2022】VICRegL:局部视觉特征的自监督学习
专知会员服务
31+阅读 · 2022年10月6日
【ICML2022】DRIBO:基于多视图信息瓶颈的鲁棒深度强化学习
【NeurIPS 2021】设置多智能体策略梯度的方差
专知会员服务
20+阅读 · 2021年10月24日
专知会员服务
22+阅读 · 2021年10月6日
【CVPR2021】现实世界域泛化的自适应方法
专知会员服务
55+阅读 · 2021年3月31日
【NeurIPS2020】图神经网络中的池化再思考
专知会员服务
51+阅读 · 2020年10月25日
相关基金
国家自然科学基金
0+阅读 · 2013年12月31日
国家自然科学基金
1+阅读 · 2013年12月31日
国家自然科学基金
1+阅读 · 2012年12月31日
国家自然科学基金
3+阅读 · 2012年12月31日
国家自然科学基金
0+阅读 · 2012年12月31日
国家自然科学基金
0+阅读 · 2009年12月31日
国家自然科学基金
2+阅读 · 2009年12月31日
国家自然科学基金
13+阅读 · 2008年12月31日
Top
微信扫码咨询专知VIP会员