最近,深度强化学习(RL)方法已被成功应用于多智能体场景。通常情况下,分布式决策的观测向量是由一个智能体收集的关于其他智能体(局部)信息的串联来表示。然而,串联法在具有大量同质智能体的集群系统中的扩展性很差,因为它没有利用这些系统固有的基本特性:(i)集群中的智能体是可以互换的;(ii)集群中智能体的确切数量是不相关的。因此,我们提出了一种新的基于分布式均值嵌入的深度多智能体RL状态表示,我们将智能体视为样本,并使用经验的均值嵌入作为分布式策略的输入。我们使用直方图、径向基函数和端到端训练的神经网络来定义均值嵌入的不同特征空间。我们对集群文献中的两个著名问题--交会和追赶逃避--在全局和局部可观察的设置中评估了该表示。对于本地设置,我们进一步引入了简单的通信协议。在所有的方法中,使用神经网络特征的平均嵌入表示能够在相邻的智能体之间进行最丰富的信息交流,促进复杂的集体策略的开发。

成为VIP会员查看完整内容
56

相关内容

人工智能在军事中可用于多项任务,例如目标识别、大数据处理、作战系统、网络安全、后勤运输、战争医疗、威胁和安全监测以及战斗模拟和训练。
《分布式多智能体深度强化学习:竞争性博弈》最新论文
专知会员服务
125+阅读 · 2023年3月16日
【伯克利博士论文】可信赖机器学习,227页pdf
专知会员服务
88+阅读 · 2022年12月12日
《多智能体任务规划》2022博士论文
专知会员服务
270+阅读 · 2022年11月20日
【CMU博士论文】机器人深度强化学习,128页pdf
专知会员服务
129+阅读 · 2020年8月27日
【论文笔记】基于强化学习的人机对话
专知
20+阅读 · 2019年9月21日
PointNet系列论文解读
人工智能前沿讲习班
17+阅读 · 2019年5月3日
干货|深度强化学习在面向任务的对话管理中的应用
全球人工智能
13+阅读 · 2017年9月14日
国家自然科学基金
2+阅读 · 2014年12月31日
国家自然科学基金
10+阅读 · 2013年12月31日
国家自然科学基金
1+阅读 · 2013年12月31日
国家自然科学基金
0+阅读 · 2012年12月31日
国家自然科学基金
2+阅读 · 2011年12月31日
国家自然科学基金
1+阅读 · 2011年12月31日
国家自然科学基金
21+阅读 · 2009年12月31日
国家自然科学基金
1+阅读 · 2009年12月31日
Arxiv
0+阅读 · 2023年5月3日
Arxiv
10+阅读 · 2018年4月19日
VIP会员
相关VIP内容
相关基金
国家自然科学基金
2+阅读 · 2014年12月31日
国家自然科学基金
10+阅读 · 2013年12月31日
国家自然科学基金
1+阅读 · 2013年12月31日
国家自然科学基金
0+阅读 · 2012年12月31日
国家自然科学基金
2+阅读 · 2011年12月31日
国家自然科学基金
1+阅读 · 2011年12月31日
国家自然科学基金
21+阅读 · 2009年12月31日
国家自然科学基金
1+阅读 · 2009年12月31日
微信扫码咨询专知VIP会员