Temporally extended actions improve the ability to explore and plan in single-agent settings. In multi-agent settings, the exponential growth of the joint state space with the number of agents makes coordinated behaviours even more valuable. Yet, this same exponential growth renders the design of multi-agent options particularly challenging. Existing multi-agent option discovery methods often sacrifice coordination by producing loosely coupled or fully independent behaviours. Toward addressing these limitations, we describe a novel approach for multi-agent option discovery. Specifically, we propose a joint-state abstraction that compresses the state space while preserving the information necessary to discover strongly coordinated behaviours. Our approach builds on the inductive bias that synchronisation over agent states provides a natural foundation for coordination in the absence of explicit objectives. We first approximate a fictitious state of maximal alignment with the team, the \textit{Fermat} state, and use it to define a measure of \textit{spreadness}, capturing team-level misalignment on each individual state dimension. Building on this representation, we then employ a neural graph Laplacian estimator to derive options that capture state synchronisation patterns between agents. We evaluate the resulting options across multiple scenarios in two multi-agent domains, showing that they yield stronger downstream coordination capabilities compared to alternative option discovery methods.


翻译:在单智能体环境中,时间扩展动作能够提升探索与规划能力。在多智能体环境中,随着智能体数量增加,联合状态空间呈指数级增长,这使得协调行为变得更为重要。然而,这种指数增长也使得多智能体选项的设计尤为困难。现有的多智能体选项发现方法往往通过产生松散耦合或完全独立的行为来牺牲协调性。为应对这些局限性,我们提出了一种新颖的多智能体选项发现方法。具体而言,我们设计了一种联合状态抽象方法,能够在压缩状态空间的同时保留发现强协调行为所需的信息。我们的方法基于以下归纳偏置:在缺乏显式目标的情况下,智能体状态间的同步为协调提供了自然基础。我们首先近似计算一个与团队达到最大对齐的虚构状态——\textit{Fermat}状态,并利用它定义一种\textit{分散度}度量,以捕捉每个独立状态维度上团队层面的错位情况。基于此表示方法,我们随后采用神经图拉普拉斯估计器来推导能够捕获智能体间状态同步模式的选项。我们在两个多智能体领域的多种场景中对所得选项进行评估,结果表明相较于其他选项发现方法,它们能够产生更强的下游协调能力。

0
下载
关闭预览

相关内容

智能体,顾名思义,就是具有智能的实体,英文名是Agent。
国家自然科学基金
17+阅读 · 2017年12月31日
国家自然科学基金
3+阅读 · 2015年12月31日
国家自然科学基金
46+阅读 · 2015年12月31日
国家自然科学基金
3+阅读 · 2015年12月31日
国家自然科学基金
16+阅读 · 2013年12月31日
VIP会员
相关基金
国家自然科学基金
17+阅读 · 2017年12月31日
国家自然科学基金
3+阅读 · 2015年12月31日
国家自然科学基金
46+阅读 · 2015年12月31日
国家自然科学基金
3+阅读 · 2015年12月31日
国家自然科学基金
16+阅读 · 2013年12月31日
Top
微信扫码咨询专知VIP会员