Large-scale networked multi-agent systems increasingly underpin critical infrastructure, yet their collective behavior can drift toward undesirable emergent norms that elude conventional governance mechanisms. We introduce an adaptive accountability framework that (i) continuously traces responsibility flows through a lifecycle-aware audit ledger, (ii) detects harmful emergent norms online via decentralized sequential hypothesis tests, and (iii) deploys local policy and reward-shaping interventions that realign agents with system-level objectives in near real time. We prove a bounded-compromise theorem showing that whenever the expected intervention cost exceeds an adversary's payoff, the long-run proportion of compromised interactions is bounded by a constant strictly less than one. Extensive high-performance simulations with up to 100 heterogeneous agents, partial observability, and stochastic communication graphs show that our framework prevents collusion and resource hoarding in at least 90% of configurations, boosts average collective reward by 12-18%, and lowers the Gini inequality index by up to 33% relative to a PPO baseline. These results demonstrate that a theoretically principled accountability layer can induce ethically aligned, self-regulating behavior in complex MAS without sacrificing performance or scalability.


翻译:大规模网络化多智能体系统日益成为关键基础设施的支撑,然而其集体行为可能逐渐偏离预期,形成难以通过传统治理机制管控的不良涌现规范。本文提出一种自适应问责框架,该框架(i)通过生命周期感知的审计账本持续追踪责任流,(ii)利用去中心化序贯假设检验在线检测有害的涌现规范,以及(iii)以近实时方式部署局部策略与奖励塑形干预措施,使智能体行为与系统级目标重新对齐。我们证明了一个有界妥协定理:当预期干预成本超过对手收益时,长期受损交互的比例严格小于1的常数所界定。在包含多达100个异质智能体、部分可观测性及随机通信图的大规模高性能仿真中,本框架在至少90%的配置下有效防止了共谋与资源囤积,将平均集体奖励提升了12-18%,且相较于PPO基线将基尼不平等指数降低了最高33%。这些结果表明,理论上有原则的问责层能够在复杂多智能体系统中引导出符合伦理的自我调节行为,且无需牺牲性能或可扩展性。

0
下载
关闭预览

相关内容

一种Agent自主性风险评估框架 | 最新文献
专知会员服务
16+阅读 · 10月24日
引入反事实基线的无人机集群对抗博弈方法
专知会员服务
67+阅读 · 2024年3月13日
有监督深度学习的优化方法研究综述
专知会员服务
40+阅读 · 2023年5月15日
Distributional Soft Actor-Critic (DSAC)强化学习算法的设计与验证
深度强化学习实验室
19+阅读 · 2020年8月11日
【CPS】社会物理信息系统(CPSS)及其典型应用
产业智能官
16+阅读 · 2018年9月18日
国家自然科学基金
1+阅读 · 2015年12月31日
国家自然科学基金
4+阅读 · 2015年12月31日
国家自然科学基金
46+阅读 · 2015年12月31日
国家自然科学基金
2+阅读 · 2014年12月31日
VIP会员
相关VIP内容
一种Agent自主性风险评估框架 | 最新文献
专知会员服务
16+阅读 · 10月24日
引入反事实基线的无人机集群对抗博弈方法
专知会员服务
67+阅读 · 2024年3月13日
有监督深度学习的优化方法研究综述
专知会员服务
40+阅读 · 2023年5月15日
相关基金
国家自然科学基金
1+阅读 · 2015年12月31日
国家自然科学基金
4+阅读 · 2015年12月31日
国家自然科学基金
46+阅读 · 2015年12月31日
国家自然科学基金
2+阅读 · 2014年12月31日
Top
微信扫码咨询专知VIP会员