AAAI 2021 | 稀疏胜负多智能体博弈中的纳什均衡解计算

2021 年 2 月 2 日 专知

导  读

本文是第三十五届人工智能大会(AAAI 2021)入选论文《On the Approximation of Nash Equilibria in Sparse Win-Lose Multi-player Games》的解读。


Polymatrix Game 是一类重要的多人博弈模型。这一模型最主要的特点是能拆成多对双人博弈,如下图所示。每人的收益为所有他参与的二人博弈的收益和。另外值得强调的一点是每人在所有的二人博弈中都只能使用同一个策略。整个游戏可以用一个   的收益矩阵表示下来。


本文研究了纳什均衡计算在一类非常特殊的 Polymatrix Game 下的计算复杂度。我们定义了   -Sparse Win-Lose Polymatrix Game (SWLP),其中:

  •    -Sparse 表示收益矩阵每行最多有   个非零元素,每列最多有   个非零元素;

  • Win-Lose 表示收益矩阵每个元素为 0 或 1。


本文的主要结论为:

  1. 求解   -SWLP 的多项式近似纳什均衡点是 PPAD-Complete 的;

  2. 给出了求解   -SWLP 或   -SWLP 的精确纳什均衡解的高效(多项式)算法。


本文的主要结论通过改进前人证明框架得到,由于需要较多预备知识,请感兴趣的读者阅读原论文。


本文的主要贡献在于:

  1. 证明了即使在极度简化的多人博弈下,纳什均衡解计算仍然是困难的。这进一步质疑了纳什均衡解在多人情境下的预测能力;该结论对于基于纳什均衡解的多智能体增强学习(MARL)算法有引导作用;

  2. SWLP game 可以作为证明其他问题 PPAD-hard 结果的有用的规约起点。


最后,一个重要的尚未解决的问题是 constant sparse win-lose bimatrix game 的纳什均衡解计算复杂度。这一问题目前的最优结果由 Zhengyang Liu 与 Ying Sheng 在2018年得到,他们证明了 logarithmic sparse win-lose bimatrix game 的纳什均衡解是 PPAD-Complete 的。然而,得到更强的常数稀疏可能需要新的证明技巧。


图文 | Jiawei Li

Distributed and Automated Games and Managerial Economics (daGAME)


专知,专业可信的人工智能知识分发,让认知协作更快更好!欢迎注册登录专知www.zhuanzhi.ai,获取5000+AI主题干货知识资料!
欢迎微信扫一扫加入专知人工智能知识星球群,获取最新AI专业干货知识教程资料和与专家交流咨询
点击“ 阅读原文 ”,了解使用 专知 ,查看获取5000+AI主题知识资源
登录查看更多
1

相关内容

专知会员服务
16+阅读 · 2020年12月4日
【CIKM2020-阿里】在线序列广告的用户隐藏状态推断
专知会员服务
23+阅读 · 2020年9月5日
【KDD2020】最小方差采样用于图神经网络的快速训练
专知会员服务
27+阅读 · 2020年7月13日
专知会员服务
142+阅读 · 2020年6月15日
【IJCAI2020-华为诺亚】面向深度强化学习的策略迁移框架
专知会员服务
25+阅读 · 2020年5月25日
深度强化学习策略梯度教程,53页ppt
专知会员服务
176+阅读 · 2020年2月1日
【KDD2020】复杂异构网络中的高阶聚类
专知
8+阅读 · 2020年8月27日
【KDD2020-阿里】可调控的多兴趣推荐框架
专知
9+阅读 · 2020年8月11日
经典书《斯坦福大学-多智能体系统》532页pdf
当深度强化学习遇见图神经网络
专知
224+阅读 · 2019年10月21日
AAAI 2019 四个杰出论文奖论文揭晓
算法与数学之美
5+阅读 · 2019年5月11日
腊月廿八 | 强化学习-TRPO和PPO背后的数学
AI研习社
17+阅读 · 2019年2月2日
不对称多代理博弈中的博弈理论解读
AI前线
13+阅读 · 2018年3月8日
Meta-Learning with Implicit Gradients
Arxiv
13+阅读 · 2019年9月10日
Sparse Sequence-to-Sequence Models
Arxiv
5+阅读 · 2019年5月14日
Arxiv
17+阅读 · 2019年3月28日
Arxiv
22+阅读 · 2018年8月3日
Arxiv
11+阅读 · 2018年4月25日
VIP会员
相关VIP内容
专知会员服务
16+阅读 · 2020年12月4日
【CIKM2020-阿里】在线序列广告的用户隐藏状态推断
专知会员服务
23+阅读 · 2020年9月5日
【KDD2020】最小方差采样用于图神经网络的快速训练
专知会员服务
27+阅读 · 2020年7月13日
专知会员服务
142+阅读 · 2020年6月15日
【IJCAI2020-华为诺亚】面向深度强化学习的策略迁移框架
专知会员服务
25+阅读 · 2020年5月25日
深度强化学习策略梯度教程,53页ppt
专知会员服务
176+阅读 · 2020年2月1日
相关资讯
【KDD2020】复杂异构网络中的高阶聚类
专知
8+阅读 · 2020年8月27日
【KDD2020-阿里】可调控的多兴趣推荐框架
专知
9+阅读 · 2020年8月11日
经典书《斯坦福大学-多智能体系统》532页pdf
当深度强化学习遇见图神经网络
专知
224+阅读 · 2019年10月21日
AAAI 2019 四个杰出论文奖论文揭晓
算法与数学之美
5+阅读 · 2019年5月11日
腊月廿八 | 强化学习-TRPO和PPO背后的数学
AI研习社
17+阅读 · 2019年2月2日
不对称多代理博弈中的博弈理论解读
AI前线
13+阅读 · 2018年3月8日
相关论文
Top
微信扫码咨询专知VIP会员