AAAI 2021 | 稀疏胜负多智能体博弈中的纳什均衡解计算 - 专知

会员服务 ·

0

AAAI 2021 | 稀疏胜负多智能体博弈中的纳什均衡解计算

2021 年 2 月 2 日 专知

导读

本文是第三十五届人工智能大会（AAAI 2021）入选论文《On the Approximation of Nash Equilibria in Sparse Win-Lose Multi-player Games》的解读。

Polymatrix Game 是一类重要的多人博弈模型。这一模型最主要的特点是能拆成多对双人博弈，如下图所示。每人的收益为所有他参与的二人博弈的收益和。另外值得强调的一点是每人在所有的二人博弈中都只能使用同一个策略。整个游戏可以用一个 $2n\times2n$ 的收益矩阵表示下来。

本文研究了纳什均衡计算在一类非常特殊的 Polymatrix Game 下的计算复杂度。我们定义了 $\left(a,b\right)$ -Sparse Win-Lose Polymatrix Game (SWLP)，其中：

$\left(a,b\right)$ -Sparse 表示收益矩阵每行最多有 $a$ 个非零元素，每列最多有 $b$ 个非零元素；
Win-Lose 表示收益矩阵每个元素为 0 或 1。

本文的主要结论为：

求解 $(2,2)$ -SWLP 的多项式近似纳什均衡点是 PPAD-Complete 的；
给出了求解 $(1,n)$ -SWLP 或 $(n,1)$ -SWLP 的精确纳什均衡解的高效（多项式）算法。

本文的主要结论通过改进前人证明框架得到，由于需要较多预备知识，请感兴趣的读者阅读原论文。

本文的主要贡献在于：

证明了即使在极度简化的多人博弈下，纳什均衡解计算仍然是困难的。这进一步质疑了纳什均衡解在多人情境下的预测能力；该结论对于基于纳什均衡解的多智能体增强学习（MARL）算法有引导作用；
SWLP game 可以作为证明其他问题 PPAD-hard 结果的有用的规约起点。

最后，一个重要的尚未解决的问题是 constant sparse win-lose bimatrix game 的纳什均衡解计算复杂度。这一问题目前的最优结果由 Zhengyang Liu 与 Ying Sheng 在2018年得到，他们证明了 logarithmic sparse win-lose bimatrix game 的纳什均衡解是 PPAD-Complete 的。然而，得到更强的常数稀疏可能需要新的证明技巧。

图文 | Jiawei Li

Distributed and Automated Games and Managerial Economics (daGAME)

专知，专业可信的人工智能知识分发，让认知协作更快更好！欢迎注册登录专知www.zhuanzhi.ai，获取5000+AI主题干货知识资料！

欢迎微信扫一扫加入专知人工智能知识星球群，获取最新AI专业干货知识教程资料和与专家交流咨询！

点击“ 阅读原文 ”，了解使用专知 ，查看获取5000+AI主题知识资源

登录查看更多

1

相关内容

纳什均衡

【ICLR2021】先增强后进行卷积：梯度提升遇到图神经网络

专知会员服务

23+阅读 · 2021年1月23日

【AAAI2021】自校正Q学习，Self-correcting Q-Learning

专知会员服务

17+阅读 · 2020年12月4日

【CIKM2020-阿里】在线序列广告的用户隐藏状态推断

【CIKM2020-阿里】在线序列广告的用户隐藏状态推断

专知会员服务

25+阅读 · 2020年9月5日

【KDD2020】最小方差采样用于图神经网络的快速训练

【KDD2020】最小方差采样用于图神经网络的快速训练

专知会员服务

28+阅读 · 2020年7月13日

【ICML2020】基于图感知逻辑回归和抢占式查询候选集生成的属性图上主动学习策略

【ICML2020】基于图感知逻辑回归和抢占式查询候选集生成的属性图上主动学习策略

专知会员服务

13+阅读 · 2020年7月9日

【ICML2020-天津大学】多智能体深度强化学习中的Q值路径分解

【ICML2020-天津大学】多智能体深度强化学习中的Q值路径分解

专知会员服务

81+阅读 · 2020年7月2日

如何写论文？这份《科研论文撰写策略》看下

专知会员服务

147+阅读 · 2020年6月15日

【IJCAI2020-华为诺亚】面向深度强化学习的策略迁移框架

【IJCAI2020-华为诺亚】面向深度强化学习的策略迁移框架

专知会员服务

28+阅读 · 2020年5月25日

深度强化学习策略梯度教程，53页ppt

深度强化学习策略梯度教程，53页ppt

专知会员服务

184+阅读 · 2020年2月1日

【CoRL2019最佳论文】模仿学习，A Divergence Minimization Perspective on Imitation Learning Methods

【CoRL2019最佳论文】模仿学习，A Divergence Minimization Perspective on Imitation Learning Methods

专知会员服务

24+阅读 · 2019年11月11日

【AAAI2021】近似梯度下降的学习图神经网络

【AAAI2021】近似梯度下降的学习图神经网络

专知

8+阅读 · 2020年12月9日

【KDD2020】复杂异构网络中的高阶聚类

【KDD2020】复杂异构网络中的高阶聚类

专知

8+阅读 · 2020年8月27日

【KDD2020-阿里】可调控的多兴趣推荐框架

【KDD2020-阿里】可调控的多兴趣推荐框架

专知

9+阅读 · 2020年8月11日

【Manning2020新书】深度强化学习实战，351页pdf，Deep Reinforcement Learning

【Manning2020新书】深度强化学习实战，351页pdf，Deep Reinforcement Learning

专知

42+阅读 · 2020年3月10日

经典书《斯坦福大学-多智能体系统》532页pdf

经典书《斯坦福大学-多智能体系统》532页pdf

专知

119+阅读 · 2020年1月29日

当深度强化学习遇见图神经网络

当深度强化学习遇见图神经网络

专知

227+阅读 · 2019年10月21日

《Python代码》人工智能：计算智能体的基础

《Python代码》人工智能：计算智能体的基础

专知

6+阅读 · 2019年5月28日

AAAI 2019 四个杰出论文奖论文揭晓

AAAI 2019 四个杰出论文奖论文揭晓

算法与数学之美

5+阅读 · 2019年5月11日

腊月廿八 | 强化学习-TRPO和PPO背后的数学

腊月廿八 | 强化学习-TRPO和PPO背后的数学

AI研习社

18+阅读 · 2019年2月2日

不对称多代理博弈中的博弈理论解读

不对称多代理博弈中的博弈理论解读

AI前线

14+阅读 · 2018年3月8日

A Comparative Study for Unsupervised Network Representation Learning

Arxiv

24+阅读 · 2020年3月11日

FairRec: Two-Sided Fairness for Personalized Recommendations in Two-Sided Platforms

Arxiv

6+阅读 · 2020年2月25日

Meta-Learning with Implicit Gradients

Meta-Learning with Implicit Gradients

Arxiv

13+阅读 · 2019年9月10日

Sparse Sequence-to-Sequence Models

Sparse Sequence-to-Sequence Models

Arxiv

5+阅读 · 2019年5月14日

Learning Discrete Structures for Graph Neural Networks

Arxiv

17+阅读 · 2019年3月28日

Information-Directed Exploration for Deep Reinforcement Learning

Information-Directed Exploration for Deep Reinforcement Learning

Arxiv

5+阅读 · 2018年12月18日

Causal Embeddings for Recommendation

Arxiv

23+阅读 · 2018年8月3日

Multiagent Soft Q-Learning

Arxiv

11+阅读 · 2018年4月25日

Strong Baselines for Neural Semi-supervised Learning under Domain Shift

Arxiv

4+阅读 · 2018年4月25日

Deterministic Non-Autoregressive Neural Sequence Modeling by Iterative Refinement

Arxiv

4+阅读 · 2018年2月19日

VIP会员

相关主题

相关VIP内容

【ICLR2021】先增强后进行卷积：梯度提升遇到图神经网络

专知会员服务

23+阅读 · 2021年1月23日

【AAAI2021】自校正Q学习，Self-correcting Q-Learning

专知会员服务

17+阅读 · 2020年12月4日

【CIKM2020-阿里】在线序列广告的用户隐藏状态推断

【CIKM2020-阿里】在线序列广告的用户隐藏状态推断

专知会员服务

25+阅读 · 2020年9月5日

【KDD2020】最小方差采样用于图神经网络的快速训练

【KDD2020】最小方差采样用于图神经网络的快速训练

专知会员服务

28+阅读 · 2020年7月13日

【ICML2020】基于图感知逻辑回归和抢占式查询候选集生成的属性图上主动学习策略

【ICML2020】基于图感知逻辑回归和抢占式查询候选集生成的属性图上主动学习策略

专知会员服务

13+阅读 · 2020年7月9日

【ICML2020-天津大学】多智能体深度强化学习中的Q值路径分解

【ICML2020-天津大学】多智能体深度强化学习中的Q值路径分解

专知会员服务

81+阅读 · 2020年7月2日

如何写论文？这份《科研论文撰写策略》看下

专知会员服务

147+阅读 · 2020年6月15日

【IJCAI2020-华为诺亚】面向深度强化学习的策略迁移框架

【IJCAI2020-华为诺亚】面向深度强化学习的策略迁移框架

专知会员服务

28+阅读 · 2020年5月25日

深度强化学习策略梯度教程，53页ppt

深度强化学习策略梯度教程，53页ppt

专知会员服务

184+阅读 · 2020年2月1日

【CoRL2019最佳论文】模仿学习，A Divergence Minimization Perspective on Imitation Learning Methods

【CoRL2019最佳论文】模仿学习，A Divergence Minimization Perspective on Imitation Learning Methods

专知会员服务

24+阅读 · 2019年11月11日

热门VIP内容

开通专知VIP会员享更多权益服务

《美空军条令出版物：战略打击》最新条令

《高能激光武器》22页slides

军事前沿模型

《面向小型无人机或无人飞行器的创新雷达探测与人工智能分类技术》263页

相关资讯

【AAAI2021】近似梯度下降的学习图神经网络

【AAAI2021】近似梯度下降的学习图神经网络

专知

8+阅读 · 2020年12月9日

【KDD2020】复杂异构网络中的高阶聚类

【KDD2020】复杂异构网络中的高阶聚类

专知

8+阅读 · 2020年8月27日

【KDD2020-阿里】可调控的多兴趣推荐框架

【KDD2020-阿里】可调控的多兴趣推荐框架

专知

9+阅读 · 2020年8月11日

【Manning2020新书】深度强化学习实战，351页pdf，Deep Reinforcement Learning

【Manning2020新书】深度强化学习实战，351页pdf，Deep Reinforcement Learning

专知

42+阅读 · 2020年3月10日

经典书《斯坦福大学-多智能体系统》532页pdf

经典书《斯坦福大学-多智能体系统》532页pdf

专知

119+阅读 · 2020年1月29日

当深度强化学习遇见图神经网络

当深度强化学习遇见图神经网络

专知

227+阅读 · 2019年10月21日

《Python代码》人工智能：计算智能体的基础

《Python代码》人工智能：计算智能体的基础

专知

6+阅读 · 2019年5月28日

AAAI 2019 四个杰出论文奖论文揭晓

AAAI 2019 四个杰出论文奖论文揭晓

算法与数学之美

5+阅读 · 2019年5月11日

腊月廿八 | 强化学习-TRPO和PPO背后的数学

腊月廿八 | 强化学习-TRPO和PPO背后的数学

AI研习社

18+阅读 · 2019年2月2日

不对称多代理博弈中的博弈理论解读

不对称多代理博弈中的博弈理论解读

AI前线

14+阅读 · 2018年3月8日

相关论文

A Comparative Study for Unsupervised Network Representation Learning

Arxiv

24+阅读 · 2020年3月11日

FairRec: Two-Sided Fairness for Personalized Recommendations in Two-Sided Platforms

Arxiv

6+阅读 · 2020年2月25日

Meta-Learning with Implicit Gradients

Meta-Learning with Implicit Gradients

Arxiv

13+阅读 · 2019年9月10日

Sparse Sequence-to-Sequence Models

Sparse Sequence-to-Sequence Models

Arxiv

5+阅读 · 2019年5月14日

Learning Discrete Structures for Graph Neural Networks

Arxiv

17+阅读 · 2019年3月28日

Information-Directed Exploration for Deep Reinforcement Learning

Information-Directed Exploration for Deep Reinforcement Learning

Arxiv

5+阅读 · 2018年12月18日

Causal Embeddings for Recommendation

Arxiv

23+阅读 · 2018年8月3日

Multiagent Soft Q-Learning

Arxiv

11+阅读 · 2018年4月25日

Strong Baselines for Neural Semi-supervised Learning under Domain Shift

Arxiv

4+阅读 · 2018年4月25日

Deterministic Non-Autoregressive Neural Sequence Modeling by Iterative Refinement

Arxiv

4+阅读 · 2018年2月19日

大家都在搜

久别重逢话双塔

大型语言模型

软件无线电

国防科技创新

论文浅尝 - ICLR2020 | 通过神经逻辑归纳学习有效地解释

微信扫码咨询专知VIP会员