In this paper, we provide exponential rates of convergence to the Nash equilibrium of continuous-time game dynamics such as mirror descent (MD) and actor-critic (AC) in $N$-player continuous games that are either potential games or monotone games but possibly potential-free. In the first part of this paper, under the assumption the game admits a relatively strongly concave potential, we show that MD and AC converge in $\mathcal{O}(e^{-\beta t})$. In the second part of this paper, using relative concavity, we provide a novel relative characterization of monotone games and show that MD and its discounted version converge with $\mathcal{O}(e^{-\beta t})$ in relatively strongly and relatively hypo-monotone games. Moreover, these rates extend their known convergence conditions and also improve the results in the potential game setup. Simulations are performed which empirically back up our results.


翻译:在本文的第一部分,我们提供了与连续时间游戏动态的纳什平衡的指数性趋同率,如镜底(MD)和演员和演员连续游戏(AC),这些游戏是潜在的游戏或单调游戏,但可能是无的。在本文的第一部分,假设游戏具有相对强烈的共鸣潜力,我们显示MD和AC以$\mathcal{O}(e\\\\\\beta t}$(e\\\beta t})趋同率。在本文的第二部分,我们利用相对的共鸣,提供了单调游戏的新颖相对特征,并展示了MD及其折扣版与$\mathcal{O}(e\\\\\beta t})相对强烈和相对低调游戏的趋同率。此外,这些比率延长了已知的趋同条件,并改进了潜在游戏设置的结果。在经验上支持我们的结果的模拟了模拟。

0
下载
关闭预览

相关内容

让 iOS 8 和 OS X Yosemite 无缝切换的一个新特性。 > Apple products have always been designed to work together beautifully. But now they may really surprise you. With iOS 8 and OS X Yosemite, you’ll be able to do more wonderful things than ever before.

Source: Apple - iOS 8
【CMU】最新深度学习课程, Introduction to Deep Learning
专知会员服务
36+阅读 · 2020年9月12日
AlphaZero原理与启示
专知会员服务
31+阅读 · 2020年8月23日
Linux导论,Introduction to Linux,96页ppt
专知会员服务
76+阅读 · 2020年7月26日
【Google】平滑对抗训练,Smooth Adversarial Training
专知会员服务
47+阅读 · 2020年7月4日
Fariz Darari简明《博弈论Game Theory》介绍,35页ppt
专知会员服务
107+阅读 · 2020年5月15日
《DeepGCNs: Making GCNs Go as Deep as CNNs》
专知会员服务
30+阅读 · 2019年10月17日
已删除
将门创投
4+阅读 · 2020年1月6日
强化学习的Unsupervised Meta-Learning
CreateAMind
17+阅读 · 2019年1月7日
meta learning 17年:MAML SNAIL
CreateAMind
11+阅读 · 2019年1月2日
RL 真经
CreateAMind
5+阅读 · 2018年12月28日
Disentangled的假设的探讨
CreateAMind
9+阅读 · 2018年12月10日
Hierarchical Disentangled Representations
CreateAMind
4+阅读 · 2018年4月15日
【论文】变分推断(Variational inference)的总结
机器学习研究会
39+阅读 · 2017年11月16日
Auto-Encoding GAN
CreateAMind
7+阅读 · 2017年8月4日
Computation of Optimal Transport with Finite Volumes
Arxiv
0+阅读 · 2021年1月6日
Optimization for deep learning: theory and algorithms
Arxiv
103+阅读 · 2019年12月19日
VIP会员
相关VIP内容
【CMU】最新深度学习课程, Introduction to Deep Learning
专知会员服务
36+阅读 · 2020年9月12日
AlphaZero原理与启示
专知会员服务
31+阅读 · 2020年8月23日
Linux导论,Introduction to Linux,96页ppt
专知会员服务
76+阅读 · 2020年7月26日
【Google】平滑对抗训练,Smooth Adversarial Training
专知会员服务
47+阅读 · 2020年7月4日
Fariz Darari简明《博弈论Game Theory》介绍,35页ppt
专知会员服务
107+阅读 · 2020年5月15日
《DeepGCNs: Making GCNs Go as Deep as CNNs》
专知会员服务
30+阅读 · 2019年10月17日
相关资讯
已删除
将门创投
4+阅读 · 2020年1月6日
强化学习的Unsupervised Meta-Learning
CreateAMind
17+阅读 · 2019年1月7日
meta learning 17年:MAML SNAIL
CreateAMind
11+阅读 · 2019年1月2日
RL 真经
CreateAMind
5+阅读 · 2018年12月28日
Disentangled的假设的探讨
CreateAMind
9+阅读 · 2018年12月10日
Hierarchical Disentangled Representations
CreateAMind
4+阅读 · 2018年4月15日
【论文】变分推断(Variational inference)的总结
机器学习研究会
39+阅读 · 2017年11月16日
Auto-Encoding GAN
CreateAMind
7+阅读 · 2017年8月4日
Top
微信扫码咨询专知VIP会员