In this paper, we study an exponentiated multiplicative weights dynamic based on Hedge, a well-known algorithm in theoretical machine learning and algorithmic game theory. The empirical average (arithmetic mean) of the iterates Hedge generates is known to approach a minimax equilibrium in zero-sum games. We generalize that result to show that a weighted version of the empirical average converges to an equilibrium in the class of symmetric bimatrix games for a diminishing learning rate parameter. Our dynamic is the first dynamical system (whether continuous or discrete) shown to evolve toward a Nash equilibrium without assuming monotonicity of the payoff structure or that a potential function exists. Although our setting is somewhat restricted, it is also general as the class of symmetric bimatrix games captures the entire computational complexity of the PPAD class (even to approximate an equilibrium).


翻译:

0
下载
关闭预览

相关内容

专知会员服务
78+阅读 · 2021年3月16日
强化学习最新教程,17页pdf
专知会员服务
182+阅读 · 2019年10月11日
量化金融强化学习论文集合
专知
14+阅读 · 2019年12月18日
强化学习三篇论文 避免遗忘等
CreateAMind
20+阅读 · 2019年5月24日
国家自然科学基金
0+阅读 · 2015年12月31日
国家自然科学基金
0+阅读 · 2013年12月31日
国家自然科学基金
0+阅读 · 2012年12月31日
国家自然科学基金
1+阅读 · 2012年12月31日
国家自然科学基金
0+阅读 · 2012年12月31日
VIP会员
相关VIP内容
相关基金
国家自然科学基金
0+阅读 · 2015年12月31日
国家自然科学基金
0+阅读 · 2013年12月31日
国家自然科学基金
0+阅读 · 2012年12月31日
国家自然科学基金
1+阅读 · 2012年12月31日
国家自然科学基金
0+阅读 · 2012年12月31日
Top
微信扫码咨询专知VIP会员