Zero-sum stochastic games have found important applications in a variety of fields, from machine learning to economics. Work on this model has primarily focused on the computation of Nash equilibrium due to its effectiveness in solving adversarial board and video games. Unfortunately, a Nash equilibrium is not guaranteed to exist in zero-sum stochastic games when the payoffs at each state are not convex-concave in the players' actions. A Stackelberg equilibrium, however, is guaranteed to exist. Consequently, in this paper, we study zero-sum stochastic Stackelberg games. Going beyond known existence results for (non-stationary) Stackelberg equilibria, we prove the existence of recursive (i.e., Markov perfect) Stackelberg equilibria (recSE) in these games, provide necessary and sufficient conditions for a policy profile to be a recSE, and show that recSE can be computed in (weakly) polynomial time via value iteration. Finally, we show that zero-sum stochastic Stackelberg games can model the problem of pricing and allocating goods across agents and time. More specifically, we propose a zero-sum stochastic Stackelberg game whose recSE correspond to the recursive competitive equilibria of a large class of stochastic Fisher markets. We close with a series of experiments that showcase how our methodology can be used to solve the consumption-savings problem in stochastic Fisher markets.
翻译:零和透视游戏在从机器学习到经济学等各个领域都找到了重要的应用。 这个模型的工作主要侧重于纳什平衡的计算, 因为它能有效地解决对抗性棋盘和视频游戏。 不幸的是, 当每个州的报酬在球员的行动中都不是共通的, 纳什平衡并不能保证存在于零和随机游戏中。 但是, 斯塔克伯格平衡可以保证存在。 因此, 在本文中, 我们研究零和随机Stackelberg游戏。 超越( 非固定的) Stackelberg equilibria 的已知存在结果, 我们证明在这些游戏中存在累回( Markov 完美 ) Stakkelberg equiparria (recSE), 提供必要和充分的条件, 使政策配置成为一种正解, 并且表明, 可以用( 微的) 混合清算时间来计算 。 最后, 我们显示, 零和 重复的斯塔克贝贝格游戏 的 游戏, 能够用一个更精确的游戏 的游戏 的游戏 的游戏 规则性 来模拟我们 的 的游戏 的 的游戏 的 的游戏 的游戏 的游戏 的 的游戏 的游戏 的 的游戏 的 的 的 的 的游戏 的 的 的 的 的 的 的 的 游戏 的 的 的 的 的 的 的 的 的 的 的 的 的 的 的 的 的 的 的 的 的 的 的 的 游戏的 的 的 的 游戏 的 的 的 和 的 的 的 的 的 的 的 的 的 的 的 的 的 的 的 的 的 的 的 的 的 的 的 的 的 的 的 的 的 的 的 的 的 的 的 的 的 的 的 的 的 的 的 的 的 的 的 的 的 的 的 的 的 的 的 的 的 的 的 的 的 的 的 的 的 的 的