We consider the problem in which n items arrive to a market sequentially over time, where two agents compete to choose the best possible item. When an agent selects an item, he leaves the market and obtains a payoff given by the value of the item, which is represented by a random variable following a known distribution with support contained in [0, 1]. We consider two different settings for this problem. In the first one, namely competitive selection problem with no recall, agents observe the value of each item upon its arrival and decide whether to accept or reject it, in which case they will not select it in future. In the second setting, called competitive selection problem with recall, agents are allowed to select any of the available items arrived so far. For each of these problems, we describe the game induced by the selection problem as a sequential game with imperfect information and study the set of subgame-perfect Nash equilibrium payoffs. We also study the efficiency of the game equilibria. More specifically, we address the question of how much better is to have the power of getting any available item against the take-it-or-leave-it fashion. To this end, we define and study the price of anarchy and price of stability of a game instance as the ratio between the maximal sum of payoffs obtained by players under any feasible strategy and the sum of payoffs for the worst and best subgame-perfect Nash equilibrium, respectively. For the no recall case, we prove that if there are two agents and two items arriving sequentially over time, both the price of anarchy and price of stability are upper bounded by the constant 4/3 for any value distribution. Even more, we show that this bound is tight.


翻译:我们考虑的是N项目在一定时间里按顺序到达市场的问题,其中两个代理商竞相选择最佳项目。当一个代理商选择一个项目时,他离开市场,并获得该项目价值给的回报,在[0,1] 中支持的已知分配后,它由随机变量代表。我们考虑这一问题的两个不同环境。在第一个问题,即竞争性选择问题,即竞争选择问题,不回顾,代理商在到达时观察每个项目的价值,决定是否接受或拒绝,如果他们今后不选择。在第二个环境下,称为竞争性选择问题,代理商可以选择任何现有项目中到现在为止的。对于每一个问题,我们把选择问题引起的游戏称为顺序游戏,以不完善的信息进行分配,并研究对纳什平衡补偿的一组次组合。我们还研究了游戏的效率。更具体地说,如果以收紧的方式获取任何项目的实力,那么他们今后也不会选择它。在第二个场合,称为竞争性选择问题,代理商可以选择任何已经到达的物品。对于每一个问题来说,我们把选择的标定价格的任意比例分别定义为一个顺序,在游戏价格和最高值之间,我们用最坏的游戏价格和最高比率来计算。我们用最接近的顺序来计算,在最接近的顺序和最接近的顺序中,我们最后的顺序和最接近的游戏价格和最接近的顺序的顺序的顺序上,我们为最激烈的顺序的顺序进行一个比。在最激烈的顺序和最激烈的顺序进行一个比。在最后的顺序的顺序上, 。在最后的顺序上,我们为最激烈的顺序和最激烈的顺序进行一个比。

0
下载
关闭预览

相关内容

Stabilizing Transformers for Reinforcement Learning
专知会员服务
57+阅读 · 2019年10月17日
强化学习最新教程,17页pdf
专知会员服务
167+阅读 · 2019年10月11日
【新书】Python编程基础,669页pdf
专知会员服务
186+阅读 · 2019年10月10日
机器学习入门的经验与建议
专知会员服务
90+阅读 · 2019年10月10日
已删除
将门创投
3+阅读 · 2019年9月4日
Transferring Knowledge across Learning Processes
CreateAMind
25+阅读 · 2019年5月18日
强化学习的Unsupervised Meta-Learning
CreateAMind
17+阅读 · 2019年1月7日
Unsupervised Learning via Meta-Learning
CreateAMind
41+阅读 · 2019年1月3日
Arxiv
0+阅读 · 2021年10月6日
Arxiv
0+阅读 · 2021年10月6日
Arxiv
0+阅读 · 2021年10月6日
Arxiv
0+阅读 · 2021年10月5日
VIP会员
相关VIP内容
Stabilizing Transformers for Reinforcement Learning
专知会员服务
57+阅读 · 2019年10月17日
强化学习最新教程,17页pdf
专知会员服务
167+阅读 · 2019年10月11日
【新书】Python编程基础,669页pdf
专知会员服务
186+阅读 · 2019年10月10日
机器学习入门的经验与建议
专知会员服务
90+阅读 · 2019年10月10日
相关资讯
已删除
将门创投
3+阅读 · 2019年9月4日
Transferring Knowledge across Learning Processes
CreateAMind
25+阅读 · 2019年5月18日
强化学习的Unsupervised Meta-Learning
CreateAMind
17+阅读 · 2019年1月7日
Unsupervised Learning via Meta-Learning
CreateAMind
41+阅读 · 2019年1月3日
Top
微信扫码咨询专知VIP会员