Motivated by packet routing in computer networks, online queuing systems are composed of queues receiving packets at different rates. Repeatedly, they send packets to servers, each of them treating only at most one packet at a time. In the centralized case, the number of accumulated packets remains bounded (i.e., the system is \textit{stable}) as long as the ratio between service rates and arrival rates is larger than $1$. In the decentralized case, individual no-regret strategies ensures stability when this ratio is larger than $2$. Yet, myopically minimizing regret disregards the long term effects due to the carryover of packets to further rounds. On the other hand, minimizing long term costs leads to stable Nash equilibria as soon as the ratio exceeds $\frac{e}{e-1}$. Stability with decentralized learning strategies with a ratio below $2$ was a major remaining question. We first argue that for ratios up to $2$, cooperation is required for stability of learning strategies, as selfish minimization of policy regret, a \textit{patient} notion of regret, might indeed still be unstable in this case. We therefore consider cooperative queues and propose the first learning decentralized algorithm guaranteeing stability of the system as long as the ratio of rates is larger than $1$, thus reaching performances comparable to centralized strategies.


翻译:在计算机网络中,在线排队系统由以不同费率接收包件的队列组成。 反复地, 他们向服务器发送包件, 每个包件每次只处理最多一个包件。 在集中的情况下, 只要服务率和抵达率之间的比重大于1美元, 则累积包件的数量仍然受约束( 即, 系统是textit{ e- sable} ) 。 在分散化的情况下, 个别的不批准战略在比率超过2美元时, 就能确保稳定性。 然而, 微乎其微地将遗憾降到最低程度, 忽略了由于将包件结转到以后的回合而带来的长期影响。 另一方面, 尽可能减少长期费用, 当比例超过$\frac{ { e_ e-1} 美元时, 累积的包件数量就会保持稳定( 系统是troducal swility ) 。 我们首先认为, 将学习战略稳定化为2美元以上, 需要合作, 作为政策最自私的最小性最小化, 达到 的中继者, 最接近于 核心性 学习率, 因此, 我们认为, 递增 递增 的 。

0
下载
关闭预览

相关内容

专知会员服务
53+阅读 · 2020年9月7日
【干货书】真实机器学习,264页pdf,Real-World Machine Learning
深度强化学习策略梯度教程,53页ppt
专知会员服务
182+阅读 · 2020年2月1日
Stabilizing Transformers for Reinforcement Learning
专知会员服务
60+阅读 · 2019年10月17日
GAN新书《生成式深度学习》,Generative Deep Learning,379页pdf
专知会员服务
203+阅读 · 2019年9月30日
CCF推荐 | 国际会议信息10条
Call4Papers
8+阅读 · 2019年5月27日
强化学习三篇论文 避免遗忘等
CreateAMind
19+阅读 · 2019年5月24日
Transferring Knowledge across Learning Processes
CreateAMind
28+阅读 · 2019年5月18日
已删除
将门创投
8+阅读 · 2019年1月30日
meta learning 17年:MAML SNAIL
CreateAMind
11+阅读 · 2019年1月2日
人工智能 | 国际会议信息10条
Call4Papers
5+阅读 · 2018年12月18日
A Modern Introduction to Online Learning
Arxiv
21+阅读 · 2019年12月31日
Optimization for deep learning: theory and algorithms
Arxiv
105+阅读 · 2019年12月19日
Advances and Open Problems in Federated Learning
Arxiv
18+阅读 · 2019年12月10日
VIP会员
相关资讯
CCF推荐 | 国际会议信息10条
Call4Papers
8+阅读 · 2019年5月27日
强化学习三篇论文 避免遗忘等
CreateAMind
19+阅读 · 2019年5月24日
Transferring Knowledge across Learning Processes
CreateAMind
28+阅读 · 2019年5月18日
已删除
将门创投
8+阅读 · 2019年1月30日
meta learning 17年:MAML SNAIL
CreateAMind
11+阅读 · 2019年1月2日
人工智能 | 国际会议信息10条
Call4Papers
5+阅读 · 2018年12月18日
Top
微信扫码咨询专知VIP会员