Hindsight rationality is an approach to playing multi-agent, general-sum games that prescribes no-regret learning dynamics and describes jointly rational behavior with mediated equilibria. We explore the space of deviation types in extensive-form games (EFGs) and discover powerful types that are efficient to compute in games with moderate lengths. Specifically, we identify four new types of deviations that subsume previously studied types within a broader class we call partial sequence deviations. Integrating the idea of time selection regret minimization into counterfactual regret minimization (CFR), we introduce the extensive-form regret minimization (EFR) algorithm that is hindsight rational for a general and natural class of deviations in EFGs. We provide instantiations and regret bounds for EFR that correspond to each partial sequence deviation type. In addition, we present a thorough empirical analysis of EFR's performance with different deviation types in common benchmark games. As theory suggests, instantiating EFR with stronger deviations leads to behavior that tends to outperform that of weaker deviations.


翻译:事后理性是玩多试剂、普通和普通游戏的一种方法,它规定了不回报学习的动态,并用调解的平衡来共同描述理性行为。我们探索了广泛形式游戏中的偏差类型空间,发现了在中长游戏中有效计算出的强力类型。具体地说,我们确定了四种新的偏差类型,这些类型的偏差包含以前研究过的类别,我们称之为部分序列偏差。将时间选择最小化最小化的想法纳入反事实最小化(CFR),我们引入了广泛形式最小化(EFR)算法,这种算法后视法对于EFGs的一般和自然偏差类别来说是理性的。我们为EFR提供了与每个部分序列偏差类型相对应的即时和遗憾界限。此外,我们提出了对EFR在普通基准游戏中不同偏差类型不同表现的透彻的经验分析。理论表明,瞬间偏差更强烈的反差导致往往优于较弱偏差类型的行为。

0
下载
关闭预览

相关内容

深度学习界圣经“花书”《Deep Learning》中文版来了
专知会员服务
240+阅读 · 2019年10月26日
Stabilizing Transformers for Reinforcement Learning
专知会员服务
60+阅读 · 2019年10月17日
Hierarchically Structured Meta-learning
CreateAMind
27+阅读 · 2019年5月22日
Transferring Knowledge across Learning Processes
CreateAMind
29+阅读 · 2019年5月18日
Call for Participation: Shared Tasks in NLPCC 2019
中国计算机学会
5+阅读 · 2019年3月22日
Unsupervised Learning via Meta-Learning
CreateAMind
44+阅读 · 2019年1月3日
Hierarchical Disentangled Representations
CreateAMind
4+阅读 · 2018年4月15日
Deep Learning
Arxiv
6+阅读 · 2018年8月3日
Arxiv
5+阅读 · 2018年6月5日
Arxiv
3+阅读 · 2018年2月22日
VIP会员
相关资讯
Hierarchically Structured Meta-learning
CreateAMind
27+阅读 · 2019年5月22日
Transferring Knowledge across Learning Processes
CreateAMind
29+阅读 · 2019年5月18日
Call for Participation: Shared Tasks in NLPCC 2019
中国计算机学会
5+阅读 · 2019年3月22日
Unsupervised Learning via Meta-Learning
CreateAMind
44+阅读 · 2019年1月3日
Hierarchical Disentangled Representations
CreateAMind
4+阅读 · 2018年4月15日
相关论文
Deep Learning
Arxiv
6+阅读 · 2018年8月3日
Arxiv
5+阅读 · 2018年6月5日
Arxiv
3+阅读 · 2018年2月22日
Top
微信扫码咨询专知VIP会员