【ICML2021】为开放博弈中的学习建模行为多样性。 - 专知VIP

会员服务 ·

8

ICML 2021 · 博弈论 · 动态博弈 ·

2021 年 5 月 29 日

【ICML2021】为开放博弈中的学习建模行为多样性。

专知会员服务

专知，提供专业可信的知识分发服务，让认知协作更快更好！

促进行为多样性对于解决具有非传递性的动态博弈至关重要，因为这些博弈的策略存在周期性，而且没有一致的赢家（例如，剪刀石头布）。然而，在定义多样性和构建具有多样性意识的学习动态方面缺乏严格的处理。这项工作提供了游戏中行为多样性的几何解释，并引入了一种基于决定点过程（DPP）的新的多样性度量。通过将多样性度量纳入最佳响应动态，我们开发了多样化的策略空间响应机制，用于解决正常形式的博弈和开放式博弈。我们证明了不同最佳响应的唯一性和我们算法在两人博弈上的收敛性。重要的是，我们证明了最大化基于DPP的多样性度量保证了扩大由代理策略混合跨越的凸多面体。为了验证我们的多样性感知求解器，我们在数十个显示出强非传递性的博弈上进行了测试。结果表明，通过找到有效和多样化的策略，可以实现比最先进的求解器更低的可利用性。

https://www.zhuanzhi.ai/paper/92bae43a935a4cb28d57af4652726ba7

成为VIP会员查看完整内容

37

相关内容

ICML 2021

【SIGIR2021】图神经网络序列推荐

专知会员服务

57+阅读 · 2021年6月30日

【ICML2021】来自观察的跨域模仿

【ICML2021】来自观察的跨域模仿

专知会员服务

18+阅读 · 2021年5月25日

【WWW2021】面向推荐学习公平表示：一种图视角

专知会员服务

30+阅读 · 2021年2月21日

【ICLR2021】MELR:通过为少样本学习建模情节层次关系的元学习

【ICLR2021】MELR:通过为少样本学习建模情节层次关系的元学习

专知会员服务

15+阅读 · 2021年1月31日

【CVPR2020】我们能用强化学习来学习图模型推断的启发规则吗?

专知会员服务

43+阅读 · 2020年5月5日

KDD 2019论文解读:异构信息网络上的对抗生成学习

KDD 2019论文解读:异构信息网络上的对抗生成学习

云栖社区

23+阅读 · 2019年8月21日

在稀疏和欠明确奖励中学习泛化

在稀疏和欠明确奖励中学习泛化

谷歌开发者

6+阅读 · 2019年3月20日

干货 | 强化学习中，如何从稀疏和不明确的反馈中学习泛化

干货 | 强化学习中，如何从稀疏和不明确的反馈中学习泛化

AI科技评论

7+阅读 · 2019年3月1日

CMU、谷歌提出Transformer-XL：学习超长上下文关系

CMU、谷歌提出Transformer-XL：学习超长上下文关系

机器之心

9+阅读 · 2019年1月18日

不对称多代理博弈中的博弈理论解读

不对称多代理博弈中的博弈理论解读

AI前线

14+阅读 · 2018年3月8日

High-Accuracy Model-Based Reinforcement Learning, a Survey

Arxiv

0+阅读 · 2021年7月17日

Cold-start Sequential Recommendation via Meta Learner

Cold-start Sequential Recommendation via Meta Learner

Arxiv

15+阅读 · 2020年12月10日

Semantics-aware BERT for Language Understanding

Arxiv

4+阅读 · 2019年9月5日

Adversarial Transfer Learning

Adversarial Transfer Learning

Arxiv

12+阅读 · 2018年12月6日

Topic Modeling on Health Journals with Regularized Variational Inference

Arxiv

3+阅读 · 2018年1月15日

VIP会员

相关主题

相关VIP内容

【SIGIR2021】图神经网络序列推荐

专知会员服务

57+阅读 · 2021年6月30日

【ICML2021】来自观察的跨域模仿

【ICML2021】来自观察的跨域模仿

专知会员服务

18+阅读 · 2021年5月25日

【WWW2021】面向推荐学习公平表示：一种图视角

专知会员服务

30+阅读 · 2021年2月21日

【ICLR2021】MELR:通过为少样本学习建模情节层次关系的元学习

【ICLR2021】MELR:通过为少样本学习建模情节层次关系的元学习

专知会员服务

15+阅读 · 2021年1月31日

【CVPR2020】我们能用强化学习来学习图模型推断的启发规则吗?

专知会员服务

43+阅读 · 2020年5月5日

热门VIP内容

开通专知VIP会员享更多权益服务

生成式人工智能导论：可靠性、负责任开发及实际应用（第二版）

《2025财年美陆军转型倡议（ATI）部队结构与组织提案》

【CMU博士论文】分布偏移下的可信机器学习

智能体 EDA 的曙光：自主数字芯片设计综述

相关资讯

KDD 2019论文解读:异构信息网络上的对抗生成学习

KDD 2019论文解读:异构信息网络上的对抗生成学习

云栖社区

23+阅读 · 2019年8月21日

在稀疏和欠明确奖励中学习泛化

在稀疏和欠明确奖励中学习泛化

谷歌开发者

6+阅读 · 2019年3月20日

干货 | 强化学习中，如何从稀疏和不明确的反馈中学习泛化

干货 | 强化学习中，如何从稀疏和不明确的反馈中学习泛化

AI科技评论

7+阅读 · 2019年3月1日

CMU、谷歌提出Transformer-XL：学习超长上下文关系

CMU、谷歌提出Transformer-XL：学习超长上下文关系

机器之心

9+阅读 · 2019年1月18日

不对称多代理博弈中的博弈理论解读

不对称多代理博弈中的博弈理论解读

AI前线

14+阅读 · 2018年3月8日

相关论文

High-Accuracy Model-Based Reinforcement Learning, a Survey

Arxiv

0+阅读 · 2021年7月17日

Cold-start Sequential Recommendation via Meta Learner

Cold-start Sequential Recommendation via Meta Learner

Arxiv

15+阅读 · 2020年12月10日

Semantics-aware BERT for Language Understanding

Arxiv

4+阅读 · 2019年9月5日

Adversarial Transfer Learning

Adversarial Transfer Learning

Arxiv

12+阅读 · 2018年12月6日

Topic Modeling on Health Journals with Regularized Variational Inference

Arxiv

3+阅读 · 2018年1月15日

微信扫码咨询专知VIP会员