【CMU大神Noam博士论文】大型对抗性不完全信息博弈的均衡发现，附230页pdf与slides - 专知VIP

会员服务 ·

22

不完全信息博弈 · 均衡发现 ·

2020 年 9 月 23 日

【CMU大神Noam博士论文】大型对抗性不完全信息博弈的均衡发现，附230页pdf与slides

专知会员服务

专知，提供专业可信的知识分发服务，让认知协作更快更好！

大型对抗性不完全信息博弈的均衡发现

不完全信息博弈模型是指具有私有信息的多个主体之间的交互作用。在这种情况下，一个典型的目标是接近一个均衡，在这个均衡中，所有主体的策略都是最优的。本文描述了大型对抗不完全信息博弈均衡计算方面的若干进展。这些新技术使人工智能智能体首次有可能在全规模扑克游戏中击败顶级人类专业人员。几十年来，扑克一直是人工智能和博弈论领域的一大挑战。

我们首先介绍了反事实后悔最小化(CFR)的改进，这是一种收敛于双方零和博弈纳什均衡的迭代算法。我们描述了CFR的新变种，使用折现来显著加快收敛速度。这些新的CFR变体现在是大型对抗非完全信息博弈的最先进的均衡发现算法。我们还介绍了第一种热启动CFR的通用技术。最后，我们介绍理论健全的剪枝技术，可以在大型博弈中数量级地加速收敛。

接下来，我们将描述通过自动抽象和函数近似将CFR扩展到大型游戏的新方法。特别地，我们介绍了第一个在不完全信息博弈中离散连续动作空间的算法。我们将其扩展到求解具有连续动作空间博弈的算法中。

之后，我们介绍了Deep CFR，一种使用神经网络函数近似而不是基于bucketing的抽象形式。Deep CFR是第一个可扩展到大型游戏的non-tabular形式的CFR，它使CFR能够在几乎没有领域知识的情况下成功部署。最后，我们提出了一种新的不完全信息博弈搜索技术，以确保智能体的搜索策略不会被对手利用。方法，它在计算上比以前的方法要代价要少得多。最最后，我们提出了一种在训练和测试时结合强化学习和搜索的算法ReBeL。它朝着弥合完全信息游戏和不完全信息游戏研究之间的差距迈出了重要的一步。

成为VIP会员查看完整内容

96

相关内容

不完全信息博弈

不完全信息博弈

【Alma Mate博士论文】深度架构持续学习，附150页pdf与Slides

【Alma Mate博士论文】深度架构持续学习，附150页pdf与Slides

专知会员服务

47+阅读 · 2020年11月18日

【CMU博士论文Wen Sun】强化学习的泛化性与效率，206页pdf

【CMU博士论文Wen Sun】强化学习的泛化性与效率，206页pdf

专知会员服务

94+阅读 · 2020年9月28日

最新《理论计算科学导论》书稿，655页pdf

最新《理论计算科学导论》书稿，655页pdf

专知会员服务

102+阅读 · 2020年9月17日

最新《深度持续学习》综述论文，32页pdf

最新《深度持续学习》综述论文，32页pdf

专知会员服务

87+阅读 · 2020年9月6日

【复旦大学刘鹏飞博士论文】自然语言处理中的神经表示学习，153页pdf

专知会员服务

107+阅读 · 2020年9月1日

【CMU博士论文】机器人深度强化学习，128页pdf

【CMU博士论文】机器人深度强化学习，128页pdf

专知会员服务

133+阅读 · 2020年8月27日

【硬核书】不完全信息决策理论，467页pdf

【硬核书】不完全信息决策理论，467页pdf

专知会员服务

363+阅读 · 2020年6月24日

《强化学习》简介小册，24页pdf

《强化学习》简介小册，24页pdf

专知会员服务

277+阅读 · 2020年4月19日

斯坦福陈丹琦博士论文：神经网络阅读理解与更多【附156页pdf】

斯坦福陈丹琦博士论文：神经网络阅读理解与更多【附156页pdf】

专知会员服务

64+阅读 · 2019年10月27日

【伯克利博士论文】如何让机器人多技能？通过最大熵强化学习(107页pdf)

【伯克利博士论文】如何让机器人多技能？通过最大熵强化学习(107页pdf)

专知会员服务

78+阅读 · 2019年10月27日

【CMU-Amazon】时间序列预测：理论与实践，379页ppt阐述大规模时序预测工具与方法

【CMU-Amazon】时间序列预测：理论与实践，379页ppt阐述大规模时序预测工具与方法

专知

31+阅读 · 2020年4月24日

密歇根大学最新28页综述论文《GANs生成式对抗网络综述：算法、理论与应用》，带你全面了解GAN技术趋势

密歇根大学最新28页综述论文《GANs生成式对抗网络综述：算法、理论与应用》，带你全面了解GAN技术趋势

极市平台

19+阅读 · 2020年2月17日

【微软Alekh等开放新书】强化学习理论与算法，83页pdf，了解最新进展

【微软Alekh等开放新书】强化学习理论与算法，83页pdf，了解最新进展

专知

25+阅读 · 2019年11月23日

当深度强化学习遇见图神经网络

当深度强化学习遇见图神经网络

专知

227+阅读 · 2019年10月21日

AAAI 2019 四个杰出论文奖论文揭晓

AAAI 2019 四个杰出论文奖论文揭晓

算法与数学之美

5+阅读 · 2019年5月11日

【伯克利博士论文】如何让机器人多技能？通过最大熵强化学习(107页pdf)

【伯克利博士论文】如何让机器人多技能？通过最大熵强化学习(107页pdf)

专知

12+阅读 · 2018年12月22日

MIT科学家Dimitri P. Bertsekas最新2019出版《强化学习与最优控制》(附书稿PDF&讲义)

MIT科学家Dimitri P. Bertsekas最新2019出版《强化学习与最优控制》(附书稿PDF&讲义)

机器之心

25+阅读 · 2018年12月19日

斯坦福陈丹琦博士论文：神经网络阅读理解与更多【附156页pdf】

斯坦福陈丹琦博士论文：神经网络阅读理解与更多【附156页pdf】

专知

62+阅读 · 2018年12月15日

学界 | 面向无监督任务：DeepMind提出神经离散表示学习生成模型VQ-VAE

学界 | 面向无监督任务：DeepMind提出神经离散表示学习生成模型VQ-VAE

机器之心

6+阅读 · 2017年11月10日

人类：“共同探索围棋极限！”新AlphaGo：“不了吧，我到了。”

人类：“共同探索围棋极限！”新AlphaGo：“不了吧，我到了。”

PingWest品玩

4+阅读 · 2017年10月20日

Seeing What a GAN Cannot Generate

Seeing What a GAN Cannot Generate

Arxiv

8+阅读 · 2019年10月24日

Keyphrase Generation for Scientific Articles using GANs

Keyphrase Generation for Scientific Articles using GANs

Arxiv

8+阅读 · 2019年9月24日

Lipschitz Generative Adversarial Nets

Arxiv

8+阅读 · 2019年2月15日

Energy-Based Hindsight Experience Prioritization

Arxiv

3+阅读 · 2018年10月8日

High-Resolution Image Synthesis and Semantic Manipulation with Conditional GANs

High-Resolution Image Synthesis and Semantic Manipulation with Conditional GANs

Arxiv

3+阅读 · 2018年8月20日

Improving Image Captioning with Conditional Generative Adversarial Nets

Arxiv

9+阅读 · 2018年5月18日

Adversarial Binary Coding for Efficient Person Re-identification

Arxiv

4+阅读 · 2018年4月6日

High-Resolution Deep Convolutional Generative Adversarial Networks

Arxiv

8+阅读 · 2018年1月27日

MR image reconstruction using deep density priors

Arxiv

5+阅读 · 2018年1月17日

Demystifying MMD GANs

Arxiv

12+阅读 · 2018年1月12日

VIP会员

相关主题

不完全信息博弈

相关VIP内容

【Alma Mate博士论文】深度架构持续学习，附150页pdf与Slides

【Alma Mate博士论文】深度架构持续学习，附150页pdf与Slides

专知会员服务

47+阅读 · 2020年11月18日

【CMU博士论文Wen Sun】强化学习的泛化性与效率，206页pdf

【CMU博士论文Wen Sun】强化学习的泛化性与效率，206页pdf

专知会员服务

94+阅读 · 2020年9月28日

最新《理论计算科学导论》书稿，655页pdf

最新《理论计算科学导论》书稿，655页pdf

专知会员服务

102+阅读 · 2020年9月17日

最新《深度持续学习》综述论文，32页pdf

最新《深度持续学习》综述论文，32页pdf

专知会员服务

87+阅读 · 2020年9月6日

【复旦大学刘鹏飞博士论文】自然语言处理中的神经表示学习，153页pdf

专知会员服务

107+阅读 · 2020年9月1日

【CMU博士论文】机器人深度强化学习，128页pdf

【CMU博士论文】机器人深度强化学习，128页pdf

专知会员服务

133+阅读 · 2020年8月27日

【硬核书】不完全信息决策理论，467页pdf

【硬核书】不完全信息决策理论，467页pdf

专知会员服务

363+阅读 · 2020年6月24日

《强化学习》简介小册，24页pdf

《强化学习》简介小册，24页pdf

专知会员服务

277+阅读 · 2020年4月19日

斯坦福陈丹琦博士论文：神经网络阅读理解与更多【附156页pdf】

斯坦福陈丹琦博士论文：神经网络阅读理解与更多【附156页pdf】

专知会员服务

64+阅读 · 2019年10月27日

【伯克利博士论文】如何让机器人多技能？通过最大熵强化学习(107页pdf)

【伯克利博士论文】如何让机器人多技能？通过最大熵强化学习(107页pdf)

专知会员服务

78+阅读 · 2019年10月27日

热门VIP内容

开通专知VIP会员享更多权益服务

《复杂工程系统模型驱动设计决策支持系统：早期设计阶段挑战》最新138页

《日本陆上自卫队2040年作战方式与未来作战研究》最新23页slides

人工智能作为战争武器

《后勤保障》最新23页

相关资讯

【CMU-Amazon】时间序列预测：理论与实践，379页ppt阐述大规模时序预测工具与方法

【CMU-Amazon】时间序列预测：理论与实践，379页ppt阐述大规模时序预测工具与方法

专知

31+阅读 · 2020年4月24日

密歇根大学最新28页综述论文《GANs生成式对抗网络综述：算法、理论与应用》，带你全面了解GAN技术趋势

密歇根大学最新28页综述论文《GANs生成式对抗网络综述：算法、理论与应用》，带你全面了解GAN技术趋势

极市平台

19+阅读 · 2020年2月17日

【微软Alekh等开放新书】强化学习理论与算法，83页pdf，了解最新进展

【微软Alekh等开放新书】强化学习理论与算法，83页pdf，了解最新进展

专知

25+阅读 · 2019年11月23日

当深度强化学习遇见图神经网络

当深度强化学习遇见图神经网络

专知

227+阅读 · 2019年10月21日

AAAI 2019 四个杰出论文奖论文揭晓

AAAI 2019 四个杰出论文奖论文揭晓

算法与数学之美

5+阅读 · 2019年5月11日

【伯克利博士论文】如何让机器人多技能？通过最大熵强化学习(107页pdf)

【伯克利博士论文】如何让机器人多技能？通过最大熵强化学习(107页pdf)

专知

12+阅读 · 2018年12月22日

MIT科学家Dimitri P. Bertsekas最新2019出版《强化学习与最优控制》(附书稿PDF&讲义)

MIT科学家Dimitri P. Bertsekas最新2019出版《强化学习与最优控制》(附书稿PDF&讲义)

机器之心

25+阅读 · 2018年12月19日

斯坦福陈丹琦博士论文：神经网络阅读理解与更多【附156页pdf】

斯坦福陈丹琦博士论文：神经网络阅读理解与更多【附156页pdf】

专知

62+阅读 · 2018年12月15日

学界 | 面向无监督任务：DeepMind提出神经离散表示学习生成模型VQ-VAE

学界 | 面向无监督任务：DeepMind提出神经离散表示学习生成模型VQ-VAE

机器之心

6+阅读 · 2017年11月10日

人类：“共同探索围棋极限！”新AlphaGo：“不了吧，我到了。”

人类：“共同探索围棋极限！”新AlphaGo：“不了吧，我到了。”

PingWest品玩

4+阅读 · 2017年10月20日

相关论文

Seeing What a GAN Cannot Generate

Seeing What a GAN Cannot Generate

Arxiv

8+阅读 · 2019年10月24日

Keyphrase Generation for Scientific Articles using GANs

Keyphrase Generation for Scientific Articles using GANs

Arxiv

8+阅读 · 2019年9月24日

Lipschitz Generative Adversarial Nets

Arxiv

8+阅读 · 2019年2月15日

Energy-Based Hindsight Experience Prioritization

Arxiv

3+阅读 · 2018年10月8日

High-Resolution Image Synthesis and Semantic Manipulation with Conditional GANs

High-Resolution Image Synthesis and Semantic Manipulation with Conditional GANs

Arxiv

3+阅读 · 2018年8月20日

Improving Image Captioning with Conditional Generative Adversarial Nets

Arxiv

9+阅读 · 2018年5月18日

Adversarial Binary Coding for Efficient Person Re-identification

Arxiv

4+阅读 · 2018年4月6日

High-Resolution Deep Convolutional Generative Adversarial Networks

Arxiv

8+阅读 · 2018年1月27日

MR image reconstruction using deep density priors

Arxiv

5+阅读 · 2018年1月17日

Demystifying MMD GANs

Arxiv

12+阅读 · 2018年1月12日

微信扫码咨询专知VIP会员