【NIPS2017最佳论文三分钟视频简介】CMU「冷扑大师」不完美信息博弈研究

2017 年 11 月 30 日 专知 专知内容组(编)

点击上方“专知”关注获取专业AI知识!

【导读】NIPS 2017 开幕还有几天,最佳论文已经公布,CMU教授Tuomas Sandholm 和其博士生 Noam Brown 《Safe and Nested Subgame Solving for Imperfect-Information Games》获得了 NIPS-17 最佳论文。近日Noam Brown发布视频解读论文「冷扑大师」不完美信息博弈研究


▌视频




视频带英文字幕地址:https://v.qq.com/x/page/m0512q8uppm.html


▌文章信息




Safe and Nested Subgame Solving for Imperfect-Information Games

论文链接:https://arxiv.org/abs/1705.02955


和完美信息博弈不同,不完美信息博弈不能通过将博弈分解为可独立求解的子博弈而求得占优策略。因此我们越来越多地使用计算密集的均衡判定技术,并且所有的决策必须将博弈的策略当做一个整体。由于不能通过精确的分解来解决不完美信息博弈,人们开始考虑近似解,或通过解决不相交的子博弈提升当前结果。这个过程被称为子博弈求解(subgame solving)。我们提出了一种无论在理论上还是在实践上都超越了之前方法的子博弈求解技术。我们还展示了如何对它们和以前的子博弈求解技术进行调整,以对超出初始行动提取(original action abstraction)的对手的行动做出应答;这远远超越了之前的顶尖方法,即行动转化(action translation)。最后,我们展示了当博弈沿着博弈树向下进行时,子博弈求解可能会重复进行,从而大大降低可利用性。我们应用这些技术开发了能在一对一无限注德州扑克单挑中打败顶尖人类选手的第一个 AI。

-END-

专 · 知

人工智能领域主题知识资料查看获取【专知荟萃】人工智能领域23个主题知识资料全集(入门/进阶/论文/综述/视频/专家等)

请PC登录www.zhuanzhi.ai或者点击阅读原文,注册登录专知,获取更多AI知识资料

请扫一扫关注专知公众号,获取人工智能的专业知识。

请加专知小助手微信(Rancho_Fang),加入专知主题群(请备注主题类型:AI、NLP、CV、 KG等,或者加小助手咨询入群)交流~


点击“阅读原文”,使用专知!

登录查看更多
5

相关内容

少标签数据学习,54页ppt
专知会员服务
198+阅读 · 2020年5月22日
【Google-CMU】元伪标签的元学习,Meta Pseudo Labels
专知会员服务
31+阅读 · 2020年3月30日
深度强化学习策略梯度教程,53页ppt
专知会员服务
178+阅读 · 2020年2月1日
AAAI2020接受论文列表,1591篇论文目录全集
专知会员服务
98+阅读 · 2020年1月12日
【课程】概率图模型,卡内基梅隆大学邢波
专知会员服务
69+阅读 · 2019年11月4日
【资源】强化学习实践教程
专知
43+阅读 · 2019年9月11日
UC伯克利Pieter Abbeel谈论强化学习-视频
专知
7+阅读 · 2018年12月17日
深度强化学习简介
专知
30+阅读 · 2018年12月3日
【微软亚研130PPT教程】强化学习简介
专知
36+阅读 · 2018年10月26日
ICML2018 模仿学习教程
专知
6+阅读 · 2018年7月14日
NIPS 2017最佳论文出炉:CMU「冷扑大师」不完美信息博弈研究获奖
Multi-Grained Named Entity Recognition
Arxiv
6+阅读 · 2019年6月20日
Arxiv
26+阅读 · 2019年3月5日
The Matrix Calculus You Need For Deep Learning
Arxiv
12+阅读 · 2018年7月2日
VIP会员
相关资讯
【资源】强化学习实践教程
专知
43+阅读 · 2019年9月11日
UC伯克利Pieter Abbeel谈论强化学习-视频
专知
7+阅读 · 2018年12月17日
深度强化学习简介
专知
30+阅读 · 2018年12月3日
【微软亚研130PPT教程】强化学习简介
专知
36+阅读 · 2018年10月26日
ICML2018 模仿学习教程
专知
6+阅读 · 2018年7月14日
NIPS 2017最佳论文出炉:CMU「冷扑大师」不完美信息博弈研究获奖
Top
微信扫码咨询专知VIP会员