DOTA2人机决战:2:0!OpenAI击败世界冠军OG

2019 年 4 月 14 日 AI100


整理 | 一一

出品 | AI科技大本营(ID:rgznai100)


今天凌晨 6 点,OpenAI Five Finals 决战紫禁之巅一战,OpenAI Five 第一次战胜世界冠军 OG,比分为2:0。


这场比赛多少还有些人对人类战胜 AI 存有信念,因为OG 团队的 5 位顶级 Dota 2 职业选手是去年 TI8 的冠军,而 OpenAI Five 则在去年 8 月的两场表演赛中连续两场输给了实力一般的人类玩家。


但你们显然小瞧了 OpenAI Five 系统的迭代能力。


根据 OpenAI 联合创始人 Greg Brockman 的说法,这次的 OpenAI Five 是在加速的虚拟环境中进行不断更新的,“OpenAI Five 由深度强化学习提供支持,这意味着我们没有对其进行编程”。


那这次 OpenAI Five 系统究竟强在哪里?Brockman 解释,在其存在的 10 个月中,它已经玩了相当于 45000 年的 Dota2 比赛。这让它能轻松驾驭战略决策,并以惊人的判断力发挥其优势,让其看起来势不可挡。



Dota2 是一款极其复杂的战略游戏,涉及 115 个角色和深层技能树等,因此,OpenAI 在 AI 系统中比赛时会进行一定的限制,使得两队对战时有 17 个英雄可供选择。OpenAI 还选择了所谓的“Captain's Draft”的游戏模式,该模式使得每个团队战略性地禁止英雄,以防止另一团队在使用不同的挑选顺序前选择这些英雄角色。


这让队长在英雄组合中建立了优势,并且一旦团队开始逐一填写名单,就可以利用敌方英雄的弱点。与之前的比赛一样,OpenAI 也禁用了召唤和幻觉功能,这两项功能都涉及以英雄副本的形式引入其他变量。除此之外,游戏就像正常的 Dota2 比赛一样,其最终目标是摧毁敌方队伍的大型塔楼等目标。


在第一场比赛中,OpenAI Five 的表现让 OG 大吃一惊,它通过一系列激进战术来获得胜利,其中包括决定花了在游戏中赚取的钱,以便在死亡甚至在比赛的早期立即让英雄复活。


Greg Brockman 指出,OpenAI 喜欢有利于短期收益的战略,这揭示了其掌握人类擅长长期规划并且通常依赖于赢得此类战略竞赛的缺陷。无论如何,在这局比赛中,OpenAI Five 利用这一点建立了优势,当比赛拖到 30 分钟时,OG 团队看上去无能为力了。


第二场比赛,OpenAI Five 发挥得更好,在最初的几分钟内便对 OG 团队建立了优势,然后无情地打击了后者,最终仅用了打第一场比赛时的一半时间拿下了比赛。对于这句比赛,有网友称OpenAI Five 开始玩的异常激进,而 OG 在地图上进行抵御时暴露了其对策的弱点。


“靠,感觉我们注定赢不了,“OG 团队成员 Johan Sundstein 在输掉第二局后在Twitter说道,“一旦他们(AI)统治这个星球,希望他们(AI)能够记住,我们曾经多么善良有礼。”



从对战 DOTA 业余玩家到能够击败世界冠军,达到这一成就,从 OpenAI Five 面世到今只用了三年左右的时间。


2016 年,当 OpenAI 宣布他们要教一台计算机玩 DOTA 时,该公司更多认为他们可以在自动驾驶和翻译等棘手问题上取得进展,但出乎意料的是,AI 系统居然能与人类顶级玩家玩复杂的战略游戏,并且战胜人类。


2017 年,OpenAI 在 DOTA 的 1v1 比赛中战胜了职业玩家 Dendi。


2018 年 7 月,进阶版 OpenAI Five 系统战胜人类业余玩家,2018 年 8 月,它又以 2:1 的战绩再次完成对至少有 6000 天梯分的人类高级玩家进行“屠杀”。


不过,OpenAI 系统并非完美,在 2018 年国际锦标赛上,OpenAI Five 开始挑战职业队伍,两次输给人类职业玩家。


这三年来,AI正在战略游戏中以我们所想象不到的速度在更迭,就在今年 1 月,DeepMind 推出的 AlphaStar 在星际争霸2游戏中以 10:1 的成绩完虐人类,今天 OpenAI FIve 能在 DOTA2 中战胜人类,也可能并不会让我们感到非常吃惊。


此次比赛过后,OpenAI 组织表示将不再公开举办类似比赛,他们现在致力于开发软件,让人类与 OpenAI Five 系统进行实时协作,让人类玩家与机器人一起玩游戏,学习 AI 系统独特的战略和行为。OpenAI 还发布了一个平台,是供公众试玩的 OpenAI Five 竞技场模式 ,将于4月18日起开放三天。


OpenAI 表示,AI 系统协作软件可能永远不会向公众开放,但此类研究明显能让 AI 系统对人类社会未来的发展带来巨大的好处,比如 OpenAI 可能也会尝试将其 AI 系统用于视频游戏环境,当然,更重要的是将其 AI 技术应用于现实环境。同时,OpenAI 认为,他们正在揭开通往 AGI 道路的秘密。


相关链接:

https://www.theverge.com/2019/4/13/18309459/openai-five-dota-2-finals-ai-bot-competition-og-e-sports-the-international-champion

https://www.vox.com/2019/4/13/18309418/open-ai-dota-triumph-og


(本文为 AI大本营整理文章,转载请微信联系 1092722531


实习生招募


推荐阅读:


点击“阅读原文”,查看更多精彩文章。

登录查看更多
0

相关内容

OpenAI,由诸多硅谷大亨联合建立的人工智能非营利组织。2015年马斯克与其他硅谷科技大亨进行连续对话后,决定共同创建OpenAI,希望能够预防人工智能的灾难性影响,推动人工智能发挥积极作用。特斯拉电动汽车公司与美国太空技术探索公司SpaceX创始人马斯克、Y Combinator总裁阿尔特曼、天使投资人彼得·泰尔(Peter Thiel)以及其他硅谷巨头去年12月份承诺向OpenAI注资10亿美元。
商业数据分析,39页ppt
专知会员服务
160+阅读 · 2020年6月2日
少标签数据学习,54页ppt
专知会员服务
197+阅读 · 2020年5月22日
德勤:2020技术趋势报告,120页pdf
专知会员服务
190+阅读 · 2020年3月31日
2019必读的十大深度强化学习论文
专知会员服务
57+阅读 · 2020年1月16日
【强化学习】深度强化学习初学者指南
专知会员服务
179+阅读 · 2019年12月14日
DARPA | 世界上最大的“5G+AI+仿真”探索项目
走向智能论坛
30+阅读 · 2019年7月29日
如何用人工智能秒杀超级马里奥游戏
CSDN
4+阅读 · 2018年1月7日
Arxiv
9+阅读 · 2018年10月18日
Arxiv
3+阅读 · 2018年8月27日
VIP会员
相关VIP内容
商业数据分析,39页ppt
专知会员服务
160+阅读 · 2020年6月2日
少标签数据学习,54页ppt
专知会员服务
197+阅读 · 2020年5月22日
德勤:2020技术趋势报告,120页pdf
专知会员服务
190+阅读 · 2020年3月31日
2019必读的十大深度强化学习论文
专知会员服务
57+阅读 · 2020年1月16日
【强化学习】深度强化学习初学者指南
专知会员服务
179+阅读 · 2019年12月14日
Top
微信扫码咨询专知VIP会员