《星际争霸2》也沦陷，AI终于赢了人类

会员服务 ·

《星际争霸2》也沦陷，AI终于赢了人类

2019 年 1 月 25 日 科技美学

之前AI打败柯洁的时候你们就在喊，有本事打星际啊！现在你们的愿望成真了，AI真的去打星际了。

Google DeepMind的最新AI人工智能程序“AlphaStar”以两个5:0连续血洗《星际争霸2》职业选手TLO、MaNa，只是在随后的一场表现赛中输给了MaNa。

其中，TLO是Liquid战队的虫族选手，目前世界排名第68，MaNa则是2018年WSC大赛的奥斯汀站亚军，神族选手，世界排名第19。

这次是AlphaStar首次公开亮相，比赛用的游戏版本是4.6.2，只进行神族内战，固定在Catalyst LE地图。

尤其令人称奇的是，AlphaStar与两位人类对手的比赛相隔只有两周，就迅速自学成才，对战TLO时虽然完胜但表现还相当菜鸟，而对战MaNa的时候已经有了几乎的完美，非人类的操作让人猝不及防。

DeepMind科学家Oriol Vinyals、David Silver介绍说，AlphaStar的训练首先是模仿学习，训练大量的比赛回放资料，让AI通过观察一个人所处的环境，尽可能地模仿某个特定的动作，从而理解游戏基本知识。

然后使用“Alpha League”循环比赛方法，先对比从人类数据中训练出来的神经网络，然后逐次迭代，产生新的Agent和分支，使其发展壮大。

接下来，这些Agent通过强化学习过程与Alpha League中的其他竞争对手进行比赛，尽可能有效地击败所有这些不同的策略，并调整个人学习目标，鼓励竞争对手朝特定方式演进，比如说获得特定奖励。

最后在Alpha League中选择最不容易被利用的Agent，称之为“The nash of League”，去挑战人类。

至于为何选择《星际争霸2》，主要是因为这款游戏具备策略性、竞争性的特性，需要即时做出大量决策，是非常有趣和复杂的游戏，在全球都很火爆，每年都有大量的比赛，有着海量的玩家基础。

虽然挑战的并不是排行前三的大佬，但是这个成绩也已经足够优秀了。你们觉得AI什么时候能将世界前三都战胜呢？

近期文章精选：

又一款无孔手机？vivo APEX 2019媒体沟通会圆满结束

▼

商务合作 kejimeixue@163.com

登录查看更多

相关内容

Google DeepMind

关注 68

Google DeepMind 是一家英国的人工智能公司。公司创建于 2010 年，最初名称是 DeepMind 科技，在 2014 年被谷歌收购。

【ICML2020-天津大学】多智能体深度强化学习中的Q值路径分解

专知会员服务

81+阅读 · 2020年7月2日

深度强化学习策略梯度教程，53页ppt

专知会员服务

184+阅读 · 2020年2月1日

纽约大学AI Now研究所发布《AI Now 2019 年度人工智能报告》, 100页pdf

专知会员服务

37+阅读 · 2019年12月18日

【强化学习】深度强化学习初学者指南

专知会员服务

184+阅读 · 2019年12月14日

【伯克利Pieter Abbeel教授报告@CMU】元学习与深度强化学习的机器人应用，84页ppt

专知会员服务

34+阅读 · 2019年11月26日

天才也勤奋！DeepMind哈萨比斯自述：领导400名博士向前，每天工作至凌晨4点

量子位

8+阅读 · 2018年12月17日

也许你的AI能打败韩国人，LOL数据集DeepLeague正式开源

论智

5+阅读 · 2018年1月25日

【AlphaGo Zero】AlphaGo Zero横空出世，DeepMind Nature论文解密不使用人类知识掌握围棋

产业智能官

5+阅读 · 2018年1月8日

人类：“共同探索围棋极限！”新AlphaGo：“不了吧，我到了。”

PingWest品玩

4+阅读 · 2017年10月20日

DeepMind发布《星际争霸 II》深度学习环境

人工智能学家

9+阅读 · 2017年9月22日

Q-value Path Decomposition for Deep Multiagent Reinforcement Learning

Arxiv

26+阅读 · 2020年2月10日

Relational Deep Reinforcement Learning

Arxiv

10+阅读 · 2018年6月28日

A Tour of Reinforcement Learning: The View from Continuous Control

Arxiv

6+阅读 · 2018年6月25日

Do deep reinforcement learning agents model intentions?

Arxiv

5+阅读 · 2018年5月21日

Multiagent Soft Q-Learning

Arxiv

11+阅读 · 2018年4月25日

VIP会员