战网AI危机！AlphaStar匿名潜入星际2天梯PK，进化版让人类玩家瑟瑟发抖

会员服务 ·

战网AI危机！AlphaStar匿名潜入星际2天梯PK，进化版让人类玩家瑟瑟发抖

2019 年 7 月 11 日 中国人工智能学会

乾明栗子发自凹非寺
量子位报道 | 公众号 QbitAI

把自己虐到爆的对手，到底是人还是AI？

对于一些星际争霸II玩家来说，再也没法明确回答了。

刚刚，星际争霸官方宣布，DeepMind研发的AI——AlphaStar将登录游戏平台战网，匿名进行天梯匹配。

消息公布之后，哀嚎一片，因为AlphaStar真的太强了。

今年1月份的人机大赛中，人类职业选手LiquidMaNa只在它面前坚持了5分36秒，就GG了。最后，AlphaStar以总比分10-1，击溃人类职业高手。

全能职业选手TLO在落败后感叹，和AlphaStar比赛很难。不像和人在打，有种手足无措的感觉。

而现在，AlphaStar又变强了：神族、人族、虫族都可以玩，还解锁了许多地图。

但DeepMind表示，也不会欺负人类，APM (手速) 、视野都跟人类玩家保持一致。

瑟瑟发抖之余，不少网友也表现出了期待之情，要去跟AlphaStar干上一场。

三个重大变化

遥想1月的人机大战，只限于神族和神族之间的战斗。

TLO在完败之后，还有些后悔：多练习一下神族就好了。

但如今，不止是神族的问题了。

如今的AlphaStar也能玩人族和虫族，而且对手也可以在神族、人族或虫族中任意选择，擅长哪一族就用哪一族。

DeepMind星际团队的主要大佬Oriol Vinyals总结的三大变化，第一点便是全部种族的解锁。

第二点，是新的AlphaStar已经能打许多不同的天梯地图：

第三点，也是非常重要的一点，AI的手速和视野，都回到了和人类同样的起跑线上。

1月和人类职业选手对战过后，AlphaStar曾经受到了严重的质疑，APM最高飙到了1500以上，相当于每秒25次操作，并且维持了5秒。

相比之下，人类选手即便能短暂地爆发到800+，通常也只有几分之一秒。

DeepMind说，这次进入天梯的AlphaStar，手速有了更加严格的限制。

而在视野上，AI将会与人类玩家的视角一样，不会接收到对手的信息，除非对手出现在视野之内。并且，也只能把各种单位移到视野之内的地方。

走，和AlphaStar匹配一波

那么，AlphaStar在哪里呢？

DeepMind说，它们会在最新版本的星际2里面出现，只会在1v1天梯里匹配。

为什么是“它们”？AlphaStar并不是一只AI。是许多个测试版本，会集体涌入天梯。

(其实，1月TLO和MaNa面对的也不是一只AI，每一局对手都是全新的。)

匹配规则，和正常的比赛一样。人类与AI对战的输赢，也会影响MMR。

不过，人类玩家不会知道对面是不是AI，它们都是匿名的。

那为什么要匿名？

团队说，DeepMind在测试各种版本的表现，要给AI做一个Benchmark (基线) 。

所以，希望对面的人类玩家，都用常见的策略组合去打。匿名的话，玩家不受到对手身份的影像，能让AI的游戏体验最大限度地接近普通的1v1天梯赛。

除此之外，匿名还有助于保证每场比赛都在相同的条件下进行。

可是，AlphaStar连职业选手都不放在眼里，打业余玩家岂不是白给？

可以不去当炮灰么？

可以，只有选择“Opt-In”才有可能匹配到AI。并且，就算手滑了也可以后悔退出AI匹配。

那AlphaStar打天梯，会不会越打越强啊？

DeepMind说不会，这一轮人机对战的数据，只会用来分析和评估AI的表现，不会拿来训练。

团队说，目前AlphaStar只用人类和人类的天梯比赛、以及AI与AI之间的比赛，作为训练数据。

不过，现在只有欧服玩家才可能遇到AlphaStar。所以在AI大举入侵国服之前，各位想不想跑到欧服去试一波？

一切为了通用人工智能

显然，DeepMind此举是为了研究。

他们表示，在AlphaStar打完足够多的比赛后，会利用这些结果为研究人工智能”添砖加瓦“。

之后，会发表经过同行评审的论文来公布研究结果，也将公布人机比赛的回放。

作为一款即时战略（RTS）游戏，星际2要求玩家能够处理“不完美信息博弈”，这与下围棋的AI有很大不同。

在围棋等棋类环境中，玩家做决策之前，所有的信息都能直接看到。在围棋里，动作空间只有361种；

而星际2中，动作空间大约是10^26，“战争迷雾”也会让你无法看到对方的操作、阴影中有哪些单位。

这意味着玩家的规划、决策、行动，要一段时间后才能看到结果。这类问题在现实世界中具有重要意义，也是打造通用人工智能过程中非常好的试炼场。

此外，AlphaStar的可能性，也不仅限于星际2。

DeepMind CEO哈萨比斯说，AlphaStar的技术未来可用于预测天气、气候建模等需要very long sequences的应用场景。

关于AlphaStar的更多技术实现细节、打败人类高手的过程记录，请看量子位先前报道：

1-10落败，5分钟崩盘！星际2职业高手史上首次被AI击溃，AlphaStar一战成名

— 完 —

AI社群 | 与优秀的人交流

AI内参 | 关注行业发展

量子位 QbitAI · 头条号签约作者

վ'ᴗ' ի 追踪AI技术和产品新动态

喜欢就点「在看」吧 !

登录查看更多

相关内容

DeepMind

关注 0

【牛津大学博士论文】基于强化学习的无地图机器人导航，Reinforcement Learning Based MRN

专知会员服务

122+阅读 · 2020年5月18日

【经典书】《算法精解：C语言描述》，562页pdf，Mastering Algorithms with C

专知会员服务

107+阅读 · 2020年4月25日

【ICML2020投稿论文-DeepMind】时序差分学习的推理与泛化，Temporal Difference Learning

专知会员服务

26+阅读 · 2020年3月16日

2019必读的十大深度强化学习论文

专知会员服务

59+阅读 · 2020年1月16日

纽约大学AI Now研究所发布《AI Now 2019 年度人工智能报告》, 100页pdf

专知会员服务

37+阅读 · 2019年12月18日

【强化学习】碾压人类的超级多智能体如何训练？从认知学到进化论，详述强化学习两大最新突破

产业智能官

14+阅读 · 2019年6月13日

瑟瑟发抖……神经网络可能在欺骗你！

专知

5+阅读 · 2018年6月4日

【AlphaGo Zero】AlphaGo Zero横空出世，DeepMind Nature论文解密不使用人类知识掌握围棋

产业智能官

5+阅读 · 2018年1月8日

人类：“共同探索围棋极限！”新AlphaGo：“不了吧，我到了。”

PingWest品玩

4+阅读 · 2017年10月20日

DeepMind发布《星际争霸 II》深度学习环境

人工智能学家

9+阅读 · 2017年9月22日

Reinforcement Learning Enhanced Quantum-inspired Algorithm for Combinatorial Optimization

Arxiv

4+阅读 · 2020年2月14日

Generalization and Regularization in DQN

Arxiv

6+阅读 · 2019年1月30日

Relational Deep Reinforcement Learning

Arxiv

10+阅读 · 2018年6月28日

Hierarchical Reinforcement Learning with Deep Nested Agents

Arxiv

3+阅读 · 2018年5月18日

Cellular-Connected UAVs over 5G: Deep Reinforcement Learning for Interference Management

Arxiv

4+阅读 · 2018年1月16日

VIP会员