战网AI危机!AlphaStar匿名潜入星际2天梯PK,进化版让人类玩家瑟瑟发抖

2019 年 7 月 11 日 中国人工智能学会
乾明 栗子 发自 凹非寺 
量子位 报道 | 公众号 QbitAI

把自己虐到爆的对手,到底是人还是AI?

对于一些星际争霸II玩家来说,再也没法明确回答了。

刚刚,星际争霸官方宣布,DeepMind研发的AI——AlphaStar将登录游戏平台战网,匿名进行天梯匹配。

消息公布之后,哀嚎一片,因为AlphaStar真的太强了。

今年1月份的人机大赛中,人类职业选手LiquidMaNa只在它面前坚持了5分36秒,就GG了。最后,AlphaStar以总比分10-1,击溃人类职业高手。

全能职业选手TLO在落败后感叹,和AlphaStar比赛很难。不像和人在打,有种手足无措的感觉。

而现在,AlphaStar又变强了:神族、人族、虫族都可以玩,还解锁了许多地图。

但DeepMind表示,也不会欺负人类,APM (手速) 、视野都跟人类玩家保持一致。

瑟瑟发抖之余,不少网友也表现出了期待之情,要去跟AlphaStar干上一场。

三个重大变化

遥想1月的人机大战,只限于神族和神族之间的战斗。

TLO在完败之后,还有些后悔:多练习一下神族就好了。

但如今,不止是神族的问题了。

如今的AlphaStar也能玩人族和虫族,而且对手也可以在神族、人族或虫族中任意选择,擅长哪一族就用哪一族。

DeepMind星际团队的主要大佬Oriol Vinyals总结的三大变化,第一点便是全部种族的解锁。

第二点,是新的AlphaStar已经能打许多不同的天梯地图:

第三点,也是非常重要的一点,AI的手速和视野,都回到了和人类同样的起跑线上。

1月和人类职业选手对战过后,AlphaStar曾经受到了严重的质疑,APM最高飙到了1500以上,相当于每秒25次操作,并且维持了5秒。

相比之下,人类选手即便能短暂地爆发到800+,通常也只有几分之一秒。

DeepMind说,这次进入天梯的AlphaStar,手速有了更加严格的限制。

而在视野上,AI将会与人类玩家的视角一样,不会接收到对手的信息,除非对手出现在视野之内。并且,也只能把各种单位移到视野之内的地方。

走,和AlphaStar匹配一波

那么,AlphaStar在哪里呢?

DeepMind说,它们会在最新版本的星际2里面出现,只会在1v1天梯里匹配。

为什么是“它们”?AlphaStar并不是一只AI。是许多个测试版本,会集体涌入天梯。

(其实,1月TLO和MaNa面对的也不是一只AI,每一局对手都是全新的。)

匹配规则,和正常的比赛一样。人类与AI对战的输赢,也会影响MMR。

不过,人类玩家不会知道对面是不是AI,它们都是匿名的。

那为什么要匿名?

团队说,DeepMind在测试各种版本的表现,要给AI做一个Benchmark (基线) 。

所以,希望对面的人类玩家,都用常见的策略组合去打。匿名的话,玩家不受到对手身份的影像,能让AI的游戏体验最大限度地接近普通的1v1天梯赛。

除此之外,匿名还有助于保证每场比赛都在相同的条件下进行。

可是,AlphaStar连职业选手都不放在眼里,打业余玩家岂不是白给?

可以不去当炮灰么?

可以,只有选择“Opt-In”才有可能匹配到AI。并且,就算手滑了也可以后悔退出AI匹配。

那AlphaStar打天梯,会不会越打越强啊?

DeepMind说不会,这一轮人机对战的数据,只会用来分析和评估AI的表现,不会拿来训练。

团队说,目前AlphaStar只用人类和人类的天梯比赛、以及AI与AI之间的比赛,作为训练数据。

不过,现在只有欧服玩家才可能遇到AlphaStar。所以在AI大举入侵国服之前,各位想不想跑到欧服去试一波?

一切为了通用人工智能

显然,DeepMind此举是为了研究。

他们表示,在AlphaStar打完足够多的比赛后,会利用这些结果为研究人工智能”添砖加瓦“。

之后,会发表经过同行评审的论文来公布研究结果,也将公布人机比赛的回放。

作为一款即时战略(RTS)游戏,星际2要求玩家能够处理“不完美信息博弈”,这与下围棋的AI有很大不同。

在围棋等棋类环境中,玩家做决策之前,所有的信息都能直接看到。在围棋里,动作空间只有361种;

而星际2中,动作空间大约是10^26,“战争迷雾”也会让你无法看到对方的操作、阴影中有哪些单位。

这意味着玩家的规划、决策、行动,要一段时间后才能看到结果。这类问题在现实世界中具有重要意义,也是打造通用人工智能过程中非常好的试炼场。

此外,AlphaStar的可能性,也不仅限于星际2。

DeepMind CEO哈萨比斯说,AlphaStar的技术未来可用于预测天气、气候建模等需要very long sequences的应用场景。

关于AlphaStar的更多技术实现细节、打败人类高手的过程记录,请看量子位先前报道:

1-10落败,5分钟崩盘!星际2职业高手史上首次被AI击溃,AlphaStar一战成名

AI社群 | 与优秀的人交流



AI内参 | 关注行业发展

量子位 QbitAI · 头条号签约作者

վ'ᴗ' ի 追踪AI技术和产品新动态

喜欢就点「在看」吧 ! 



登录查看更多
1

相关内容

专知会员服务
37+阅读 · 2020年6月7日
2019必读的十大深度强化学习论文
专知会员服务
58+阅读 · 2020年1月16日
【强化学习】深度强化学习初学者指南
专知会员服务
180+阅读 · 2019年12月14日
论强化学习的根本缺陷
AI科技评论
11+阅读 · 2018年7月24日
瑟瑟发抖……神经网络可能在欺骗你!
专知
5+阅读 · 2018年6月4日
DeepMind发布《星际争霸 II》深度学习环境
人工智能学家
8+阅读 · 2017年9月22日
AI都干过什么让人细思极恐的事?
全球创新论坛
4+阅读 · 2017年9月15日
Generalization and Regularization in DQN
Arxiv
6+阅读 · 2019年1月30日
Hierarchical Deep Multiagent Reinforcement Learning
Arxiv
8+阅读 · 2018年9月25日
Relational Deep Reinforcement Learning
Arxiv
10+阅读 · 2018年6月28日
Arxiv
11+阅读 · 2018年4月25日
VIP会员
Top
微信扫码咨询专知VIP会员