AlphaGo Zero横空出世,人机围棋大战正式收官:以后不会再有这样的战争了

2017 年 10 月 19 日 36氪 36氪新媒体


2017年,当之无愧地可以称之为,人工智能元年,在这一年中,每个人都对AI时代的来临,有或多或少的感知,甚至为此而担忧,而兴奋,而恐惧。


那么我们究竟应该如何面对即将来临的AI时代呢?



文 | 姜涛、萝卜

资料整理 | 36氪新媒体



每一个时代的终结,都是另一个时代的开始。


2017年10月19日凌晨,谷歌下属公司 Deepmind 在《自然》(Nature)刊文,报告了新版、也是终版围棋程序:AlphaGo Zero,这个程序可以从空白状态学起,在无任何人类输入的条件下,迅速自学围棋,并已经以100:0的战绩击败老版 AlphaGo。


至此,持续近两年的围棋“人机大战”可以说真正落下了帷幕,而AlphaGo也在不断学习中,走向了自己的终极状态——AlphaGo Zero。


  • 2016年1月27日,国际顶尖期刊《自然》封面文章报道,谷歌研究者开发的名为“阿尔法围棋”(AlphaGo)的人工智能机器人,在没有任何让子的情况下,以5:0完胜欧洲围棋冠军、职业二段选手樊麾。

  • 2016年3月9日,韩国首尔四季酒店,在谷歌发起的“人机大战”第一局中,手握14个世界冠军头衔的韩国围棋天王李世石轰然倒下,最终AlphaGo以4:1赢得这场比赛。

  • 17年年初,AlphaGo化身Master后创造了连续60场对人类不败的恐怖战绩,因此围棋界都希望能够有一名大神站出来打败AlphaGo,以证明人类的实力。

  • 17年5月23日-27日,AlphaGo将与柯洁等为代表的中国顶尖棋手进行围棋对弈。且与去年AlphaGo与李世石对战时采用的五局三胜制度不同,本次柯洁与AlphaGo的对决将通过三局两胜来定出胜负。最终柯洁负于AlphaGo,与此同时,阿尔法围棋团队宣布阿尔法围棋将不再参加围棋比赛。

  • 17年10月19日,DeepMind今天发布新版本AlphaGo程序,经过三天的训练,该系统能够击败AlphaGo Lee,后者是去年击败了韩国选手李世石,胜率是100比0。经过大约40天的训练后,AlphaGo Zero完胜AlphaGo Master。


在今天的新闻中,我们注意到,DeepMind这篇最新的Nature,名字简单直接:《不使用人类知识掌握围棋》。

也就是说,AlphaGo Zero 与 AlphaGo 不同,它不是通过“学习”人类棋手的经验提升自己,而是利用了一种新的强化学习方式,在这个过程中,简而言之,AlphaGo Zero 成为自己的老师。


人工智能新媒体新智元如此解读:


这个系统从一个对围棋游戏完全没有任何知识的神经网络开始。然后,通过将这个神经网络与一种强大的搜索算法相结合,它就可以自己和自己下棋了。在它自我对弈的过程中,神经网络被调整、更新,以预测下一个落子位置以及对局的最终赢家。


这种技术比上一版本的 AlphaGo 更强大,因为它不再受限于人类知识的局限。相反,它可以从一张白纸的状态开始,从世界上最强大的围棋玩家——AlphaGo 自身——学习。


它从一定程度上说明:算法这一次赢了大数据。


在AlphaGo时代,人类棋谱的输入成为其自我学习的重要依据,而从其与李世石、柯洁的对战中我们也能发现,它其实是在“模仿”人类棋手的招数后,才有一些突破人类认知的“狗招”。


而在人工智能界,从来都有这样的争论和热议,这次AlphaGo Zero的横空出世,或许又会将算法和数据的讨论推上又一个高潮。


那人类呢?


在今天凌晨,曾与AlphaGo有过交战的柯洁在第一时间做出回应,柯洁表示,“对于AlphaGo的自我进步来讲...人类太多余了”。

当人类的世界第一发出了这样的感慨,似乎在围棋这项运动中,再无人机对战的必要,无论是为了真实的对抗,还是推广的噱头。


事实上,人工智能在这一年,以从未有过的速度,不断刷新着人类对科技的认知:


2017年年初,《未来简史》进入中国读者的视界,其作者年轻的以色列历史学家尤瓦尔赫拉里预言:二三十年内,超过50%工作会被人工智能取代;


2017年2月,有媒体曝出,高盛在总部的现金股票交易柜台仅剩下2名交易员“看守”,而其在巅峰时期拥有600名交易员,其余交易员均已被机器取代;


2017年4月10号,德扑人机大战正式结束,在5天比赛里,中国龙之队全部输给了人工智能“冷扑大师”,共输掉792327分;


2017年5月27日,AlphaGo与人类连战三盘,人类全负,基本宣告人机大战的结束,而同时,AlphaGo也被中国围棋协会授予了“职业九段证书”;


2017年下半年,BAT包括小米、京东纷纷入局人工智能音箱领域,而同时,百度也凭借着人工智能战略重新迎得市值新高,大公司人工智能之战,一触即发;


2017年9月,iPhone 发布新机,芯片的升级、人脸识别的应用、相机功能的提升...都与人工智能息息相关,人工智能也与人类的生活,越来越近。


2017年,当之无愧地可以称之为,人工智能元年,并不是在这一年中技术有多么迅猛的进步,而是在这一年中,每个人都对AI时代的来临,有或多或少的感知,甚至为此而担忧,而兴奋,而恐惧。


人类会不会被人工智能所取代?

人类如何与人工智能和谐共处?

人工智能在带来便利的同时,究竟有哪些弊端?

......


我相信,无数人在柯洁失利,也在今天看到AlphaGo Zero的新闻后,有过与上面问题类似的思考。


今天,一位网友在柯洁的微博下留言:


你看,汽车发明了,人类一样在奔跑,船发明了,游泳也没有被抛弃。竞技体育的魅力在于追求人类的极限,更快,更高,更强,还有像围棋这样,挑战脑力的极致,是人类不断进步,不断突破自我的一个过程。享受这个过程吧,少年,你是千千万万人中的被选中的那一个。


这正是我们想说的,今天 AlphaGo Zero 的诞生,并不意味着人类无用了。


我们知道,很多人在观望,在担忧,甚至在咒骂这些变化,深怕人工智能会给这个世界带来“毁灭性”的影响。但我们,36氪,坚信人工智能会带来更好的未来,人工智能的进步和升级,也绝不是所谓“人类毁灭”的开始。


是的,在人工智能时代即将来临的前夜,我们选择相信。



我们就这则新闻采访了几个业内人士,他们是如何评价这次事件的意义呢?


@深知科技CEO  陈辉


这则新闻发生的根本原因还是人类知识的局限性——几千年来人类棋手所做的努力,只是在茫茫参数空间的局部最优解附近扰动,阿尔法狗先前版本是被人类数据带到了坑里,新版本抛弃了人类的局限,自我探索到了更优的解。


@差评主编  Dawn


这意味着 Deepmind 背后 Google 的 TensorFlow 算法的优越性和相应运算核心 TPU 的强悍,张量运算及其思路将会在更多基于搜索树下的人工智能场景,这也是为什么 Google 把 Deepmind 剥离出来变成 Aphabet 的子公司,Deepmind 与 Google 由从属关系变成了兄弟平级关系!这说明人工智能真正成熟了,变成了巨头真正愿意发力的地方。


@36氪深度报道部记者  孙然


目前的人工智能,并不完全像它听上去那么高大上——往机器输入原始数据,变魔术般机器就呈现一个经过精确计算的方案,这只是个神话版本。就好比最初版本的AlphaGo的本事,都是根据此前人类棋手下过的棋局训练出来的。大量人工智能产品背后,都有人力数据工厂在支撑,大量工人做着数据清洗、加工、标注这些繁重并有些枯燥的工作,然后把这些半成品输送给人工智能。


AlphaGo Zero的技术路径,让AI能摆脱人类的数据喂养。这意味着AI会避开人类思维的局限性去探索这个世界,更实际地说,至少对于那些满大街找数据的AI公司而言,这可省去了不少功夫。


@经纬中国 AI领域资深投资经理  黎竹岩


如果是在封闭环境下,比如围棋博弈,因为游戏规则是确定的,也没有外部的随机因素,人工智能可以在短时间内取得惊人的成就。但如果不是封闭环境,人工智能带给我们的惊喜就要小得多,因为应用场景内的基础设施很可能还没跟上。我们今天做不好智能家居系统,很重要的一个原因是基础建设不到位。中国家庭还没有大规模铺设能够捕捉居住者日常行为的传感器,也没有针对这些传感器所捕捉的数据做分析,自然也就轮不到人工智能去指挥什么应用。我们今天看到的Alexa以及各类智能音箱,其实只是智能家居的一个剪影。真正的智能家居不会只依赖语音信号。


基础建设到位之后,人工智能的威力可能会快速释放出来,但在此之前,过度想象没有必要。


@线性资本投资经理  金异开


把Alpha Zero翻译成“元”是一个非常高明的译法,在汉语中,元经常被用来指万物之本——道。《说文》里说“元,始也。”反映到Alpha Zero中,它不需要学习大量被人类标注过的样本,只要教会它围棋的基本规则,通过纯强化学习的方法,将policy network和value network两个网络整合到一个架构中,也能够实现对人类的超越。这对创业公司来说绝对是一大利好,因为他们很可能不需要依附于大公司的海量数据也能训练出很好的模型。


当然,我们对这个事件还是相对保持冷静的,从学术研究到工程落地还有很长的路要走。也许Alpha Zero最大的意义在于以后写论文不需要写文献综述了:P



推荐阅读

点击下方图片即可阅读


柯洁赛后哽咽:我会继续改变自己,而AlphaGo将会继续改变世界

登录查看更多
0

相关内容

AlphaGo 是一款人工智能围棋程序,由被 Google 收购的 DeepMind 公司开发。 2015年10月,AlphaGo v13 在与职业棋手、欧洲冠军 樊麾二段 的五番棋比赛中,以 5:0 获胜。2016年3月9日 - 15日,AlphaGo v18 在与韩国职业棋手 李世石九段 的五番棋比赛中,以 4:1 获胜,赛后,AlphaGo 荣获韩国棋院授予的「第〇〇一号 名誉九段」证书。2016年7月19日,AlphaGo 在 GoRantings 世界围棋排名中超过柯洁,成为世界第一。
【ICMR2020】持续健康状态接口事件检索
专知会员服务
17+阅读 · 2020年4月18日
Python数据分析:过去、现在和未来,52页ppt
专知会员服务
99+阅读 · 2020年3月9日
谷歌机器学习速成课程中文版pdf
专知会员服务
145+阅读 · 2019年12月4日
一张图看懂AlphaGo Zero
AI前线
6+阅读 · 2017年11月17日
最可怕的不是被机器淘汰,而是……
全球创新论坛
18+阅读 · 2017年10月28日
已删除
将门创投
5+阅读 · 2017年10月20日
Multi-task Deep Reinforcement Learning with PopArt
Arxiv
4+阅读 · 2018年9月12日
VIP会员
相关VIP内容
Top
微信扫码咨询专知VIP会员