阿尔法狗项目结束!AlphaGo人肉臂黄士杰:我的使命完成

2017 年 12 月 14 日 乌镇智库 网易智能

黄士杰在DeepMind办公室

昨日凌晨,AlphaGo曾经的“代言人/人肉臂”、谷歌DeepMind科学家黄士杰(Aja Huang)博士今天凌晨在Facebook上发帖宣布,他本人将正式从AlphaGo团队离开,转到DeepMind其他项目的研究中去。

早在今年5月战胜世界围棋第一人柯洁后,DeepMind就曾宣布,从今往后AlphaGo项目将不会再继续开发,AlphaGo也不会再参加竞技比赛了。与此同时,DeepMind也初步披露了AlphaGo团队的下一步计划——研发出应用领域更广泛的算法,包括找到新的疾病治疗方法、显著降低能源消耗、发明革命性的新材料等。

黄士杰博士代为执子

11月27日,黄士杰在Facebook转发了一则关于DeepMind将与一些顶尖的研究机构共同投入诊断乳腺癌的AI研究消息,DeepMind将利用最新的机器学习技术,希望能够快速、准确地检测出癌症的迹象,帮助医生尽早发现癌症,以便更早的有效治疗,所以,他之后投身医疗研究的可能性非常大。

对于著名的AlphaGo、人机大战、柯洁,大家可能非常熟知了,但黄士杰是谁大家可能并不熟悉。

黄士杰博士是一名台湾工程师,AlphaGo的幕后推手,黄士杰从小热爱围棋,在台湾师大读书时就曾经创办了学校的围棋社,还曾获得大专杯围棋赛冠军,是个业余六段围棋选手,在校取得了辉煌成绩的黄士杰通过博士论文口试之后就被加拿大一所大学挖走,担任电脑围棋程序研究员,1年后被英国一家专门研究人工智能的公司DeepMind招揽,2014年,DeepMind公司被谷歌并购,黄士杰已经是公司内两位首席工程师之一。

从左至右,哈萨比斯、柯洁、席尔瓦

黄士杰至此开启了DeepMind生涯,有一天,席尔瓦走到黄士杰面前说:“Aja,我们准备启动一个围棋项目,最开始只有你和我”。2014年2月,AlphaGo项目正式启动,团队三个人:哈萨比斯、席尔瓦、黄士杰,哈萨比斯是整个公司的老板,席尔瓦是黄士杰的经理。所以,这个团队真正干活的只有黄士杰一个人。AlphaGo项目想搞出一个强大的围棋程序,并且沿着深度学习和强化学习的方向探索。

两年之后的2016年3月9日至15日,他们带着AlphaGo惊艳世人,从此所向披靡,战无不胜。

我们期待黄士杰的新征程,他不仅仅是人手臂,人工智能时代的大幕才刚刚开始!

所以,DeepMind团队带着新的使命,发表了全新的强化学习算法AlphaZero。

它是一种可以从零开始,通过自我对弈强化学习在多种任务上达到超越人类水平的新算法,堪称“通用棋类AI”。

据了解,AlphaZero算法可以在8个小时训练击败李世石版本AlphaGo;再用4小时训练击败世界顶级的国际象棋程序Stockfish;再用2小时训练击败世界顶级将棋程序Elmo。这是DeepMind团队继AlphaGo Zero的研究问世之后,带给我们的又一全新算法,它是“更通用的版本”。


此外,我们看到这次的AlphaZero与AlphaGo Zero有几点不同。

首先AlphaGo Zero是在假设结果为赢/输二元的情况下,对获胜概率进行估计和优化。而AlphaZero会将平局或其他潜在结果纳入考虑,对结果进行估计和优化。

其次,AlphaGo和AlphaGo Zero会转变棋盘位置进行数据增强,而AlphaZero不会。

第三,AlphaZero只维护单一的一个神经网络,这个神经网络不断更新,而不是等待迭代。

第四,AlphaZero中,所有对弈都重复使用相同的超参数,因此无需进行针对特定某种游戏的调整。


转载声明:本文转载自「网易智能」,搜索「smartman163」即可关注。

乌镇智库 资讯推荐

量子计算机重大突破:由硅制成的量子可控非门

 盘点人工神经网络超过人类的6个领域

2017 ACM Fellow名单出炉:杨强、马毅、芮勇等多位华人入选


推荐阅读

尼克谈人工智能的历史、现实与未来

“游戏是知识之源”--机器下期小史


登录查看更多
1

相关内容

就职于 Google DeepMind,AlphaGo 的主要设计者之一。围棋台湾业余6段。
一份循环神经网络RNNs简明教程,37页ppt
专知会员服务
173+阅读 · 2020年5月6日
Python数据分析:过去、现在和未来,52页ppt
专知会员服务
101+阅读 · 2020年3月9日
2019必读的十大深度强化学习论文
专知会员服务
59+阅读 · 2020年1月16日
最可怕的不是被机器淘汰,而是……
全球创新论坛
18+阅读 · 2017年10月28日
美国硅谷预测10年后的世界,再不懂你就落伍了
凤凰财经
4+阅读 · 2017年9月14日
Arxiv
5+阅读 · 2019年11月22日
Hierarchical Deep Multiagent Reinforcement Learning
Arxiv
8+阅读 · 2018年9月25日
Arxiv
4+阅读 · 2018年6月14日
Arxiv
5+阅读 · 2018年5月22日
Arxiv
7+阅读 · 2017年12月28日
VIP会员
相关VIP内容
Top
微信扫码咨询专知VIP会员