DeepMind黄士杰:深度学习有创造性,正参与星际2项目

2018 年 3 月 26 日 量子位 关注前沿科技
岳排槐 发自 凹非寺
量子位 出品 | 公众号 QbitAI

最近,AlphaGo“人肉臂”黄士杰回到台北参加了Google举办的一次人工智能论坛。并且发表了《AlphaGo与AI的黄金时代》演讲。

从小就喜欢围棋的黄士杰,求学期间就一直对围棋软件感兴趣。他在博士班期间开发了Erica,这个单机版本的围棋软件,当时打败了围棋领域最强的AI、使用了六台机器的Zen。

也正是如此,DeepMind的核心人物David Silver力邀黄士杰加盟,而后者也成为DeepMind第40号员工。

不过,他第一次踏进DeepMind那天,这家公司的创始人就跟他说,DeepMind并不打算朝围棋方向发展,因为他们的目标不是在特定领域成为最佳,而是希望搞出通用人工智能,让AI解决人类无法解决的问题。

但是,随着深度学习等技术的不断进步,DeepMind最后还是决定启动围棋项目。

为了研发出AlphaGo,DeepMind团队尝试过上百个想法,发展过程就是不停的实验、实验、实验,不停学习新理论。

实际上,在击败李世乭之后,DeepMind就曾打算终止AlphaGo项目,但是考虑到第四局犯下的错误,他们还是决定仍然使用神经网络把这个问题修正掉,毕竟有缺陷的AI会失去他人的信任。

这就有了后续AlphaGo的继续进步。

黄士杰表示,AlphaGo在围棋领域做出了很多令人震撼的下法,在国际象棋领域也是如此。黄士杰认为,这些都是深度学习具有“创造性”的表现。

目前AlphaGo项目已经正式终结,黄士杰透露DeepMind正在研发能打《星际争霸 2》的AI,而他本人也参与了这个项目。

很多人认为在即时战略游戏中,AI的反应速度会成为极大的优势,但事实并非如此。

黄士杰解释称,围棋只有361个落子点,对AI来说全部游戏内容都是可见的。但《星际争霸 2》游戏有大量全黑的地图,玩家需要探索地图以及侦查对手动向,才能制定相应的策略。

几乎每次鼠标移动,都能视为一次落子。这种不确定性让《星际争霸 2》对AI来说,难度比围棋要高很多。

长期研究人工智能的黄士杰认为,人类还是最聪明,AI会成为一种协助工具,帮助人类解决一些实际问题,例如早期癌症的诊断。


作者系网易新闻·网易号“各有态度”签约作者


加入社群

量子位AI社群15群开始招募啦,欢迎对AI感兴趣的同学,加小助手微信qbitbot6入群;


此外,量子位专业细分群(自动驾驶、CV、NLP、机器学习等)正在招募,面向正在从事相关领域的工程师及研究人员。


进群请加小助手微信号qbitbot6,并务必备注相应群的关键词~通过审核后我们将邀请进群。(专业群审核较严,敬请谅解)

诚挚招聘

量子位正在招募编辑/记者,工作地点在北京中关村。期待有才气、有热情的同学加入我们!相关细节,请在量子位公众号(QbitAI)对话界面,回复“招聘”两个字。

量子位 QbitAI · 头条号签约作者

վ'ᴗ' ի 追踪AI技术和产品新动态


登录查看更多
1

相关内容

就职于 Google DeepMind,AlphaGo 的主要设计者之一。围棋台湾业余6段。
【2020新书】数据科学:十大Python项目,247页pdf
专知会员服务
212+阅读 · 2020年2月21日
2019必读的十大深度强化学习论文
专知会员服务
57+阅读 · 2020年1月16日
【强化学习】深度强化学习初学者指南
专知会员服务
179+阅读 · 2019年12月14日
Gartner:AI会使社会变得更愚笨
云头条
3+阅读 · 2017年9月26日
DeepMind发布《星际争霸 II》深度学习环境
人工智能学家
8+阅读 · 2017年9月22日
Arxiv
20+阅读 · 2020年6月8日
Arxiv
7+阅读 · 2018年12月26日
Arxiv
3+阅读 · 2018年10月5日
Relational Deep Reinforcement Learning
Arxiv
10+阅读 · 2018年6月28日
A Multi-Objective Deep Reinforcement Learning Framework
Arxiv
3+阅读 · 2018年6月14日
VIP会员
相关论文
Top
微信扫码咨询专知VIP会员