DeepMind黄士杰：深度学习有创造性，正参与星际2项目

会员服务 ·

DeepMind黄士杰：深度学习有创造性，正参与星际2项目

2018 年 3 月 26 日 量子位 关注前沿科技

岳排槐发自凹非寺
量子位出品 | 公众号 QbitAI

最近，AlphaGo“人肉臂”黄士杰回到台北参加了Google举办的一次人工智能论坛。并且发表了《AlphaGo与AI的黄金时代》演讲。

从小就喜欢围棋的黄士杰，求学期间就一直对围棋软件感兴趣。他在博士班期间开发了Erica，这个单机版本的围棋软件，当时打败了围棋领域最强的AI、使用了六台机器的Zen。

也正是如此，DeepMind的核心人物David Silver力邀黄士杰加盟，而后者也成为DeepMind第40号员工。

不过，他第一次踏进DeepMind那天，这家公司的创始人就跟他说，DeepMind并不打算朝围棋方向发展，因为他们的目标不是在特定领域成为最佳，而是希望搞出通用人工智能，让AI解决人类无法解决的问题。

但是，随着深度学习等技术的不断进步，DeepMind最后还是决定启动围棋项目。

为了研发出AlphaGo，DeepMind团队尝试过上百个想法，发展过程就是不停的实验、实验、实验，不停学习新理论。

实际上，在击败李世乭之后，DeepMind就曾打算终止AlphaGo项目，但是考虑到第四局犯下的错误，他们还是决定仍然使用神经网络把这个问题修正掉，毕竟有缺陷的AI会失去他人的信任。

这就有了后续AlphaGo的继续进步。

黄士杰表示，AlphaGo在围棋领域做出了很多令人震撼的下法，在国际象棋领域也是如此。黄士杰认为，这些都是深度学习具有“创造性”的表现。

目前AlphaGo项目已经正式终结，黄士杰透露DeepMind正在研发能打《星际争霸 2》的AI，而他本人也参与了这个项目。

很多人认为在即时战略游戏中，AI的反应速度会成为极大的优势，但事实并非如此。

黄士杰解释称，围棋只有361个落子点，对AI来说全部游戏内容都是可见的。但《星际争霸 2》游戏有大量全黑的地图，玩家需要探索地图以及侦查对手动向，才能制定相应的策略。

几乎每次鼠标移动，都能视为一次落子。这种不确定性让《星际争霸 2》对AI来说，难度比围棋要高很多。

长期研究人工智能的黄士杰认为，人类还是最聪明，AI会成为一种协助工具，帮助人类解决一些实际问题，例如早期癌症的诊断。

作者系网易新闻·网易号“各有态度”签约作者

— 完 —

加入社群

量子位AI社群15群开始招募啦，欢迎对AI感兴趣的同学，加小助手微信qbitbot6入群；

此外，量子位专业细分群(自动驾驶、CV、NLP、机器学习等)正在招募，面向正在从事相关领域的工程师及研究人员。

进群请加小助手微信号qbitbot6，并务必备注相应群的关键词~通过审核后我们将邀请进群。（专业群审核较严，敬请谅解）

诚挚招聘

量子位正在招募编辑/记者，工作地点在北京中关村。期待有才气、有热情的同学加入我们！相关细节，请在量子位公众号(QbitAI)对话界面，回复“招聘”两个字。

量子位 QbitAI · 头条号签约作者

վ'ᴗ' ի 追踪AI技术和产品新动态

登录查看更多

相关内容

黄士杰

关注 3

就职于 Google DeepMind，AlphaGo 的主要设计者之一。围棋台湾业余6段。

【DeepMind深度学习课程】神经网络基础，104页ppt，Neural Networks Foundations

专知会员服务

87+阅读 · 2020年6月24日

【Manning2020新书】深度强化学习实战，351页pdf，Deep Reinforcement Learning

专知会员服务

294+阅读 · 2020年3月10日

DeepMind科学家Trask《Grokking Deep Learning》图书及代码, 带你无障碍深度学习，高中数学OK

专知会员服务

93+阅读 · 2020年2月29日

【2020新书】数据科学:十大Python项目，247页pdf

专知会员服务

216+阅读 · 2020年2月21日

2019必读的十大深度强化学习论文

专知会员服务

59+阅读 · 2020年1月16日

【电子书推荐】在谷歌云平台上构建机器学习和深度学习模型，703页pdf，一个全面的初学者指南

专知会员服务

41+阅读 · 2020年1月2日

《DeepMind深度学习与强化学习进阶》850页ppt课件与视频开放（附下载）

专知会员服务

148+阅读 · 2019年12月25日

【强化学习】深度强化学习初学者指南

专知会员服务

184+阅读 · 2019年12月14日

【DeepMind-Nando de Freitas】强化学习教程，102页ppt，Reinforcement Learning

专知会员服务

84+阅读 · 2019年11月15日

【O'Reilly AI Conference 2019】实时AI实体解析，Real-time AI for entity resolution ，Senzing 的创始人兼首席执行官Jeff Jonas

专知会员服务

10+阅读 · 2019年11月5日

DeepMind开源强化学习游戏框架，25款线上游戏等你来挑战

机器之心

9+阅读 · 2019年8月28日

【重磅】DeepMind发布Nature论文: 博弈网络让智能体成为游戏大咖

专知

9+阅读 · 2018年1月17日

【AlphaGo Zero】AlphaGo Zero横空出世，DeepMind Nature论文解密不使用人类知识掌握围棋

产业智能官

5+阅读 · 2018年1月8日

DeepMind 推出 AlphaGo 围棋教学工具，围棋学习新纪元来了？（附中英文版下载地址）

EGONetworks

6+阅读 · 2017年12月19日

AlphaGo “人肉臂”黄士杰首度公开演讲：Zero 版本并未到达极限，加入 DeepMind 这四件事对我影响最大

EGONetworks

6+阅读 · 2017年11月18日

教程 | 深度强化学习入门：用TensorFlow构建你的第一个游戏AI

机器之心

6+阅读 · 2017年11月16日

AlphaGo Zero幕后开发心路历程大公开！DeepMind资深研究员黄士杰最新演讲解密

专知

3+阅读 · 2017年11月14日

人类：“共同探索围棋极限！”新AlphaGo：“不了吧，我到了。”

PingWest品玩

4+阅读 · 2017年10月20日

Gartner：AI会使社会变得更愚笨

云头条

3+阅读 · 2017年9月26日

DeepMind发布《星际争霸 II》深度学习环境

人工智能学家

9+阅读 · 2017年9月22日

Text Detection and Recognition in the Wild: A Review

Arxiv

20+阅读 · 2020年6月8日

Libra R-CNN: Towards Balanced Learning for Object Detection

Arxiv

7+阅读 · 2019年4月4日

Learning to Walk via Deep Reinforcement Learning

Arxiv

7+阅读 · 2018年12月26日

Reinforcement Learning with Perturbed Rewards

Arxiv

4+阅读 · 2018年10月5日

Acquisition of Localization Confidence for Accurate Object Detection

Arxiv

4+阅读 · 2018年7月30日

Relational Deep Reinforcement Learning

Arxiv

10+阅读 · 2018年6月28日

A Multi-Objective Deep Reinforcement Learning Framework

Arxiv

16+阅读 · 2018年6月27日

Relation Networks for Object Detection

Arxiv

4+阅读 · 2018年6月14日

CoupleNet: Paying Attention to Couples with Coupled Attention for Relationship Recommendation

Arxiv

4+阅读 · 2018年5月29日

Population Anomaly Detection through Deep Gaussianization

Arxiv

6+阅读 · 2018年5月5日

VIP会员