成为VIP会员查看完整内容
VIP会员码认证
首页
主题
发现
会员
服务
注册
·
登录
0
DeepMind首席科学家:比起机器智能,我更担心人类智能造成的灾难
2022 年 1 月 16 日
新智元
新智元报道
编辑:David
【新智元导读】
DeepMind 首席研究科学家David
Silver的明星气质与他安静、谦逊的性格形成了鲜明对比。这位让AI自学下围棋玩游戏的强化学习大牛认为:比起AI的威胁,人类智能产生的后果可能更可怕。
在 DeepMind 首席研究科学家、伦敦大学学院计算机科学教授David Silver 看来,游戏是激发创造力的关键,尤其是对AI而言。
Silver曾小时候参加过全国拼字游戏比赛,之后他继续在剑桥学习并共同创办了一家视频游戏公司。
后来,在获得人工智能博士学位后,他带领DeepMind团队开发了 AlphaGo,这是第一个围棋比赛中击败世界冠军的AI程序。
对于Silver 来说,游戏是了解人类和人工大脑如何自行学习以实现目标的实验场。
对于围棋AI AlphaGo来说,向程序提供有关人类在不同位置的决策,再让AI模仿,这种学习被称为「监督式学习」。实现AI程序通过自对弈中学习,这种方式称为「强化学习」。
然后,在 AlphaGo 和世界冠军的关键比赛中,Silver突然想到:也许,机器的决策根本不应该受到人类的影响。
这个想法最终成为 AlphaGo Zero 的开端,它是 AlphaGo 的继任者,在完全不接收人类知识的情况下,只靠强化学习,从游戏规则出发学习如何下好围棋。
后来,AlphaGo Zero 与 AlphaGo 对弈 100 局,零封了自己的「老大哥」。
2020年4月,David Silver因在「计算机游戏方面的突破性进步」获得了2019年ACM计算奖。
在颁奖仪式上,时任ACM主席 Cherri M. Pancake表示:
「很少有其他研究人员像 David Silver 那样,在 AI 领域引起如此多的令人兴奋的成果。他对深度强化学习的见解已经从游戏中铺开,应用于多个领域,包括电网效率的提升、降低数据中心的功耗以及为欧洲航天局规划太空探测器的轨迹等。」
另外,Silver是英国皇家学会Fellow,也是在AI领域首位获得门萨基金最佳科学发现奖的科学家。
Silver的明星气质与他安静、谦逊的天性形成鲜明对比。在本次采访中,Silver 谈论了游戏、创造力的意义,以及AI在避免气候变化、病原体感染、大规模贫困和环境灾难等方面的应用潜力。
以下是访谈内容:
你小时候玩游戏的方式就与其他孩子不一样吗?
我那时候参加过全国学校拼字游戏比赛,我还记得一些有趣的时刻。
有一次,在最后一场比赛结束时,我问我的对手,「你确定要拼这个词吗?为什么不拼一个得分更高的词呢?」 他改变了自己的拼法,赢得了比赛和冠军,这让我非常高兴。
比起赢得比赛,我更着迷于比好一场比赛的意义。
您是如何将对游戏的热爱转化为一份真正的工作的?
后来,我接触到了国际象棋,遇到了Demis Hassabis(DeepMind 的联合创始人 。那个时候,他是世界上同龄最强的少年棋手。
当时他零花钱不够时,就会来我所在的镇里,参加比赛,赢走 50 英镑的奖金,然后回家。后来,我们在剑桥认识了,并一起成立了一家游戏公司 Elixir,现在我们一起回到了 DeepMind。
这种对游戏的迷恋,教会了你解决问题的哪些方面?
一方面,我们相信自己拥有所谓「创造力」的特殊能力,而AI算法并没有这种能力。实际上这是一个谬论。
现在,在 AI 中已经看到了创造力的端倪。2016年 AlphaGo 对阵李世石的第二局比赛中,AlphaGo执黑下出的第37手,围棋社区中就认为创造力十足,甚至超出了当时人类职业棋手的理解。这说明,AI的确尝试了一些非同以往的新东西。
但是,人类可以将这种广泛的创造力应用于任何事物,而不仅仅是在游戏中吗?
整个试错学习的过程,比如尝试自己去想办法,或者让AI自己去想办法,如何解决问题,这都是一个创造性的过程。AI从一开始什么都不知道。然后会发现一件新事物、一种创造性飞跃、一种新模式或一种新想法,这有助于比以前更好地实现目标。
现在,你掌握了玩游戏、解谜或与人互动的新方式。这个过程实际上是成千上万个小发现一个接一个累计而成的。这才是「创造力」的本质。
如果AI算法没有创造力,就会陷入困境。AI需要有能力为自己尝试新的想法——那些人类没有告诉它们的想法。这应该是未来研究的方向,以继续推动通过自我尝试得出「新点子」的系统。
许多人认为,计算机只能在人类业余水平上下围棋。你有没有怀疑过自己进步的能力?
当我参加 2016 年 AlphaGo 比赛抵达韩国时,看到了一排排的摄像头,我听说当时有超过 2 亿人在网上观看,我想当时想「等等,这真的能行吗?」
对手李世乭是一位天才的世界冠军,他会尝试一切手段,将AI程序带入一般不会发生的奇怪情况。
我感到很幸运,我们经受住了那次考验。后来我问自己:“能不能退一步回到基础,理解一个系统真正为自己学习意味着什么?” 为了找到更纯粹的东西,我们放弃了AI模型中的人类知识,开发出了 AlphaZero。
几千年来,人类已经为围棋制定了众所周知的策略。当 AlphaZero 迅速发现并拒绝了这些有利的策略时,您是怎么想的?
我们设置了原版 AlphaGo 下错的位置(与人类职业选手相比)。我们认为,如果能找到一个让AI自己找到正确位置的新版本,就算是成功了。一开始,我们取得了巨大的进步,但后来似乎就不行了。我们认为AI并没有自己找到正确的 20 到 30 手的位置。
与我们合作的职业选手樊麾花了几个小时研究这些着法。最后他说,是职业选手下错了,AlphaZero 是对的。AI找到了解决方案,重新评估了最初被归于「错误」的棋。我意识到我们有能力推翻人类认为的标准知识。
这之后,你主持开发AlphaStar,让AI玩《星际争霸2》。为什么从围棋跳到了电子游戏?
围棋是一个相对狭小的领域。要想从围棋入手,扩展到人脑的能力范围需要大量的步骤。我们尝试更复杂的维度,那些人类做得好,但AI做不好的大量领域。
从AlphaGo到AlphaStar, 实际上是个自然的发展。与人类一样,AI系统只能看见地图的某个部分。这就不像下围棋或国际象棋,能看到对手和自己的所有棋子。游戏中只能看到控制对象附近的信息,你必须侦察以获取信息。这更接近现实世界中发生的事情。
最终目标是什么?
我认为AI代理的能力与人类大脑一样广。虽然目前我们还不知道如何才能完全实现大脑的功能,但在人脑中有存在的证据。
完全复制人脑吗?你真的认为这很现实吗?
我不相信对大脑的神奇、神秘的解释。
在某种程度上,人脑是一种算法,它以强大而通用的方式接受输入并产生输出。我们理解和构建人工智能的能力有限,但这种理解正在快速增长。今天,我们拥有能够破解了围棋等狭窄领域的AI,也有了可以理解和产生自然语言的模型。
那么,你认为人AI的能力没有上限吗?
现在我们才刚刚开始上路。想象一下,如果再经历 40 亿年的进化,我们会是什么状态?也许我们会拥有更复杂的智能,可以做得更好。AI和这有点像,这个过程没有限制,因为世界在本质上是无限复杂的。
那么,会有上限吗?在某些时候,物理极限的确存在,所以并非没有界限。最终,你会用尽了宇宙中的所有能量和所有原子来构建计算设备。但相对于目前来说,实际上可以视作是无限的。超越人类智能,这个范围是很广的。
斯蒂芬·霍金担心机器智能会产生可怕的意外后果。你有类似的担心吗?
比起这个,我更担心人类智能的意外后果,比如气候变化、病原体、大规模贫困和环境灾难。
对AI的追求应该带来新技术、更深入的理解和更明智的决策。AI有朝一日可能成为我们避免此类灾难的最佳工具。但是,我们应该谨慎行事,制定明确的规则,禁止不可接受的AI应用,例如禁止开发自主武器。
现在,你通过游戏AI的成功应对了这些巨大的挑战,但有没有失望过?
嗯,监督学习已经产生了巨大的主流影响。大多数来自谷歌的大型应用程序都在系统的某个地方使用监督学习。
目前我的一个失望是,我们还没有发现通过强化学习对自学习系统产生这种程度的影响。在未来,我希望看到能够在虚拟世界中以真正实现我们目标的方式与人互动的自学系统。例如,一个为自己学习实现目标的最佳方式的数字助理。那将是一个美丽的成就。
你有工作的个人目标吗?
在与李世石的AlphaGo比赛中,我走到比赛场地外,发现一个围棋选手哭了。我以为是在难过,但实际上他并没有。
在这个他全心投入的领域,AlphaGo 正在下出他从之前未意识到的棋。这让他感受到了一种深刻的美感。
以我的围棋水平,还不足以完全体会到这一点。但我们应该努力在能感觉到的一切地方都建立类似的智能。
我认为应该这样开发AI智能,不是因为AI做了什么或AI给我们的帮助多么多么大,而是因为,智能本身就是一件很美丽的事情。
原文链接:
https://thebulletin.org/2022/01/deepminds-david-silver-on-games-beauty-and-ais-potential-to-avert-human-made-disasters/
登录查看更多
点赞并收藏
0
暂时没有读者
0
权益说明
本文档仅做收录索引使用,若发现您的权益受到侵害,请立即联系客服(微信: zhuanzhi02,邮箱:bd@zhuanzhi.ai),我们会尽快为您处理
相关内容
AlphaGo
关注
21
AlphaGo 是一款人工智能围棋程序,由被 Google 收购的 DeepMind 公司开发。 2015年10月,AlphaGo v13 在与职业棋手、欧洲冠军 樊麾二段 的五番棋比赛中,以 5:0 获胜。2016年3月9日 - 15日,AlphaGo v18 在与韩国职业棋手 李世石九段 的五番棋比赛中,以 4:1 获胜,赛后,AlphaGo 荣获韩国棋院授予的「第〇〇一号 名誉九段」证书。2016年7月19日,AlphaGo 在 GoRantings 世界围棋排名中超过柯洁,成为世界第一。
【AI4Science】利用人工智能加速科学发现- DeepMind-CEO Demis Hassabis最新演讲视频报告
专知会员服务
28+阅读 · 2022年3月7日
终究还是来了,AI卷革程序员!!DeepMind发布媲美普通程序员的AlphaCode
专知会员服务
25+阅读 · 2022年2月3日
商汤科技再发《AI可持续发展报告》白皮书
专知会员服务
51+阅读 · 2021年11月16日
佛罗里达大学Sean Meyn教授最新《强化学习与控制系统》新书,457页pdf
专知会员服务
164+阅读 · 2021年7月18日
【斯坦福-NLP-seminar】知识密集强化学习,72页ppt,Facebook TIM
专知会员服务
28+阅读 · 2021年4月27日
强化学习的自动驾驶控制技术研究进展
专知会员服务
132+阅读 · 2021年2月17日
《强化学习导论》经典课程10讲,DeepMind大神David Silver主讲
专知会员服务
80+阅读 · 2021年1月2日
【NeurIPS2020】DeepMind最新《神经科学人工智能》报告,126页ppt
专知会员服务
67+阅读 · 2020年12月10日
【强化学习】深度强化学习初学者指南
专知会员服务
179+阅读 · 2019年12月14日
【DeepMind-Nando de Freitas】强化学习教程,102页ppt,Reinforcement Learning
专知会员服务
83+阅读 · 2019年11月15日
DeepMind三人组挑战股市,曾开发出首个战胜职业玩家的德州扑克AI
新智元
0+阅读 · 2022年4月16日
把人类大脑意识装入特斯拉机器人?马斯克独家专访:最担心人工智能出错
THU数据派
1+阅读 · 2022年4月1日
玩桥牌,8位人类世界冠军,都输给了AI
大数据文摘
0+阅读 · 2022年4月1日
AI「赌王」问世!桥牌胜率83%,吊打8位人类冠军,但不会叫牌
新智元
0+阅读 · 2022年3月30日
索尼搞了个大新闻!AI打败人类三冠王,登上Nature封面,这波让任天堂无话可说
量子位
0+阅读 · 2022年2月10日
弯道极限超车、击败人类顶级玩家,索尼AI赛车手登上Nature封面
机器之心
0+阅读 · 2022年2月10日
Nature封面:人类又输给了AI,这次是玩《GT赛车》游戏
学术头条
0+阅读 · 2022年2月10日
DeepMind联合创始人苏莱曼从谷歌离职,被指不懂技术、霸凌手下
新智元
0+阅读 · 2022年1月21日
人工智能是否能开启人类世界新纪元?
新智元
0+阅读 · 2021年4月19日
Waymo模拟了近百起车祸现场,证明「自动驾驶比人类靠谱得多」
机器之心
0+阅读 · 2021年3月10日
基于水下机器人的高分辨率大尺度结构光三维视觉测量关键技术研究
国家自然科学基金
1+阅读 · 2013年12月31日
人类脊椎的生理结构与调控机理及其在仿人机器人中的应用研究
国家自然科学基金
0+阅读 · 2013年12月31日
不确定环境下强化学习和决策的神经机制
国家自然科学基金
10+阅读 · 2012年12月31日
考虑痕迹不确定性的车人碰撞事故再现技术
国家自然科学基金
0+阅读 · 2012年12月31日
基于学习人类策略的动态稳定系统控制器切换方法研究
国家自然科学基金
2+阅读 · 2012年12月31日
基于环境识别记忆的离心泵多工况水力设计研究
国家自然科学基金
0+阅读 · 2012年12月31日
不确定环境下独立微网系统的优化规划设计方法研究
国家自然科学基金
0+阅读 · 2012年12月31日
基于智能自适应的SUAV机翼损伤下的重构控制研究与验证
国家自然科学基金
0+阅读 · 2011年12月31日
过程神经网络的智能学习算法研究
国家自然科学基金
0+阅读 · 2008年12月31日
空间机器人接触碰撞动力学与后碰撞控制机理研究
国家自然科学基金
1+阅读 · 2008年12月31日
Towards General Purpose Vision Systems
Arxiv
0+阅读 · 2022年4月19日
M2TR: Multi-modal Multi-scale Transformers for Deepfake Detection
Arxiv
0+阅读 · 2022年4月19日
Linear codes using simplicial complexes
Arxiv
0+阅读 · 2022年4月18日
Understanding Game-Playing Agents with Natural Language Annotations
Arxiv
0+阅读 · 2022年4月15日
Pre-training Methods in Information Retrieval
Arxiv
1+阅读 · 2022年4月15日
Towards a Theory of Justice for Artificial Intelligence
Arxiv
0+阅读 · 2022年4月14日
A Survey of Uncertainty in Deep Neural Networks
Arxiv
30+阅读 · 2021年7月7日
Graph Learning: A Survey
Arxiv
56+阅读 · 2021年5月3日
Meta-learning in natural and artificial intelligence
Arxiv
10+阅读 · 2020年11月26日
Bridging the Gap Between Spectral and Spatial Domains in Graph Neural Networks
Arxiv
15+阅读 · 2020年3月26日
VIP会员
自助开通(推荐)
客服开通
详情
相关主题
AlphaGo
DeepMind
David Silver
AlphaGo Zero
强化学习
AI
相关VIP内容
【AI4Science】利用人工智能加速科学发现- DeepMind-CEO Demis Hassabis最新演讲视频报告
专知会员服务
28+阅读 · 2022年3月7日
终究还是来了,AI卷革程序员!!DeepMind发布媲美普通程序员的AlphaCode
专知会员服务
25+阅读 · 2022年2月3日
商汤科技再发《AI可持续发展报告》白皮书
专知会员服务
51+阅读 · 2021年11月16日
佛罗里达大学Sean Meyn教授最新《强化学习与控制系统》新书,457页pdf
专知会员服务
164+阅读 · 2021年7月18日
【斯坦福-NLP-seminar】知识密集强化学习,72页ppt,Facebook TIM
专知会员服务
28+阅读 · 2021年4月27日
强化学习的自动驾驶控制技术研究进展
专知会员服务
132+阅读 · 2021年2月17日
《强化学习导论》经典课程10讲,DeepMind大神David Silver主讲
专知会员服务
80+阅读 · 2021年1月2日
【NeurIPS2020】DeepMind最新《神经科学人工智能》报告,126页ppt
专知会员服务
67+阅读 · 2020年12月10日
【强化学习】深度强化学习初学者指南
专知会员服务
179+阅读 · 2019年12月14日
【DeepMind-Nando de Freitas】强化学习教程,102页ppt,Reinforcement Learning
专知会员服务
83+阅读 · 2019年11月15日
热门VIP内容
开通专知VIP会员 享更多权益服务
机器战争:将自主系统纳入军事框架
《作战战略和决策规划的数学模型》
美空军条令《反陆作战》最新84页
《军事高价值资产自主防御与护航的深度强化学习方法》最新148页
相关资讯
DeepMind三人组挑战股市,曾开发出首个战胜职业玩家的德州扑克AI
新智元
0+阅读 · 2022年4月16日
把人类大脑意识装入特斯拉机器人?马斯克独家专访:最担心人工智能出错
THU数据派
1+阅读 · 2022年4月1日
玩桥牌,8位人类世界冠军,都输给了AI
大数据文摘
0+阅读 · 2022年4月1日
AI「赌王」问世!桥牌胜率83%,吊打8位人类冠军,但不会叫牌
新智元
0+阅读 · 2022年3月30日
索尼搞了个大新闻!AI打败人类三冠王,登上Nature封面,这波让任天堂无话可说
量子位
0+阅读 · 2022年2月10日
弯道极限超车、击败人类顶级玩家,索尼AI赛车手登上Nature封面
机器之心
0+阅读 · 2022年2月10日
Nature封面:人类又输给了AI,这次是玩《GT赛车》游戏
学术头条
0+阅读 · 2022年2月10日
DeepMind联合创始人苏莱曼从谷歌离职,被指不懂技术、霸凌手下
新智元
0+阅读 · 2022年1月21日
人工智能是否能开启人类世界新纪元?
新智元
0+阅读 · 2021年4月19日
Waymo模拟了近百起车祸现场,证明「自动驾驶比人类靠谱得多」
机器之心
0+阅读 · 2021年3月10日
相关基金
基于水下机器人的高分辨率大尺度结构光三维视觉测量关键技术研究
国家自然科学基金
1+阅读 · 2013年12月31日
人类脊椎的生理结构与调控机理及其在仿人机器人中的应用研究
国家自然科学基金
0+阅读 · 2013年12月31日
不确定环境下强化学习和决策的神经机制
国家自然科学基金
10+阅读 · 2012年12月31日
考虑痕迹不确定性的车人碰撞事故再现技术
国家自然科学基金
0+阅读 · 2012年12月31日
基于学习人类策略的动态稳定系统控制器切换方法研究
国家自然科学基金
2+阅读 · 2012年12月31日
基于环境识别记忆的离心泵多工况水力设计研究
国家自然科学基金
0+阅读 · 2012年12月31日
不确定环境下独立微网系统的优化规划设计方法研究
国家自然科学基金
0+阅读 · 2012年12月31日
基于智能自适应的SUAV机翼损伤下的重构控制研究与验证
国家自然科学基金
0+阅读 · 2011年12月31日
过程神经网络的智能学习算法研究
国家自然科学基金
0+阅读 · 2008年12月31日
空间机器人接触碰撞动力学与后碰撞控制机理研究
国家自然科学基金
1+阅读 · 2008年12月31日
相关论文
Towards General Purpose Vision Systems
Arxiv
0+阅读 · 2022年4月19日
M2TR: Multi-modal Multi-scale Transformers for Deepfake Detection
Arxiv
0+阅读 · 2022年4月19日
Linear codes using simplicial complexes
Arxiv
0+阅读 · 2022年4月18日
Understanding Game-Playing Agents with Natural Language Annotations
Arxiv
0+阅读 · 2022年4月15日
Pre-training Methods in Information Retrieval
Arxiv
1+阅读 · 2022年4月15日
Towards a Theory of Justice for Artificial Intelligence
Arxiv
0+阅读 · 2022年4月14日
A Survey of Uncertainty in Deep Neural Networks
Arxiv
30+阅读 · 2021年7月7日
Graph Learning: A Survey
Arxiv
56+阅读 · 2021年5月3日
Meta-learning in natural and artificial intelligence
Arxiv
10+阅读 · 2020年11月26日
Bridging the Gap Between Spectral and Spatial Domains in Graph Neural Networks
Arxiv
15+阅读 · 2020年3月26日
大家都在搜
palantir
大模型
武器目标分配
兵棋推演
知识图谱
壁画
RE-NET
笛卡尔
MoE
EBSD晶体学织构基础及数据处理
Top
提示
微信扫码
咨询专知VIP会员与技术项目合作
(加微信请备注: "专知")
微信扫码咨询专知VIP会员
Top