当摩尔定律面临失效,我们或许可以建立一个行星级的智能系统

2017 年 12 月 3 日 依图科技 周健

站在浪潮之巅,总归能看到最前面发生的一些事情。本次分享来自依图科技研发总监——周健。周健此次特别撰文分享了自己从工程角度对人工智能发展的解读以及建立行星级智能系统的梦想。

周健是上海交通大学计算机系学士、硕士,2002年获得亚洲首个ACM国际大学生程序设计竞赛世界冠军,2006年加入谷歌负责中文网站搜索质量优化。彼时谷歌刚刚进入中国,李开复用“关门弟子”的称号从微软亚洲研究院“抢”到他,标志着谷歌在中国校招成功着陆,也打破了微软亚洲研究院当年一家独大的江湖地位。之后,周健在阿里云、MediaV担任研发经理、总监,主要从事分布式系统研发。

预见的背后是洞见,期望这种洞见的过程能给处于这无与伦比的时代的你我带来一些启发。


周 健

依图科技研发总监



“当价格不变时,集成电路上可容纳的元器件的数目,约每隔18-24个月便会增加一倍,性能也将提升一倍。”这是大家很熟悉的摩尔定律,它揭示了信息技术进步的速度。这条定律虽然不是真的物理定律,但是在过去的50年中,一直影响着人类技术的变革。然而在最近几年,关于摩尔定律面临失效的言论,愈演愈烈。


我是做工程出身的,所以我看待任何问题都会带着工程视角。而我所在的依图,是一家非常前沿的人工智能公司,毫不谦虚地讲,我们是站在浪潮之巅的。凡事都讲究社会责任,既然站在了巅峰,总归能够看到最前面发生的一些事情,所以非常荣幸能够跟大家分享一些我的个人思考。

 


摩尔定律失效

带来的是一个巨大的机遇

 

在我看来,整个IT行业分为六层,层层递进,最底下的是半导体制造,这是摩尔定律发挥的地方;再上层是硬件,是用半导体制造行业提供的晶体管以及制造工艺变成的硬件;再往上是操作系统,我理解只要能够把一个数据中心的机器都用起来,对程序员提供像操作系统一样的软件的系统都可以称之为操作系统。再上层是算法,不仅仅包括神经网络,还有运筹的算法、蒙特卡罗算法等等都算;再上层是数据,在移动互联网时代,你的一举一动都会形成数据;最后一层是应用,是结合了数据、算法写成的应用。

 

从50年代开始,人工智能经历了三次浪潮,我认为明线是人工智能在发展,而暗线正是摩尔定律。摩尔定律的逐步推进引发了这六层的层层变化。今天摩尔定律已经逐渐失效,实际上正引发一个巨大的机遇,它并不是悲观的。每一层的边界都会因此被打破,知识会被重塑,过去的一个半导体制造工程师,以后可能需要学习算法知识,五到十年后,大家都会跨界竞争了。

 

所以今天我所看到的是无穷的机会,而这也是依图希望去改变世界的机会。


摩尔定律的逐步推进



第一次人工智能浪潮:

人类开始思考何为智能


大家应该都知道计算机视觉的提出源自麻省理工的教授Marvin Minsky,他在1966年布置暑期作业时列了一个有关计算机视觉的提纲,并告诉学生:你们不妨研究一下计算机视觉,应该花不了太长的时间。现在已经快2018年了,这个原计划一个暑假解决的课题到现在还在继续。

 

其实在第一次人工智能浪潮中,所有相关预言也是不断被“打脸”的。比如说1958年提出的“十年之内,数字计算机将成为国际象棋世界冠军。”事实上,实现时间点是1997年。1965提出来的“二十年内,机器将能完成人能做到的一切工作。”这个也被打脸了。1967提出来的“一代之内……创造‘人工智能’的问题将获得实质上的解决。”一代是25年,所以这个显然又被打脸了。1970提出来的“在三到八年的时间里我们将得到一台具有人类平均智能的机器”。这个也是不存在的。

 

为什么会这样?

 

我觉得人类在那个时候才真正开始思考什么是智能。当时的人工智能很多都是逻辑推理,甚至证明了很多定理,大家觉得定理都能证明,看一张图识别一个苹果难道不应该更简单吗?实际上不是的,从神经科学来讲,逻辑推理占有的神经元的个数是很少的。人的大脑共有860亿个神经元,40%在做视觉处理,所以可想而知,视觉实际上比逻辑推理要难很多很多。

 

这次浪潮实际上带来了不少成果,最重要的是我们开始有了摩尔定律,操作系统也是那个年代发明出来的,晶体管、集成电路替代了那些落后的技术,算法和数据结构也有了基础理论,当然当时最主要的应用是做科学计算和弹道预测。

 

然而到了70年代初的时候,人工智能遭遇了瓶颈,第一次进入低谷。我认为它的持续发展应该需要在算法上去推进,但是由于半导体制造这一层的发展还够不上算法的推进,所以就堵住了人工智能发展的进程,进入了低潮期。


 

第二次人工智能浪潮:

算法的黄金年代

 

1980-1997年是第二次人工智能热潮时期,在这之前出现了一个标志性的事件,Intel开始做CPU了,提出了一个X86指令集,原来它是做内存的。另一个重要事件是IBM提出了PC概念,它提出装一台电脑都得有标准,网卡有标准、总线有标准、内存有标准,这样相当于各个硬件厂商都可以自己去发展了。而Intel和微软又结成了Wintel联盟,它实际带来了个人电脑时代。

 

计算能力也变得普及化,那个时候的算法逻辑是通过建模特定领域里的专家解决某些问题的方法,让机器去模拟。涌现了比较红火的专家系统,包括模拟数字逻辑、决策树之类的。大家用一套方法把专家的知识建模,再让机器去复制专家的能力。还有了日本举国家之力做第五代计算机这种项目。当然最标志的事件,是1997年IBM的深蓝打败了当时国际象棋冠军卡斯帕罗夫。

 

但是之后很迅速地又进入了低潮时期,我觉得在这次浪潮中算法应该是最大的收获,出现了一批很有价值的算法,今天最火的神经网络已经提出来了,还有我认为一直没有好好被使用的遗传算法,很多都是那个时候出来的。

 


第三次人工智能浪潮:

各层面出现爆发式的发展

 

现在是截然不同的时代,我们所处的就是第三次人工智能浪潮,它的引爆是因为数据、计算能力和算法都有了巨大的突破。网络开始连接,所有的数据都online了,计算能力体现在CPU到GPU的转变,算法上从原来的两层神经网络到现在最多有100多层,甚至能多达十亿个数据参照参数。还有了最标志的事件——阿尔法狗4:1赢了李世石。

 

今天大家也许感受不到当时阿尔法狗这件事情的威力有多大。其实在这之前,大家普遍觉得围棋是不可攻克的。大部分的人对这件事是没有想象力的,但是它却发生了。这是一个分水岭,从此之后,最优质的资源、最顶尖的人才都拼命往这个方向涌入。

 

先是从应用的视角,Image Net,图像识别领域从2012年开始由于深度学习被引爆,到2015年识别率超过了人眼。在语音识别领域,人耳的错误率是4%,现有的算法在2010年时就已经突破了人耳。另外还有许多的事情,包括商业智能(BI)、互联网广告、炒股、投资、无人驾驶,今天机器学习在很多领域都超越了人类。

 

从数据的视角来看,人类online的数据在2012年的时候每天会产生2.5EB,现在的预测是2025年的是总共有163ZB,有人预测大数据的摩尔定律是每一年会翻两倍。比如说最大的社交网络Facebook,它有足够多的用户数,每天你所有的行为,你说了什么,你在哪里,你干了什么都已经被记录下来。这些数据产生的功能是巨大的。

 

从算法的视角来看,现在主流的是多层神经网络,其实Geoffrey Hinton第一次提出神经网络之后,并没有得到推广,他一直在这个方向坚持,我觉得可能是等到了摩尔定律发展到一定程度,终于把这个GPU交到了他的手中,最终触发了这次人工智能的爆发。

 

在操作系统层面,我在阿里巴巴的时候负责把5000台机器的磁盘合在一起,就像一个文件系统,你可以往上面丢100T的数据没有问题。那时候5000台机器每天基本都会坏500块硬盘,所以我这一层工作不做的话,你是来不及修的。今天的操作系层面意味着有了这些软件,已经可以突破摩尔定律了,你还可以买机器,增加你的算力,很容易地把这些计算资源利用起来。

 

现在的硬件制造和半导体层面,遇见了瓶颈,主频因为热量的原因已经很久没有提升了。晶体管大小则遇见了物理极限,一个晶体管今天是十纳米,你可以做到三纳米,但是成本太高了,大家都认为五纳米是传统半导体栅极线宽的极限,再往下,量子隧穿效应阻碍了晶体管进一步的发展。所以摩尔定律也逐渐失效了,然而一个更伟大的时代同时出现了。


人工智能发展的三次浪潮


 

依图的洞见:

一个行星级的智能系统

 

今天这个时代,我们面临着信息爆炸的困扰。但是拨开迷雾,如果对整个人工智能领域积累了很深地理解,是不会有任何迷惑的。而依图的观点一直是不太一样的。这种不同并不是为了刻意营造出特立独行的形象,而是建立在对学术、行业深层次的积淀。就像Leo说的:因为看见,所以相信。

 

两位创始人建立依图这家公司是希望让机器能够达到三岁孩子的智能。当然智能包含认知、推理等等非常多的东西,但是今天假如只是谈感知的话,假设地球上有一亿个摄像头,每一个摄像头都有一个算法,能够像三岁孩子一样,把场景抽取出来,形成结构化的信息,汇聚到一个数据中心里,在这个数据规模上是可以做很多事情的,这就是我心目中的一个行星级的智能系统。

 

这一切并非是天方夜谭,恰恰在今天这个时代,是完全可能实现的。

 

依图常常说世界级的命题,对于我自己来说,离开谷歌加入阿里云,后来又加入依图,正是因为这个动力的驱使。并不是所有的平台,都有开创世界级命题的能力的。我们搭建了全球最大的十亿级人像库,帮助破获了非常多的积案命案。有一些项目需要对城市摄像头采集的信息进行结构化分析,而我们的算法达到了千亿分之一的误报率。在我看来,这些正是行星级智能系统的基础——城市级的智能系统。


终端无处不在


对我来说,每天真的是面临着世界级的挑战。

 

因为这些都是人类历史上从未有过的命题。我需要去思考要用什么样的方法把几十万路的视频数据至少存三年。可能理论上来说光存数据就需要1000台服务器,这显然是对资源的极大浪费。那我就得用别的办法,没有任何经验可以借鉴,没有任何人可以手把手教我如何解决。这些问题对我来说是极具挑战并且很有趣的,因为我是个工程师。

 

然而行星级的智能系统还远远不止这些。让我们回归自己的大脑,你的记忆会需要记住每一帧的场景吗?当你看书时,你是不是会有能看懂每一个字,但是不一定理解背后涵义的情况?你究竟如何触发指令到大脑,让它运作呢?所以大脑是真正的神秘地带,我们要学习的地方还有很多。我认为对于行星级的智能系统来说,现有的算法、即便依靠再多的算力,它还是不够的。但是我相信在几年之中,它一定能被解决。

 

大家可能知道有一个美剧叫做《疑犯追踪》,它说人工智能真的能够知道那些人在哪里,我觉得这件事情并不遥远。那么未来是什么?

 

在半导体制造上会有跨层的设计与制造,在硬件上,人类已经有了为深度神经网络设计的人工智能芯片,单位功率的计算力比GPU强10倍,操作系统的智能存储和调度,算法上深度神经网络的增强学习,这些直接带来应用层面的变革,令各个行业都会被颠覆,还使得数据层面面临行星级的数据处理能力。

 

所以摩尔定理失效带给我们的是一个无与伦比的时代。在这个时代,每一层都会被重塑,所有的知识都可能被打破,太多太多的事情需要我们去创造。

 

大约20世纪60年代的时候,英国科学家James E.lovelock提出了盖亚假说,他觉得地球的生命与自然环境之间存在着复杂连贯的相互作用,是一个能够自我调节的生命有机体。我小的时候觉得这绝无可能。但是今天,想象一下,假如世界上分布着一百亿个感知器,获取结构化的信息并基于此进行计算,它带着智能,无时无刻不在学习,它不停地变化,而不是机械的扩大,它其实就是“活”的生命体。

 

而这,正是依图的洞见,就在我们这代人的手里。

 

欢迎一起加入!




AI 无界,少年可为!

依图校园招聘持续进行中,

欢迎探索人工智能的未来~

点击“阅读原文”获取所有校招岗位






你可能还对这些感兴趣:


美国科技产业风向标探访中国,TechCrunch对话依图科技联合创始人


AI新时代:因为看见,所以相信|依图科技联合创始人深度分享


人工智能离我们有多远?当依图和《西部世界》相遇……




登录查看更多
0

相关内容

【干货书】现代数据平台架构,636页pdf
专知会员服务
251+阅读 · 2020年6月15日
商业数据分析,39页ppt
专知会员服务
158+阅读 · 2020年6月2日
德勤:2020技术趋势报告,120页pdf
专知会员服务
187+阅读 · 2020年3月31日
专知会员服务
123+阅读 · 2020年3月26日
Python数据分析:过去、现在和未来,52页ppt
专知会员服务
99+阅读 · 2020年3月9日
阿里巴巴达摩院发布「2020十大科技趋势」
专知会员服务
105+阅读 · 2020年1月2日
自动驾驶汽车决策层算法的新方向
智能交通技术
7+阅读 · 2019年4月6日
“搞机器学习没前途”
CSDN
236+阅读 · 2018年9月12日
【人工智能】谭铁牛院士:人工智能新动态
产业智能官
8+阅读 · 2018年1月5日
预言|李开复预见2018:明年会有一批AI公司倒闭
机器人大讲堂
6+阅读 · 2017年12月15日
无人驾驶汽车
劲说
5+阅读 · 2016年8月26日
Arxiv
35+阅读 · 2020年1月2日
Arxiv
7+阅读 · 2018年1月10日
VIP会员
相关VIP内容
【干货书】现代数据平台架构,636页pdf
专知会员服务
251+阅读 · 2020年6月15日
商业数据分析,39页ppt
专知会员服务
158+阅读 · 2020年6月2日
德勤:2020技术趋势报告,120页pdf
专知会员服务
187+阅读 · 2020年3月31日
专知会员服务
123+阅读 · 2020年3月26日
Python数据分析:过去、现在和未来,52页ppt
专知会员服务
99+阅读 · 2020年3月9日
阿里巴巴达摩院发布「2020十大科技趋势」
专知会员服务
105+阅读 · 2020年1月2日
相关资讯
自动驾驶汽车决策层算法的新方向
智能交通技术
7+阅读 · 2019年4月6日
“搞机器学习没前途”
CSDN
236+阅读 · 2018年9月12日
【人工智能】谭铁牛院士:人工智能新动态
产业智能官
8+阅读 · 2018年1月5日
预言|李开复预见2018:明年会有一批AI公司倒闭
机器人大讲堂
6+阅读 · 2017年12月15日
无人驾驶汽车
劲说
5+阅读 · 2016年8月26日
Top
微信扫码咨询专知VIP会员