近日,计算神经科学家、《深度学习革命》一书作者Terrence Sejnowski在接受采访时表示,现在像“深度学习”和“神经网络”这样的流行语无处不在,但是大多数对这些词语的理解都被误导了。
Sejnowski是研究学习算法的先驱,《深度学习革命》(The Deep Learning Revolution)一书的作者,该书新版本将于下周由麻省理工学院出版社出版。
他认为,关于“杀手AI”或“机器人超越人类”的话题热议过于关注危机的一面,忽视了计算机科学和神经科学领域中令人兴奋的可能,也忽视了当人工智能与人类智能时发生碰撞时会发生什么。
近日,Sejnkowski接受The Verge访谈时,谈到了“深度学习”一词为何突然变得无处不在,深度学习能做什么、不能做什么,以及对这一概念的炒作问题。
首先,我想问一下定义问题。人们几乎可以完全互换地使用“人工智能”、“神经网络”、“深度学习”和“机器学习”等词。但实际上这些词指的是不同的东西,您能解释一下有哪些不同吗?
Sejnowski是研究学习算法的先驱,《深度学习革命》一书的作者
人工智能(AI)的诞生可以追溯到1956年,当时美国的一些工程师们决定编写一个能够尝试模仿人类智能的计算机程序。而机器学习是在AI中逐步壮大的一个新领域。传统的人工智能方法是编写一个循序渐进的程序来实现某件事情,而机器学习是收集大量试图理解其内容的数据。
比如你正在尝试识别目标,你可以收集大量的图像。然后,通过机器学习这个自动化的过程,就可以剖析各种功能,可以确定某个目标是一辆汽车,而另一个目标是一台订书机。
机器学习是一个非常大的领域,并且可以追溯到最初人们称之为“模式识别”的阶段,但现在的算法在数学上变得更加广泛和复杂。在机器学习中包括受大脑启发而建立的神经网络,然后才是深度学习。深度学习算法具有特定的体系结构。基本上可以这样讲,深度学习是机器学习的一部分,而机器学习是人工智能的一部分。
有哪些事情是机器学习能做,其他程序做不了的?
编写程序非常耗费人力。在过去,计算机运算速度很慢,内存又非常昂贵,以至于必须求助于逻辑,这就是计算机的工作原理,是控制信息的基本机器语言。因为计算机太慢了、计算成本太高了。
但现在,计算已经越来越便宜,劳动力越来越昂贵。计算力甚至便宜到了这种程度:让计算机去学习,比让人类编写程序更有效率。从那时起,深度学习实际上已经开始解决以前在计算机视觉和翻译等领域的问题。而在此之前,人类的编程未踏足过这些领域。
深度学习是计算密集型活动,但用户只需编写一个程序,并提供不同的数据集,就可以解决不同的问题。用户不必非要是相关领域专家。因此,对于存在大量数据的任何事物,都可以产生成千上万的应用程序。
“深度学习”现在似乎无处不在。这个词是如何变得如此流行的?
关于这个时间点我其实可以明确确认:就是在2012年12月的NIPS会议上,这是最大的人工智能会议。这次会议上,Geoff Hinton和他的两个研究生表明,使用一个名为ImageNet的大型数据集,其中包含10000个类别和1000万个图像,并使用深度学习将分类错误率降低了20%。
一般来说,该数据集的图像分类错误率每年只能降低不到1%。这一年的改进顶了20年的研究。从此之后,闸门就被打开了。
深度学习的灵感来自大脑。那么这些不同领域之间,比如计算机科学和神经科学之间,是如何协同工作的?
深度学习的灵感来自神经科学,最成功的深度学习网络是Yann LeCun开发的卷积神经网络(CNN)。
考察一下CNN的架构,它不仅仅是由很多单元组成的,而且这些单元的连接方式基本反映出大脑的结构。在关于视觉系统和视觉皮层的基础研究中,表明大脑的一部分存在简单细胞和复杂细胞。在CNN的架构中,也存在简单细胞和复杂细胞的等价结构,CNN的架构设计直接来源于我们对视觉系统的理解。
Yann没有盲目地试图复制大脑皮层。他尝试了许多不同的变化,但他选择尝试的是那些自然融合的变化。这是一个重要的观察结果。我们在自然与人工智能的融合中可以学到很多东西,而且还有很长的路要走。
《深度学习革命》2018年版封面
我们对计算机科学的理解,在多大程度上取决于我们对大脑的理解程度?
我们现在研究和使用的大部分AI都是基于我们在上世纪60年代对大脑的了解。我们现在知道的更多了,可以将更多的知识融入到神经网络架构中。
击败世界围棋冠军的AlphaGo的架构中不仅包括皮质模型,还包括大脑的另一部分模型,称为基底神经节,这部分结构对于制定一系列决策来实现目标非常重要。有一种称为时间差异的算法,是Richard Sutton在上世纪80年代开发的,将这种算法与深度学习相结合,能够进行人类前所未见的复杂游戏。
当我们了解了大脑的结构,开始明白如何将其集成到人工系统中时,AI的功能将会越来越强大。
人工智能也会影响神经科学吗?
这两个领域是并行的。神经技术创新已经取得了巨大的进步,从一次记录一个神经元,到同时记录数千个神经元,同时记录大脑中的多个部分的反应,可以说完全开辟了一个全新的世界。
我认为,人工智能与人类智能之间存在着一种趋同。随着我们越来越多地了解大脑的工作原理,这些新知识将会反映在AI中。而与此同时,我们实际上也创造出了一整套可用于理解大脑的学习理论,可以让我们分析成千上万的神经元及其活动是如何产生的。所以说,神经科学和人工智能之间存在着这种相互反馈和循环,我认为这一点更令人兴奋,也更为重要。
您即将出版的《深度学习革命》一书中讨论了许多不同的深度学习应用,从自动驾驶汽车到交易。您觉得哪个领域最有趣?
我觉得是生成对抗网络(GAN)。如果使用传统的神经网络,你给出一个输入,得到一个输出。 而GAN能够在没有输入的情况下生成输出。
我第一次听说GAN的时候,正值由网络创建的假视频风行的时候。GAN真的会产生足以乱真的假视频,对吧?
从某种意义上说,它们是在生成内部活动。事实证明,人的大脑就是这样运作的。你可以看到并理解一些东西,然后闭上眼睛,开始想象实际并不存在的东西。你的脑子里会产生一个视觉图像,周围安静下来时,你会有想法。那是因为你的大脑是生成性的。现在,这种新型网络可以生成从未存在过的新模式。
所以打个比方,你可以给GAN输入几百张汽车图片,它就会创建内部结构,可以生成实际上不存在的汽车的新图像,这些图像看起来完全和汽车相似。
另一方面,您认为哪些想法或概念可能被过度炒作了?
没有人可以预测或想象这种新技术的引入会对未来产生什么影响。这里边当然存在炒作。我们还没有解决真正困难的问题。现在我们还没有实现通用智能,但人们都说机器人就在那里静静等着,等着取代人类,尽管目前机器人的发展远远落后于AI,因为其实模仿人类的身体比模仿大脑更加复杂。
这里以一项技术进步为例:激光。激光是在大约50年前发明的,当时的激光发射器大到占据了整个一间房。从那时起,一直到现在的激光器可以缩小到做讲演时使用的“激光笔”大小,而且仅售5美元,激光技术的商业化过程长达50年。
同样的事情也将发生在像自动驾驶汽车之类的技术上。自驾车可能明年无法普及,10年内无法普及,要普及可能需要50年,但重点是,在整个普及过程中,技术会不断进步,会变得越来越灵活和安全,与我们的交通运输网络的组织形式更加兼容。现在的问题是,人们太着急了,过分期待新技术尽快到来,其实假以时日,新技术总会到来的。
参考链接:
https://www.theverge.com/2018/10/16/17985168/deep-learning-revolution-terrence-sejnowski-artificial-intelligence-technology