今天,即 1 月 28 日上午,MIT 计算机科学&人工智能实验室教授 Tomaso Poggio 在《麻省理工科技评论》EmTech China 全球新兴科技峰会上,发表了关于深度学习的精彩演讲,主题是深度学习:从炼金术走向化学,以下为整理后的演讲全文:
图 | Tomaso Poggio 在演讲
今天我想和大家谈一下人工智能领域正在发生什么。首先,我想说说我们在人工智能领域最近所取得的一些成绩,以及未来可能在哪里取得突破。深度学习有点像我们这个时代的炼金术,但是需要从炼金术转化为真正的化学。这样我们才能知道,深度学习在未来到底可以实现什么。
过去五年,人工智能领域最重要的两个成就是:AlphaGo 和自动驾驶。我在这行待了很久,因此两个领域都有我的学生:一个是 AlphaGo 的 Hassabis,他是 DeepMind 员工,现在在谷歌;另外一个就是 Moblieye 的 CEO Amnon Shashua,现在已经加入了英特尔。
23 年以前,我和 Hassabis 希望可以把计算机视觉和机器学习进行整合,然后创造出一个学习系统来辨别行人。在实验结果中,我们可以看到机器识别出了行人和信号灯。虽然基本上每秒钟会出现 10 个错误,但当时是 1995 年,所以我们对这个结果还是非常满意的。
后来,Moblieye 做到了每30英里(约48公里)只出现 1 个错误,把错误率降到了当年的百万分之一,可以看出机器学习的准确性显著提高,几乎每年效能就会提高一倍。
图 | Tomaso Poggio 演讲现场
那么,AlphaGo 和 Moblieye 所取得的进步,背后是什么动因呢?
首先我认为是机器学习的算法的进步,第一是深度学习,第二是强化学习,它们都是来自于认知科学以及神经科学。
深度学习的架构最早是在 60 年代通过研究猴子的视觉系统发明出来的,之后 Fukushima 提出了首个量化模型,20年前现代版的 HMAX 也被提出。2012 年我们也开发出了 AlexNet,它也是性能最好的一个架构。这些架构都是一脉相承的——从脑科学到现在的深度学习,本质上都是一样的层级架构。从下到上,神经元的等级越来越高。这个结构的局部中并没有很多的连接,每一个高级的神经元只会和下一个等级的神经元相连接。
基于神经科学,我们通过工程学的研究不断地发展人工智能。这是很重要的,因为我们还没有真正实现人工智能,而且还相距甚远。
深度学习可以帮助我们解决 10 %的难题,剩下的 90 %呢?我的答案是:我们可能也需要来自神经科学以及认知科学的研究,我们需要更好地了解人的思维和大脑。这也是我们 MIT 大脑、心智和机器中心(CBMM)在研究的问题,五年前我们开始开展相关的研究,我们的使命就是要在理解认知方面获得新的进步,同时也需要去了解整个智能的架构和智能背后的科学原理。关于智能的科学会帮助我们回答最宏大的问题,了解生命的起源、宇宙的起源以及时间的源头。大脑中智能的产生,是科学现在需要解决的元问题。
CBMM想通过以下三条路径解决这个问题:
1、计算机科学+机器学习
2、神经科学
3、认知科学
我们会同谷歌这样的商业公司合作,探索在工程和科学领域合作的可能。
过去几年中,技术发展和理论发展、包括深度神经网络领域的发展很显著。要了解深度神经网络的运作原理,需要回答背后的三个基本问题:
1、逼近理论:深层网络什么情况下会比浅层网络更有效?
2、最优化:应该如何设计经验风险函数?
3、学习理论:为什么深度学习不会产生过拟合?
这三个问题是机器学习的奠基石。他们的答案很复杂,要解决这种问题,我们需要一开始就思考深度学习的一些技术理论,以及它的局限性。
现在是应用人工智能的黄金时代,因为深度学习及其工程应用终于帮助我们将传统的人工智能科学理论应用于了工程实际,而且能够为我们进行赋能。假如我们可以超越深度学习的理论,可以更好的去了解人工智能的话,我们也可以更加深刻地了解我们人类到底是什么。
-End-