“1860年有人问法拉第,你的电磁理论现在有什么用?他回答,你认为一个新生婴儿有什么用?”
昨天,计算机视觉领域奠基人之一Alan Yuille在上海交大做了一场演讲。他把人工智能目前所处的状态比做一个新生儿,而其要想有所进步,需要基础理论上的发展。
Alan Yuille早年曾在剑桥大学跟随斯蒂芬·霍金教授研究理论物理,之后转而开拓计算机视觉领域。他目前是约翰霍普金斯大学(JHU)的认知科学与计算机科学教授。此前,他曾任职于加州大学洛杉矶分校(UCLA)统计系,并担任视觉识别与机器学习中心主任。他曾获计算机视觉论文最高奖马尔奖,也曾担任计算机视觉的顶级会议CVPR的主席。
而Alan Yuille的学生朱珑博士,作为联合创始人,在上海创立了被李开复老师誉为“图像识别四大独角兽”之一的依图科技。
昨天,在上海交通大学的演讲上,两位在计算机视觉领域都颇有成就的师生同台,分别聊了聊各自对人工智能和计算机视觉发展的看法。
12月19日,Alan Yuille教授在上海交通大学做了演讲
Alan Yuille教授首次将“学习”引入计算机视觉领域,最早使用能量模型和概率推断,也就是后来的统计图模型;他也是最早且最重要的将贝叶斯理论应用在计算机视觉和心理学感知方面的推动者。
大数据文摘整理了Alan Yuille演讲内容,在不改变原意的前提下有删改:
演讲内容
今天非常荣幸能来到上海,来到上海交大,能有这么好的机会跟来自学术界、工业界、政府的各位交谈。
我今天想讨论的就是学术界、工业界和社会之间的关系。
回顾一下历史,150年前,电力刚刚开始进行应用;1860年,法拉第和麦克斯韦建立了电磁理论。当时有人问法拉第,你的研究成果现在有什么用?他回答,你认为一个新生婴儿有什么用?所以我想告诉大家,正是由于有了这些基础的发明和技术进步,整个行业就可以更好地利用发明。之后在伦敦、芝加哥、其他地方,有了更多的电力应用。1893年,照明开始出现在芝加哥,19世纪末,出现了电报。这一切都是当时人们基于对基础科学理解的应用。
上上个世纪,并没有像硅谷这样的地方,也没有很好的产学研三者结合的机制。但不管怎么说,当时的英国是比较开放的,当时正好工业革命也没有结束。电力发明在全球各地有了越来越多的应用。当然这种应用,不仅仅是限于英国,逐渐传播到了美国乃至更多地方。
人工智能不是静态的
今天我们讨论到人工智能,它的情况又是如何?
人工智能研究起步于1956年,这跟我个人的生日一样,我觉得这是一种缘分。从1956年一直到今天,它的发展道路颠簸不平。到2010年以后,人工智能行业有了长足、迅速的发展。以前很多人会问,你学习人工智能有什么用?但现在我们可以看到,人工智能发展非常快,不知道会发展到什么程度。如果要真正应用好人工智能,必须解决一些比较基础的问题。
我在研究上能感受到非常多的挑战和乐趣。在过去几十年间,人工智能取得了巨大进展,几十年前甚至90年代的人工智能和现在的相比,有巨大的不同。90年代,大家对人工智能的理解,就是有一台深蓝电脑可以跟人下国际象棋。到现在,人工智能已经取得了长足的进展,比如人脸识别、医疗辅助诊断、语音识别等。虽然处于一个比较初步的阶段,但也出现了逐步融合、渗透的现象。
吴恩达去年说,人工智能是新的电力。对物理学的基础理论,大家都非常了解,基于这些基础理论,我们正在做更多应用和发展。人工智能不是静态的,不是停滞不前的,而是在不断发展的。吴恩达的观点是正确的,我们可以把人工智能看作是上上个世纪出现的电能一样。我们不知道以人工智能为基础,会发展出更多什么样的新事物。对整个产业界来说,应该有足够的数据告诉我们怎么去做。
人工智能对社会也会有非常大的影响,就好像上上个世纪大家如何应用电力对社会的影响一样。我的老师霍金也曾经讨论过人工智能,他认为,我们应当为人工智能的使用制定恰当的政策。
人工智能需要在基础理论上更好地发展
我们再看学术界。学术界在很多方面都是人工智能发展的前沿。丘成桐教授曾经举办过数学竞赛,他特别提到了人工智能加速发展的情况。如果要让人工智能更好地发展,需要在基础理论上有所发展。这方面,我们需要有更多理解。有人说,将来也许人工智能将会替代人类大脑的一些工作,但还是可以看到人工智能跟人类的大脑有巨大的差别。相对来说,人类在灵活性、创新性方面做得更好,但人工智能在其他方面可能会做得更好。
以深度学习的神经网络为例。比如说丛林里有只猴子,给它一把吉他,对深度学习网络来说,它会把拿着吉他的猴子识别成人,因为它以前从来没有见到这样的情况。这种情况下,人类就会很好地处理,会知道是一只猴子拿了吉他,而不是人拿了吉他,不会不知所措。
我的一个博士学生也是上海交大毕业的,非常聪明好学,他的研究方向就是深度学习网络。对人类来说,人类的大脑可以更灵活,而且适应性更强。比如孩子,也可以自己学习,更好地了解这个世界的情况。关于组合模型,有这么一种情况,我们不能只靠深度学习网络,所以要有先进的理论和人工智能科技。我们并不是要集成以前的方式,而是要开发更多的新领域的研究。
人脸识别的案例
我在这里举一些依图的案例。人脸识别方面,以前我们没法在复杂的情况下识别人脸,现在可以实时地分辨出千百万人的脸,这非常让人印象深刻。医疗诊断方面,人工智能在今后几年会有很大进步,计算机图像识别能让我们判定出很多非常不好的疾病,比如肺癌,让我们能迅速制订出治疗方案;同时对医疗记录的读取也非常重要,通过机器读取人的病例,提取其中的信息。我们就需要开发相应的算法,让机器能理解病例信息,通过对模式的理解来识别某个病人出现的问题。智慧城市方面,人工智能可以改进城市交通。我住在洛杉矶,对洛杉矶非常熟悉,通过人工智能,我们能非常容易地了解到整个城市的交通状况,重新进行线路规划和定位。所有这些领域的应用,都需要有足够好的算法和足够多的数据进行支撑。
工业界、学术界和社会要一起合作。人工智能发展需要数据,这需要整个社会和政府来支持。现在业界获取数据并不是很容易,我们要获得数据、提升人工智能的性能。另外,并不只是单向地获取数据,我们需要与相关数据生产商、获取者,比如医生,进行深度交流,这样才能更好地获取数据。
如何将学术界、产业界和社会进行连接?他们在人工智能时代,扮演着不同的角色。学术界负责培训人才,让人才知道怎么解决问题,开发人工智能方面的前沿领域;学术界、工业界和社会之间的合作,能让工业界获得更好的数据,和学术界进行更好的合作,这样一来,才能让工业界获得更好的人才,同时将自己对知识的理解和应用更好地回馈给学术界和社会。不管怎么说,这种三边关系非常重要。将这三者分割开,整个开发过程就会速度变慢很多。
以下是在过去十到十五年里我的一些个人经验,比如通过人工智能帮助盲人进行导航,利用人工智能提升老年人和残疾人的生活质量。在洛杉矶,我们已经在使用人工智能去发现路障,现在人工智能已经能非常容易地从事这项工作了。在最开始,我们在学术界研究如何侦测物体,硅谷和其他地区的公司将人工智能软件嵌入到智能手机里使用。对于技术,我们必须知道用户需要的是什么,我们不能只是关注技术,而忽视用户体验。同时,对于人,我们必须知道如何让人们更容易地使用,不能让他们只用一次就束之高阁。
另外,我们进行了医学上的应用,医疗影像公司和医学院相关部门进行紧密合作。通过人工智能,可以预测身体哪部分会产生疾病,并进行预防性治疗;通过身体分部位的诊断,我们就可以进行提前预防。我们也可以在其中找到很多血管、细小的病灶。所有这些应用,都是我们做人工智能的一个出发点。
人工智能会对社会产生深远影响,就像19世纪的电力一样。电力对整个社会变革,已经产生了极大的推动作用。我们必须让学术界、产业界和社会共同做贡献,携手联合,每一个部门都有很重要的角色可以发挥。
在人工智能发展上中国的优势
第一,中国有很多优秀毕业生,有很多人与我在网上进行联系,我看到中国在这方面有很多的人才储备。与其他国家人才储备形成了鲜明对比。
第二,整个社会和工业界在这方面非常积极,我看到中国社会在过去20年里变化非常巨大,中国高铁就是一个案例。这种高铁与美国相比,是非常了不起的一个成就。我与丘成桐先生也开过玩笑,从波士顿去纽约很慢,我们在高铁上已经落后于中国20年了。中国在发展高新技术上非常热衷。
第三,从头开始发展,要比在原来的基础上进行变革更容易。因为在很多其他地方,很多产业已经成型了,变革并不容易,但中国在很多方面仍然是空白的,白手起家,可以没有顾忌,可以进行很多大胆的技术应用。
中国有这么多优势,我认为人工智能会在中国发展得非常好。虽然美国有硅谷,但在中国,从政府到工业界到学术界,都在支持人工智能的发展。中国在这方面,也取得了很多成就。
非常感谢你们的聆听!感谢你们的邀请!
师生情小细节:
朱珑是Alan的第一个博士生,而现场还有一位为Alan打call的老爷爷是Alan的第一个博士后,他是徐雷:国家千人,致远讲席教授,IEEE Fellow,国际模式识别学会Fellow,欧洲科学院院士,上海交通大学脑科学与技术研究中心首席科学家,上海交大电信学院认知机器与计算健康研究中心主任。
大数据文摘发自上海
记者:谭婧
往期精彩文章
点击图片阅读
一颗被冷冻了五年的头颅被它一眼认出 计算机视觉识别让尸骨开口说话