本期内容为《走进人工智能》:第5讲 数据驱动下的人脸识别:奥卡姆剃刀之化繁为简
《走进人工智能》
数据驱动下的人脸识别:奥卡姆剃刀之化繁为简
由于现实生活中人脸图像的多样性和复杂性,很多时候无法事先定义人脸识别所需的规则和模型。因此,需要从数据出发,从数据中学习模型、而非定义模型来完成人脸识别任务,这一方法被称为数据驱动学习(Data-Driven Learning)范式。数据驱动学习就是从数据出发来学习数据中所蕴含的模式,对数据进行归纳和抽象。统计学家罗纳德·费舍尔(Ronald Aylmer Fisher)将这一过程概括为“化繁为简(The Object of Statistical Methods is the Reductionof Data)”,也就是统计学习中“奥卡姆”剃刀原理所言“如无必要、毋增实体”的理念。
来看看人脑是如何以“层层递进、逐层抽象”的方式进行人脸识别的:视觉信息进入视网膜,将视网膜上一片小区域照亮,激发光感受器细胞,光感受器就会兴奋,这就是感受野(Receptive Field)的基本定义。随后信号传入大脑后部枕叶的初级视觉皮层V1区(Primary visual Cortex,V1),在V1区抽象得到人脸轮廓信息。随后该信息在V2区、V3区和V4区被继续处理,逐步抽象得到人脸对象组成等信息,进而在大脑中形成了“人脸”这一认知结果。
从上面的过程可知,数据驱动下的人脸识别秉承“一切人脸尽在数据中”的理念,通过架构合适的学习方法,从人脸数据中学习人脸轮廓、边界、区域和对象等信息,最终完成人脸识别分类。在这一过程中,算法学习得到了一个犹如人脑的模型,再基于这个学习所得的模型完成人脸识别。
卡内基梅隆大学计算机学院教授汤姆·米切尔(Tom M. Mitchell)曾经从“学习”的角度来定义机器学习的本质,简单来说,假设我们拥有三样东西,分别是一个预先设定的任务,一个对任务完成效果进行评价的方法,和代表人类经验的大量数据,如果发现一个计算机程序在不断得到新数据之后完成任务的效果更好了,则认为它具有学习能力。
可以设想,在数据驱动的学习任务中,给机器的人脸图像数据越多,学习算法就能够捕获更多的人脸模式,从而极大地提升人脸识别效果。
小结
产品名称:走进人工智能∣有声通识十五讲
主理人:吴飞
出品机构:高等教育出版社 、高等教育电子音像出版社
合作机构:浙江大学上海高等研究院、上海人工智能实验室智能教育中心
出品时间:2022年1月