【科普】吴飞教授：《走进人工智能》---第5讲数据驱动下的人脸识别：奥卡姆剃刀之化繁为简

2022 年 3 月 25 日 中国图象图形学学会CSIG

由高等教育出版社、高等教育电子音像出版社出品，浙江大学上海高等研究院联合上海人工智能实验室智能教育中心共同打造了原创人工智能前沿科普有声通识数字栏目——《走进人工智能》，主理人为浙江大学上海高等研究院常务副院长，浙江大学人工智能研究所所长、中国图象图形学学会理事、动画与数字娱乐专业委员会副主任 吴飞教授 ，本栏目已在喜马拉雅平台正式上线。

本期内容为《走进人工智能》：第5讲数据驱动下的人脸识别：奥卡姆剃刀之化繁为简

《走进人工智能》

第5讲

从机器学习到学习机器：智能算法的心之所向

数据驱动下的人脸识别：奥卡姆剃刀之化繁为简

由于现实生活中人脸图像的多样性和复杂性，很多时候无法事先定义人脸识别所需的规则和模型。因此，需要从数据出发，从数据中学习模型、而非定义模型来完成人脸识别任务，这一方法被称为数据驱动学习（Data-Driven Learning）范式。数据驱动学习就是从数据出发来学习数据中所蕴含的模式，对数据进行归纳和抽象。统计学家罗纳德·费舍尔（Ronald Aylmer Fisher）将这一过程概括为“化繁为简（The Object of Statistical Methods is the Reductionof Data）”，也就是统计学习中“奥卡姆”剃刀原理所言“如无必要、毋增实体”的理念。

来看看人脑是如何以“层层递进、逐层抽象”的方式进行人脸识别的：视觉信息进入视网膜，将视网膜上一片小区域照亮，激发光感受器细胞，光感受器就会兴奋，这就是感受野（Receptive Field）的基本定义。随后信号传入大脑后部枕叶的初级视觉皮层V1区（Primary visual Cortex，V1），在V1区抽象得到人脸轮廓信息。随后该信息在V2区、V3区和V4区被继续处理，逐步抽象得到人脸对象组成等信息，进而在大脑中形成了“人脸”这一认知结果。

从上面的过程可知，数据驱动下的人脸识别秉承“一切人脸尽在数据中”的理念，通过架构合适的学习方法，从人脸数据中学习人脸轮廓、边界、区域和对象等信息，最终完成人脸识别分类。在这一过程中，算法学习得到了一个犹如人脑的模型，再基于这个学习所得的模型完成人脸识别。

卡内基梅隆大学计算机学院教授汤姆·米切尔（Tom M. Mitchell）曾经从“学习”的角度来定义机器学习的本质，简单来说，假设我们拥有三样东西，分别是一个预先设定的任务，一个对任务完成效果进行评价的方法，和代表人类经验的大量数据，如果发现一个计算机程序在不断得到新数据之后完成任务的效果更好了，则认为它具有学习能力。

可以设想，在数据驱动的学习任务中，给机器的人脸图像数据越多，学习算法就能够捕获更多的人脸模式，从而极大地提升人脸识别效果。

小结

算法不断从数据和经验中进行学习，提升自身能力，从机器学习跃进到学习机器，这是智能算法的追求目标。规则指导、模型定义和数据驱动这三种方法在智能算法发展历史上均做出过应有的贡献，各领千秋。创建于1938年的复旦大学统计专业是中国大学中最早设立的统计专业，2021年11月，该专业更名为统计与数据科学系。恩格斯（Friedrich Engels）曾说过，“世界不是既成事物的集合体，而是过程的集合体”。统计模型拥抱海量数据，体现了从数据中来、从实践中来、再到实践中去的思想。从机器学习到学习机器，是智能算法的心之所向，让我们素履以往。以上是这一讲的全部内容，下一讲我们将介绍“从华丽转身到炼金术之困：深度学习”。

产品名称：走进人工智能∣有声通识十五讲

主理人：吴飞

出品机构：高等教育出版社、高等教育电子音像出版社

合作机构：浙江大学上海高等研究院、上海人工智能实验室智能教育中心

出品时间：2022年1月