【科普】吴飞教授：《走进人工智能》---第5讲模型定义下的人脸识别：四个参数画大象

2022 年 3 月 24 日 中国图象图形学学会CSIG

由高等教育出版社、高等教育电子音像出版社出品，浙江大学上海高等研究院联合上海人工智能实验室智能教育中心共同打造了原创人工智能前沿科普有声通识数字栏目——《走进人工智能》，主理人为浙江大学上海高等研究院常务副院长，浙江大学人工智能研究所所长、中国图象图形学学会理事、动画与数字娱乐专业委员会副主任 吴飞教授 ，本栏目已在喜马拉雅平台正式上线。

本期内容为《走进人工智能》：第5讲模型定义下的人脸识别：四个参数画大象

《走进人工智能》

第5讲

从机器学习到学习机器：智能算法的心之所向

模型定义下的人脸识别：四个参数画大象

为了解决手工明确构造规则来进行人脸检测的不足，基于统计建模的机器学习方法被提出。用模型定义这种方法来识别人脸就是从构成人脸的数据出发来预先设计一个统计模型，通过判断要识别的东西是否与已经建立的人脸统计模型相匹配，来完成人脸识别任务。统计模型包含了数目不一的参数，需要通过不同方法来优化和学习，使得模型更好地完成任务。

这里出现了统计模型这一术语，统计指的是“统而记之”，即将数据统合到一起，来设计可产生数据的模型，从而完成计算。1985年11月，一位美国学者在英国牛津大学图书馆找到了一首诗，引起了此诗是否为莎士比亚所作的争论。论战两个月后，1986年1月美国《科学》（Science）杂志发表了一篇文章，题目是“莎士比亚的新诗：向统计学致敬（Shakespeare's new poem: an ode to statistics）”，文章中介绍了研究人员统计分析了莎士比亚作品和非莎士比亚作品中遣词造句的习惯，发现这首诗与莎士比亚写作风格一致，鉴定这首诗为莎士比亚所作，从而平息了这场争论。这个故事中，莎士比亚作品中遣词造句的风格就相当于一个统计模型。总结一下，为了让机器完成某个任务，可以为这个任务设计一个模型，观察数据是否能从模型中产生，好比“授之以鱼、不如授之以渔”。

一旦模型确定，需要参数来刻画模型。原子能之父费米（Enrico Fermi）曾经讲述过如下故事，他说冯·诺依曼（John von Neumann）曾经对他说过，用四个参数就可以画出一头大象，用五个参数就可以让大象鼻子动起来。更有趣的是，在2010年，三位德国科学家利用复数思想，还真用四个参数画出了大象，然后用五个参数让大象的鼻子动了起来。这说明从数据中找到模型本身以及合适参数，精确刻画数据产生模式，从“鱼”到“渔”，难能可贵。

回到人脸识别这个任务上来，在基于统计建模的人脸识别学习中，可以定义一个模型来刻画构成人脸的像素点数据产生机制，解释为什么这些像素点按照模型预设模式就可以生成一幅人脸。给定一幅未知的人脸图像，可以去判断构成这幅人脸图像的像素点是否符合已定义模型，从而完成识别任务，就好比去分析作品中遣词造句使用模式是否与莎士比亚写作习惯一致，来完成莎士比亚作品鉴别一样。

产品名称：走进人工智能∣有声通识十五讲

主理人：吴飞

出品机构：高等教育出版社、高等教育电子音像出版社

合作机构：浙江大学上海高等研究院、上海人工智能实验室智能教育中心

出品时间：2022年1月

中国图象图形学学会高校志愿者招募

中国图象图形学学会关于征集2022重大科学问题、工程技术难题和产业技术问题的通知

中国图象图形学学会关于组织开展科技成果鉴定的通知

2022年CSIG图像图形中国行承办方征集中

登录查看更多

相关内容

吴飞

关注 1

吴飞，浙江大学上海高等研究院、常务副院长、求是特聘教授、国家杰青获得者、浙江大学人工智能研究所所长；科技部重点研发计划项目负责人，主持国家自然科学基金重点项目2项。主要研究领域为人工智能、多媒体分析与检索和统计学习理论。入选“高校计算机专业优秀教师奖励计划”，曾获宝钢优秀教师奖。中国工程院院刊Engineering信息与电子工程学科执行主编。著有《人工智能导论：模型与算法》，开设国家级首批一流线上课程《人工智能：模型与算法》。