本期内容为《走进人工智能》:第5讲 模型定义下的人脸识别:四个参数画大象
《走进人工智能》
模型定义下的人脸识别:四个参数画大象
为了解决手工明确构造规则来进行人脸检测的不足,基于统计建模的机器学习方法被提出。用模型定义这种方法来识别人脸就是从构成人脸的数据出发来预先设计一个统计模型,通过判断要识别的东西是否与已经建立的人脸统计模型相匹配,来完成人脸识别任务。统计模型包含了数目不一的参数,需要通过不同方法来优化和学习,使得模型更好地完成任务。
这里出现了统计模型这一术语,统计指的是“统而记之”,即将数据统合到一起,来设计可产生数据的模型,从而完成计算。1985年11月,一位美国学者在英国牛津大学图书馆找到了一首诗,引起了此诗是否为莎士比亚所作的争论。论战两个月后,1986年1月美国《科学》(Science)杂志发表了一篇文章,题目是“莎士比亚的新诗:向统计学致敬(Shakespeare's new poem: an ode to statistics)”,文章中介绍了研究人员统计分析了莎士比亚作品和非莎士比亚作品中遣词造句的习惯,发现这首诗与莎士比亚写作风格一致,鉴定这首诗为莎士比亚所作,从而平息了这场争论。这个故事中,莎士比亚作品中遣词造句的风格就相当于一个统计模型。总结一下,为了让机器完成某个任务,可以为这个任务设计一个模型,观察数据是否能从模型中产生,好比“授之以鱼、不如授之以渔”。
一旦模型确定,需要参数来刻画模型。原子能之父费米(Enrico Fermi)曾经讲述过如下故事,他说冯·诺依曼(John von Neumann)曾经对他说过,用四个参数就可以画出一头大象,用五个参数就可以让大象鼻子动起来。更有趣的是,在2010年,三位德国科学家利用复数思想,还真用四个参数画出了大象,然后用五个参数让大象的鼻子动了起来。这说明从数据中找到模型本身以及合适参数,精确刻画数据产生模式,从“鱼”到“渔”,难能可贵。
产品名称:走进人工智能∣有声通识十五讲
主理人:吴飞
出品机构:高等教育出版社 、高等教育电子音像出版社
合作机构:浙江大学上海高等研究院、上海人工智能实验室智能教育中心
出品时间:2022年1月