深度人脸表情识别研究进展

2021 年 3 月 5 日 专知


随着人脸表情识别任务逐渐从实验室受控环境转移至具有挑战性的真实世界环境,在深度学习技术的迅猛发展下,深度神经网络能够学习出具有判别能力的特征,逐渐应用于自动人脸表情识别任务。目前的深度人脸表情识别系统致力于解决以下两个问题:1)由于缺乏足量训练数据导致的过拟合问题;2)真实世界环境下其他与表情无关因素变量(例如光照、头部姿态和身份特征)带来的干扰问题。本文首先对近十年深度人脸表情识别方法的研究现状以及相关人脸表情数据库的发展进行概括。然后,将目前基于深度学习的人脸表情识别方法分为两类:静态人脸表情识别和动态人脸表情识别,并对这两类方法分别进行介绍和综述。针对目前领域内先进的深度表情识别算法,对其在常见表情数据库上的性能进行了对比并详细分析了各类算法的优缺点。最后本文对该领域的未来研究方向和机遇挑战进行了总结和展望:考虑到表情本质上是面部肌肉运动的动态活动,基于动态序列的深度表情识别网络往往能够取得比静态表情识别网络更好的识别效果。此外,结合其他表情模型如面部动作单元模型以及其他多媒体模态,如音频模态和人体生理信息能够将表情识别拓展到更具有实际应用价值的场景。



面部表情是人类表达情感和意图最为有效和普遍的方式之一(Darwin和Prodger,1998Tian等,2001)。自动人脸表情分析在日常生活中有众多应用,例如社交机器人、医疗服务、疲劳驾驶检测以及其他人机交互系统等。达尔文进化论发现人类脸部的丰富表情是自然选择的结果。在进化初期,古人类具有恐惧等简单表情,它协助增大了瞳孔的通光量,帮助他们在危险时成功逃脱;在社交活动中,人们逐步进化出了微笑、内疚等复杂面部动作来表达内心情感。到了现代,面部肌肉可以组合出成百上千种动作,各种族进化出各异的情感表达方式。著名心理学家Ekman发现,有6类基本表情是全球通用的,各种族间可以相互识别,甚至连与世隔绝的部落和哺乳动物都有着相似的表情。据此,Ekman和Friesen(1971)通过大量的跨文化研究(Ekman,1994)定义了6类基础表情:生气、厌恶、害怕、开心、悲伤和惊讶。由此,学术界普遍通过这6类基础表情的分类研究开始计算机自动表情识别的探索。



根据特征表示的不同,人脸表情识别系统主要分为两大类:静态图片人脸表情识别和动态序列人脸表情识别。在静态识别方法中,仅有单幅图像的空间信息被编码于特征表示中。而在动态识别方法中,输入的人脸表情序列中连续帧之间的时间关系也被纳入考虑范围内。


传统方法大多运用手工设计特征或者浅层学习,例如局部二值模式(local binary pattern,LBP)(Shan等,2009)、三正交平面的局部二值模式(local binary pattern from three orthogonal planes,LBP-TOP)(Zhao和Pietikainen,2007)、非负矩阵分解(nonnegative matrix factorization,NMF)(Zhi等,2011)和稀疏学习(Zhong等,2012)来进行人脸表情识别。2013年起,表情识别比赛如FER2013(the Facial Expression Recognition 2013)(Goodfellow等,2013)和EmotiW(Dhall等,201520162017)从具有挑战性的真实世界场景中收集了相对充足的训练样本,促进了人脸表情识别从实验室受控环境到自然环境下的转换。从研究对象来看,表情识别领域正经历着从实验室摆拍到真实世界的自发表达、从长时间持续的夸张表情到瞬时出现的微表情、从基础表情分类到复杂表情分析的快速发展。



同时,由于芯片处理能力(如GPU单元)的迅猛增长和网络体系结构的精心设计,各个领域的研究开始转向利用深度学习解决各种问题,并且也取得了远超先前方法的识别结果(Krizhevsky等,2012Simonyan和Zisserman,2014bSzegedy等,2015)。同样地,深度学习技术也逐渐运用到人脸表情识别中处理各种复杂的干扰因素。图 1展示了自2007年以来人脸表情数据库以及表情识别算法的发展情况, 如DAE(deep autoencoder)、LP(locality-preserving)loss和IACNN(identity-aware CNN)等。


尽管深度学习有着强大的特征表示能力,其在进行人脸表情识别时仍存在一些问题。首先,深度网络需要大量充足的训练数据来避免过拟合问题。然而,现存的人脸表情数据量不足以很好地训练目前在物体识别任务中取得良好效果的较大深度网络结构。其次,由于人物属性的不同,例如年龄、性别、种族背景和表达能力水平(Valstar等,2012),不同对象间存在较大的差异性。除此之外,姿态、光照和阻挡等变量在不受约束的人脸表情场景中也十分常见。这些因素通常非线性地与人脸表情耦合在一起,从而加强了对利用深度网络来解决较大类内差距以及学习具有高效表情判别能力特征的需求。


http://www.cjig.cn/jig/ch/reader/create_pdf.aspx?file_no=20201102&flag=1&year_id=2020&quarter_id=11


专知便捷查看

便捷下载,请关注专知公众号(点击上方蓝色专知关注)

  • 后台回复“DFR” 就可以获取深度人脸表情识别研究进展》专知下载链接

专知,专业可信的人工智能知识分发,让认知协作更快更好!欢迎注册登录专知www.zhuanzhi.ai,获取5000+AI主题干货知识资料!
欢迎微信扫一扫加入专知人工智能知识星球群,获取最新AI专业干货知识教程资料和与专家交流咨询
点击“ 阅读原文 ”,了解使用 专知 ,查看获取5000+AI主题知识资源
登录查看更多
5

相关内容

专知会员服务
43+阅读 · 2021年4月18日
专知会员服务
61+阅读 · 2021年3月9日
多模态情绪识别研究综述
专知会员服务
166+阅读 · 2020年12月21日
专知会员服务
57+阅读 · 2020年12月6日
多模态视觉语言表征学习研究综述
专知会员服务
191+阅读 · 2020年12月3日
专知会员服务
105+阅读 · 2020年11月27日
专知会员服务
37+阅读 · 2020年8月19日
鲁棒模式识别研究进展
专知会员服务
40+阅读 · 2020年8月9日
专知会员服务
220+阅读 · 2020年8月1日
图像修复研究进展综述
专知
19+阅读 · 2021年3月9日
论文盘点:人脸表情识别解析
PaperWeekly
13+阅读 · 2020年7月26日
SFFAI分享 | 黄健:语音情感识别【附PPT与视频资料】
人工智能前沿讲习班
30+阅读 · 2019年6月11日
计算机视觉方向简介 | 人脸表情识别
计算机视觉life
36+阅读 · 2019年5月15日
人脸识别研究取得进展
中科院之声
4+阅读 · 2019年3月26日
微表情检测和识别的研究进展与趋势
中国计算机学会
15+阅读 · 2018年3月23日
视频行为识别年度进展
深度学习大讲堂
34+阅读 · 2017年6月12日
VALSE2017系列之三:人体姿态识别领域年度进展报告
深度学习大讲堂
5+阅读 · 2017年5月12日
Arxiv
13+阅读 · 2021年3月29日
Arxiv
7+阅读 · 2021年3月15日
Arxiv
3+阅读 · 2019年6月5日
Risk-Aware Active Inverse Reinforcement Learning
Arxiv
7+阅读 · 2019年1月8日
Arxiv
7+阅读 · 2018年12月26日
Learning Blind Video Temporal Consistency
Arxiv
3+阅读 · 2018年8月1日
A Multi-Objective Deep Reinforcement Learning Framework
Arxiv
13+阅读 · 2018年1月20日
Arxiv
7+阅读 · 2018年1月18日
VIP会员
相关VIP内容
专知会员服务
43+阅读 · 2021年4月18日
专知会员服务
61+阅读 · 2021年3月9日
多模态情绪识别研究综述
专知会员服务
166+阅读 · 2020年12月21日
专知会员服务
57+阅读 · 2020年12月6日
多模态视觉语言表征学习研究综述
专知会员服务
191+阅读 · 2020年12月3日
专知会员服务
105+阅读 · 2020年11月27日
专知会员服务
37+阅读 · 2020年8月19日
鲁棒模式识别研究进展
专知会员服务
40+阅读 · 2020年8月9日
专知会员服务
220+阅读 · 2020年8月1日
相关资讯
图像修复研究进展综述
专知
19+阅读 · 2021年3月9日
论文盘点:人脸表情识别解析
PaperWeekly
13+阅读 · 2020年7月26日
SFFAI分享 | 黄健:语音情感识别【附PPT与视频资料】
人工智能前沿讲习班
30+阅读 · 2019年6月11日
计算机视觉方向简介 | 人脸表情识别
计算机视觉life
36+阅读 · 2019年5月15日
人脸识别研究取得进展
中科院之声
4+阅读 · 2019年3月26日
微表情检测和识别的研究进展与趋势
中国计算机学会
15+阅读 · 2018年3月23日
视频行为识别年度进展
深度学习大讲堂
34+阅读 · 2017年6月12日
VALSE2017系列之三:人体姿态识别领域年度进展报告
深度学习大讲堂
5+阅读 · 2017年5月12日
相关论文
Arxiv
13+阅读 · 2021年3月29日
Arxiv
7+阅读 · 2021年3月15日
Arxiv
3+阅读 · 2019年6月5日
Risk-Aware Active Inverse Reinforcement Learning
Arxiv
7+阅读 · 2019年1月8日
Arxiv
7+阅读 · 2018年12月26日
Learning Blind Video Temporal Consistency
Arxiv
3+阅读 · 2018年8月1日
A Multi-Objective Deep Reinforcement Learning Framework
Arxiv
13+阅读 · 2018年1月20日
Arxiv
7+阅读 · 2018年1月18日
Top
微信扫码咨询专知VIP会员