Facial expressions are one of the most powerful ways for depicting specific patterns in human behavior and describing human emotional state. Despite the impressive advances of affective computing over the last decade, automatic video-based systems for facial expression recognition still cannot handle properly variations in facial expression among individuals as well as cross-cultural and demographic aspects. Nevertheless, recognizing facial expressions is a difficult task even for humans. In this paper, we investigate the suitability of state-of-the-art deep learning architectures based on convolutional neural networks (CNNs) for continuous emotion recognition using long video sequences captured in-the-wild. This study focuses on deep learning models that allow encoding spatiotemporal relations in videos considering a complex and multi-dimensional emotion space, where values of valence and arousal must be predicted. We have developed and evaluated convolutional recurrent neural networks combining 2D-CNNs and long short term-memory units, and inflated 3D-CNN models, which are built by inflating the weights of a pre-trained 2D-CNN model during fine-tuning, using application-specific videos. Experimental results on the challenging SEWA-DB dataset have shown that these architectures can effectively be fine-tuned to encode the spatiotemporal information from successive raw pixel images and achieve state-of-the-art results on such a dataset.


翻译:面部表达方式是描述人类行为和描述人类情绪状态的具体模式的最有力方法之一。尽管过去十年来情感计算取得了令人印象深刻的进展,但是用于面部表达识别的自动视频系统仍然无法正确处理个人面部表达以及跨文化和人口方面的差异。然而,承认面部表达方式是人类甚至难以完成的任务。在本文中,我们调查了基于超动神经网络的先进深层学习结构是否适合使用在网上捕捉的长视频序列来持续识别情感。这项研究侧重于深层学习模式,这些模式允许视频中进行线性情感关系编码,考虑到复杂的多维度情感空间,必须预测价值和令人振奋的价值观。我们开发并评估了共振的循环神经网络,其中结合了2D-CNNs和长短程短时间单元,以及3D-CNN模型的膨胀,这些模型是通过在微调过程中将经过训练的2D-CNN模型的重量加增而建立的。在微调整过程中,利用应用特定特定图像空间空间的图像空间,这些连续的实验结果能够对SEV-CA的原始数据结构产生挑战性结果。

0
下载
关闭预览

相关内容

让 iOS 8 和 OS X Yosemite 无缝切换的一个新特性。 > Apple products have always been designed to work together beautifully. But now they may really surprise you. With iOS 8 and OS X Yosemite, you’ll be able to do more wonderful things than ever before.

Source: Apple - iOS 8
剑桥大学《数据科学: 原理与实践》课程,附PPT下载
专知会员服务
49+阅读 · 2021年1月20日
【2020新书】Python文本分析,104页pdf
专知会员服务
98+阅读 · 2020年12月23日
【干货书】机器学习Primer,122页pdf
专知会员服务
106+阅读 · 2020年10月5日
100+篇《自监督学习(Self-Supervised Learning)》论文最新合集
专知会员服务
164+阅读 · 2020年3月18日
AAAI2020 图相关论文集
图与推荐
10+阅读 · 2020年7月15日
Graph Neural Networks 综述
计算机视觉life
29+阅读 · 2019年8月13日
自然语言处理常见数据集、论文最全整理分享
深度学习与NLP
11+阅读 · 2019年1月26日
人工智能 | 国际会议截稿信息9条
Call4Papers
4+阅读 · 2018年3月13日
Capsule Networks解析
机器学习研究会
11+阅读 · 2017年11月12日
可解释的CNN
CreateAMind
17+阅读 · 2017年10月5日
最佳实践:深度学习用于自然语言处理(三)
待字闺中
3+阅读 · 2017年8月20日
SlowFast Networks for Video Recognition
Arxiv
4+阅读 · 2019年4月18日
CoCoNet: A Collaborative Convolutional Network
Arxiv
6+阅读 · 2019年1月28日
Arxiv
31+阅读 · 2018年11月13日
Arxiv
21+阅读 · 2018年5月23日
VIP会员
相关资讯
AAAI2020 图相关论文集
图与推荐
10+阅读 · 2020年7月15日
Graph Neural Networks 综述
计算机视觉life
29+阅读 · 2019年8月13日
自然语言处理常见数据集、论文最全整理分享
深度学习与NLP
11+阅读 · 2019年1月26日
人工智能 | 国际会议截稿信息9条
Call4Papers
4+阅读 · 2018年3月13日
Capsule Networks解析
机器学习研究会
11+阅读 · 2017年11月12日
可解释的CNN
CreateAMind
17+阅读 · 2017年10月5日
最佳实践:深度学习用于自然语言处理(三)
待字闺中
3+阅读 · 2017年8月20日
Top
微信扫码咨询专知VIP会员