项目名称: 真实自发情感的听视觉多模态实时心理学连续维度分析

项目编号: No.61273265

项目类型: 面上项目

立项/批准年度: 2013

项目学科: 自动化技术、计算机技术

项目作者: 蒋冬梅

作者单位: 西北工业大学

项目金额: 79万元

中文摘要: 录制听视觉真实自发情感数据库,进行情感类别和心理学情感维度多层标注;提取语音情感特征、面部表情特征和语言关键词特征,基于心理学维度空间,采用转换卡尔曼滤波器(SKF)对情感状态进行实时连续估计,考察情感特征对状态估计的有效性;设计基于SKF的多模态动态贝叶斯网络(DBN)模型,实现听视觉融合的实时连续情感维度估计,提高情感分析的准确性和鲁棒性;建立状态耦合DBN模型,以估计到的心理学情感维度作为观测序列,利用DBN在线推理算法,对语音或视频中的情感进行即时分割和分类。项目克服了传统情感识别方法的两个缺点:1)只有在一段视频结束之后才能识别情感类别的缺点,能够实时进行情感状态分析;2)只能对有限类别情感进行离散划分的缺点,能得到情感的心理学连续维度变化,描述复杂的复合情感。该研究在智能监控、人机交互、自适应游戏设计、自闭症和老年痴呆症辅助治疗、服务质量评价等领域有重要研究意义和广泛应用前景。

中文关键词: 听视觉真实自发情感数据库;离散情感识别;连续情感维度估计;DBLSTM-RNN;DRNN

英文摘要: This project focuses on the on-line audio visual multi-modal analysis of spontaneous emotions in the psychological continuous dimensional space. Firstly an audio visual spontaneous emotion database will be recorded and annotated with emotion labels as well as the arousal and valence values. After the emotional features are extracted from speech, face image sequence and key words, a switching Kalman filter is designed to estimate the arousal and valence values of the emotion on-line. To improve the accuracy and robustness of the estimation, multi-modal Dynamic Bayesian Network (DBN) models based on switching Kalman filter will be designed to fuse the audio visual and linguistic features. Finally a coupled DBN model will be built to classify and segment the emotions in a video, with the estimated arousal and valence values as input. The advantages of the proposed methods lies in: 1) on-line affect state analysis can be done on speech or face videos, whereas the traditional emotion recognition methods only can get the results after the whole video ends; 2) continuous arousal and valence dimensions can be obtained to depict the complex non-basic emotion patterns, whereas the traditional methods only classify emotions with limited labels and can't depict the composite emotions in real life. This research is essential

英文关键词: audio visual spontaneous emotion database;categorical emotion recognition;continuous affect recognition;DBLSTM-RNN;DRNN

成为VIP会员查看完整内容
0

相关内容

深度学习激活函数全面综述论文
专知会员服务
69+阅读 · 2021年10月1日
面向数据可视化的自然语言接口: 综述论文
专知会员服务
18+阅读 · 2021年9月12日
专知会员服务
54+阅读 · 2021年4月20日
专知会员服务
55+阅读 · 2021年3月5日
多模态情绪识别研究综述
专知会员服务
159+阅读 · 2020年12月21日
【ACM MM2020】跨模态分布匹配的半监督多模态情感识别
专知会员服务
42+阅读 · 2020年9月8日
连续直播70天,竟无人察觉这是个虚拟人
机器之心
0+阅读 · 2021年12月23日
语音合成:模拟最像人类声音的系统
PaperWeekly
2+阅读 · 2021年11月30日
基于虚拟现实环境的深度学习模型构建
MOOC
23+阅读 · 2019年9月28日
可视化循环神经网络的注意力机制
论智
22+阅读 · 2018年9月23日
【团队新作】连续情感识别,精准捕捉你的小情绪!
中国科学院自动化研究所
16+阅读 · 2018年4月17日
国家自然科学基金
9+阅读 · 2015年12月31日
国家自然科学基金
1+阅读 · 2013年12月31日
国家自然科学基金
0+阅读 · 2013年12月31日
国家自然科学基金
4+阅读 · 2012年12月31日
国家自然科学基金
2+阅读 · 2011年12月31日
国家自然科学基金
0+阅读 · 2009年12月31日
国家自然科学基金
0+阅读 · 2009年12月31日
国家自然科学基金
1+阅读 · 2008年12月31日
Optimization for deep learning: theory and algorithms
Arxiv
102+阅读 · 2019年12月19日
Arxiv
12+阅读 · 2018年9月5日
Arxiv
11+阅读 · 2018年5月21日
Arxiv
14+阅读 · 2018年5月15日
小贴士
相关VIP内容
深度学习激活函数全面综述论文
专知会员服务
69+阅读 · 2021年10月1日
面向数据可视化的自然语言接口: 综述论文
专知会员服务
18+阅读 · 2021年9月12日
专知会员服务
54+阅读 · 2021年4月20日
专知会员服务
55+阅读 · 2021年3月5日
多模态情绪识别研究综述
专知会员服务
159+阅读 · 2020年12月21日
【ACM MM2020】跨模态分布匹配的半监督多模态情感识别
专知会员服务
42+阅读 · 2020年9月8日
相关基金
国家自然科学基金
9+阅读 · 2015年12月31日
国家自然科学基金
1+阅读 · 2013年12月31日
国家自然科学基金
0+阅读 · 2013年12月31日
国家自然科学基金
4+阅读 · 2012年12月31日
国家自然科学基金
2+阅读 · 2011年12月31日
国家自然科学基金
0+阅读 · 2009年12月31日
国家自然科学基金
0+阅读 · 2009年12月31日
国家自然科学基金
1+阅读 · 2008年12月31日
微信扫码咨询专知VIP会员