FSER:深刻的革命神经网络,以发声情感识别 (FSER: Deep Convolutional Neural Networks for Speech Emotion Recognition)

Using mel-spectrograms over conventional MFCCs features, we assess the abilities of convolutional neural networks to accurately recognize and classify emotions from speech data. We introduce FSER, a speech emotion recognition model trained on four valid speech databases, achieving a high-classification accuracy of 95,05\%, over 8 different emotion classes: anger, anxiety, calm, disgust, happiness, neutral, sadness, surprise. On each benchmark dataset, FSER outperforms the best models introduced so far, achieving a state-of-the-art performance. We show that FSER stays reliable, independently of the language, sex identity, and any other external factor. Additionally, we describe how FSER could potentially be used to improve mental and emotional health care and how our analysis and findings serve as guidelines and benchmarks for further works in the same direction.

翻译：使用常规 MFCC 常规功能的中分光谱,我们评估进化神经网络准确识别和分类语言数据的能力。我们引入了FSER,这是在四个有效语言数据库中培训的语音情感识别模型,实现了95,05 ⁇ 的高分类准确度,超过8个不同的情感类别:愤怒、焦虑、平静、厌恶、幸福、中立、悲伤、惊讶。在每一个基准数据集中,FSER都优于迄今引入的最佳模型,取得了最新业绩。我们显示FSER独立于语言、性别身份和其他外部因素,保持可靠。此外,我们描述了FSER如何能够用来改善精神和情感保健,以及我们的分析和发现如何作为进一步朝着同一方向开展工作的指南和基准。

相关内容

Neural Networks

关注 1648

神经网络（Neural Networks）是世界上三个最古老的神经建模学会的档案期刊:国际神经网络学会(INNS)、欧洲神经网络学会(ENNS)和日本神经网络学会(JNNS)。神经网络提供了一个论坛，以发展和培育一个国际社会的学者和实践者感兴趣的所有方面的神经网络和相关方法的计算智能。神经网络欢迎高质量论文的提交，有助于全面的神经网络研究，从行为和大脑建模，学习算法，通过数学和计算分析，系统的工程和技术应用，大量使用神经网络的概念和技术。这一独特而广泛的范围促进了生物和技术研究之间的思想交流，并有助于促进对生物启发的计算智能感兴趣的跨学科社区的发展。因此，神经网络编委会代表的专家领域包括心理学，神经生物学，计算机科学，工程，数学，物理。该杂志发表文章、信件和评论以及给编辑的信件、社论、时事、软件调查和专利信息。文章发表在五个部分之一:认知科学，神经科学，学习系统，数学和计算分析、工程和应用。官网地址：http://dblp.uni-trier.de/db/journals/nn/

NeurIPS 2020接收论文列表发布，1900篇论文都在这了！

专知会员服务

114+阅读 · 2020年10月8日