In this paper, an end-to-end neural embedding system based on triplet loss and residual learning has been proposed for speech emotion recognition. The proposed system learns the embeddings from the emotional information of the speech utterances. The learned embeddings are used to recognize the emotions portrayed by given speech samples of various lengths. The proposed system implements Residual Neural Network architecture. It is trained using softmax pre-training and triplet loss function. The weights between the fully connected and embedding layers of the trained network are used to calculate the embedding values. The embedding representations of various emotions are mapped onto a hyperplane, and the angles among them are computed using the cosine similarity. These angles are utilized to classify a new speech sample into its appropriate emotion class. The proposed system has demonstrated 91.67% and 64.44% accuracy while recognizing emotions for RAVDESS and IEMOCAP dataset, respectively.


翻译:在本文中,基于三重损失和剩余学习的端到端神经嵌入系统被建议用于语音情感识别。 提议的系统从语音语句的情感信息中学习嵌入内容。 学到的嵌入内容用于识别不同长度的语音样本所描绘的情绪。 提议的系统实施残余神经网络结构。 它经过培训,使用软模前训练和三重损失功能。 完全连接和嵌入的网络层之间的权重被用来计算嵌入值。 各种情感的嵌入表达方式被映射在超高平板上, 其角度通过共线相似性来计算。 这些角度被用于将新的语音样本划入适当的情感类别。 提议的系统显示了91.67%和64.44%的准确度,同时分别承认REVDESS和IEMOCAP数据集的情感。

0
下载
关闭预览

相关内容

【资源】语音增强资源集锦
专知
8+阅读 · 2020年7月4日
【ACL2020放榜!】事件抽取、关系抽取、NER、Few-Shot 相关论文整理
深度学习自然语言处理
18+阅读 · 2020年5月22日
Github项目推荐 | Emotion-recognition 实时表情识别
AI科技评论
18+阅读 · 2019年7月8日
语音情绪识别|声源增强|基频可视化
深度学习每日摘要
15+阅读 · 2019年5月5日
近期声学领域前沿论文(No. 3)
深度学习每日摘要
24+阅读 · 2019年3月31日
Facebook PyText 在 Github 上开源了
AINLP
7+阅读 · 2018年12月14日
disentangled-representation-papers
CreateAMind
26+阅读 · 2018年9月12日
笔记 | Deep active learning for named entity recognition
黑龙江大学自然语言处理实验室
24+阅读 · 2018年5月27日
自然语言处理 (三) 之 word embedding
DeepLearning中文论坛
19+阅读 · 2015年8月3日
Phase-aware Speech Enhancement with Deep Complex U-Net
Arxiv
3+阅读 · 2018年6月19日
VIP会员
相关VIP内容
相关资讯
【资源】语音增强资源集锦
专知
8+阅读 · 2020年7月4日
【ACL2020放榜!】事件抽取、关系抽取、NER、Few-Shot 相关论文整理
深度学习自然语言处理
18+阅读 · 2020年5月22日
Github项目推荐 | Emotion-recognition 实时表情识别
AI科技评论
18+阅读 · 2019年7月8日
语音情绪识别|声源增强|基频可视化
深度学习每日摘要
15+阅读 · 2019年5月5日
近期声学领域前沿论文(No. 3)
深度学习每日摘要
24+阅读 · 2019年3月31日
Facebook PyText 在 Github 上开源了
AINLP
7+阅读 · 2018年12月14日
disentangled-representation-papers
CreateAMind
26+阅读 · 2018年9月12日
笔记 | Deep active learning for named entity recognition
黑龙江大学自然语言处理实验室
24+阅读 · 2018年5月27日
自然语言处理 (三) 之 word embedding
DeepLearning中文论坛
19+阅读 · 2015年8月3日
Top
微信扫码咨询专知VIP会员