This paper focuses on finding suitable features to robustly recognize emotions and evaluate customer satisfaction from speech in real acoustic scenarios. The classification of emotions is based on standard and well-known corpora and the evaluation of customer satisfaction is based on recordings of real opinions given by customers about the received service during phone calls with call-center agents. The feature sets considered in this study include two speaker models, namely x-vectors and i-vectors, and also the well known feature set introduced in the Interspeech 2010 Paralinguistics Challenge (I2010PC). Additionally, we introduce the use of phonation, articulation and prosody features extracted with the DisVoice framework as alternative feature sets to robustly model emotions and customer satisfaction from speech. The results indicate that the I2010PC feature set is the best approach to classify emotions in the standard databases typically used in the literature. When considering the recordings collected in the call-center, without any control over the acoustic conditions, the best results are obtained with our articulation features. The I2010PC feature set includes 1584 measures while the articulation approach only includes 488 measures. We think that the proposed approach is more suitable for real-world applications where the acoustic conditions are not controlled and also it is potentially more convenient for industrial applications.


翻译:本文侧重于寻找合适的特征,以在真实的声学情景中强有力地认识情绪,评价客户对言论的满意度; 将情绪分类以标准且众所周知的共体为基础,对客户满意度的评价则以客户在电话中心代理人员打电话时对所接受的服务提供的真实意见记录为依据; 本研究报告所考虑的特写组包括两个发言者模型,即X-矢量器和i-矢量器,以及2010年多声学挑战(I2010PC)中引入的众所周知的特征; 此外,我们引入了使用DisVoice框架所提取的幻灯、表达和流传特征作为替代特征集,以强有力地模拟情绪和来自言论的客户满意度; 结果表明,I2010PC特写集是文献通常使用的标准数据库对情绪进行分类的最佳方法; 在考虑调频中心所收集的录音时,对声学条件没有任何控制,通过我们的语调特征获得最佳结果。 I2010PC 特写集包括1 584项措施,而通过DisVoice 框架提取的光谱方法仅包括488项措施。 我们认为,拟议中的工业应用可能更方便地用于现实世界。

0
下载
关闭预览

相关内容

计算机 | 入门级EI会议ICVRIS 2019诚邀稿件
Call4Papers
10+阅读 · 2019年6月24日
CCF C类 | DSAA 2019 诚邀稿件
Call4Papers
6+阅读 · 2019年5月13日
A Technical Overview of AI & ML in 2018 & Trends for 2019
待字闺中
17+阅读 · 2018年12月24日
Python语音识别终极指南
人工智能头条
8+阅读 · 2018年4月8日
推荐|深度强化学习聊天机器人(附论文)!
全球人工智能
4+阅读 · 2018年1月30日
一文读懂语音识别史
机械鸡
9+阅读 · 2017年10月16日
【推荐】SVM实例教程
机器学习研究会
17+阅读 · 2017年8月26日
Arxiv
0+阅读 · 2021年10月16日
Arxiv
20+阅读 · 2020年6月8日
Arxiv
8+阅读 · 2018年11月27日
VIP会员
相关VIP内容
相关资讯
计算机 | 入门级EI会议ICVRIS 2019诚邀稿件
Call4Papers
10+阅读 · 2019年6月24日
CCF C类 | DSAA 2019 诚邀稿件
Call4Papers
6+阅读 · 2019年5月13日
A Technical Overview of AI & ML in 2018 & Trends for 2019
待字闺中
17+阅读 · 2018年12月24日
Python语音识别终极指南
人工智能头条
8+阅读 · 2018年4月8日
推荐|深度强化学习聊天机器人(附论文)!
全球人工智能
4+阅读 · 2018年1月30日
一文读懂语音识别史
机械鸡
9+阅读 · 2017年10月16日
【推荐】SVM实例教程
机器学习研究会
17+阅读 · 2017年8月26日
Top
微信扫码咨询专知VIP会员