Speech emotion recognition is the task of recognizing the speaker's emotional state given a recording of their utterance. While most of the current approaches focus on inferring emotion from isolated utterances, we argue that this is not sufficient to achieve conversational emotion recognition (CER) which deals with recognizing emotions in conversations. In this work, we propose several approaches for CER by treating it as a sequence labeling task. We investigated transformer architecture for CER and, compared it with ResNet-34 and BiLSTM architectures in both contextual and context-less scenarios using IEMOCAP corpus. Based on the inner workings of the self-attention mechanism, we proposed DiverseCatAugment (DCA), an augmentation scheme, which improved the transformer model performance by an absolute 3.3% micro-f1 on conversations and 3.6% on isolated utterances. We further enhanced the performance by introducing an interlocutor-aware transformer model where we learn a dictionary of interlocutor index embeddings to exploit diarized conversations.


翻译:语音感知是承认演讲者情绪状态的任务。 虽然目前大多数方法侧重于从孤立的言语中推断情感,但我们认为这不足以实现谈话情绪识别(CER),涉及在谈话中识别情感。 在这项工作中,我们提出一些CER的方法,将它作为顺序标签任务处理。我们研究了CER的变压器结构,并将它与ResNet-34和BILSTM结构在背景和不切实际的情景下使用IMOCAP Camp进行对比。 根据自我感知机制的内部工作,我们提议了多功能搜索(DCA)计划,即增强功能计划,通过绝对3.3%的微宽频1和3.6%的孤立语句来改进变压器模型的性能。我们进一步提升了该功能,我们采用了一个对话感知变压器模型,在其中我们学习了一种对话索引嵌入字典,以利用二极分化的对话。

0
下载
关闭预览

相关内容

专知会员服务
55+阅读 · 2021年5月17日
最新《Transformers模型》教程,64页ppt
专知会员服务
307+阅读 · 2020年11月26日
FlowQA: Grasping Flow in History for Conversational Machine Comprehension
专知会员服务
28+阅读 · 2019年10月18日
[综述]深度学习下的场景文本检测与识别
专知会员服务
77+阅读 · 2019年10月10日
CCF推荐 | 国际会议信息6条
Call4Papers
9+阅读 · 2019年8月13日
Hierarchically Structured Meta-learning
CreateAMind
26+阅读 · 2019年5月22日
disentangled-representation-papers
CreateAMind
26+阅读 · 2018年9月12日
推荐|深度强化学习聊天机器人(附论文)!
全球人工智能
4+阅读 · 2018年1月30日
【推荐】直接未来预测:增强学习监督学习
机器学习研究会
6+阅读 · 2017年11月24日
【推荐】深度学习目标检测全面综述
机器学习研究会
21+阅读 · 2017年9月13日
【推荐】全卷积语义分割综述
机器学习研究会
19+阅读 · 2017年8月31日
Arxiv
3+阅读 · 2018年11月12日
VIP会员
Top
微信扫码咨询专知VIP会员