Modern day conversational agents are trained to emulate the manner in which humans communicate. To emotionally bond with the user, these virtual agents need to be aware of the affective state of the user. Transformers are the recent state of the art in sequence-to-sequence learning that involves training an encoder-decoder model with word embeddings from utterance-response pairs. We propose an emotion-aware transformer encoder for capturing the emotional quotient in the user utterance in order to generate human-like empathetic responses. The contributions of our paper are as follows: 1) An emotion detector module trained on the input utterances determines the affective state of the user in the initial phase 2) A novel transformer encoder is proposed that adds and normalizes the word embedding with emotion embedding thereby integrating the semantic and affective aspects of the input utterance 3) The encoder and decoder stacks belong to the Transformer-XL architecture which is the recent state of the art in language modeling. Experimentation on the benchmark Facebook AI empathetic dialogue dataset confirms the efficacy of our model from the higher BLEU-4 scores achieved for the generated responses as compared to existing methods. Emotionally intelligent virtual agents are now a reality and inclusion of affect as a modality in all human-machine interfaces is foreseen in the immediate future.
翻译:现代对话工具被训练为学习人类交流的方式。 为了与用户建立情感联系, 这些虚拟工具需要了解用户的感官状态。 变异器是最新的最新先进状态, 包括培训一个编码器- 解码器模型, 包含来自言词- 响应对配的词嵌入器。 我们建议一个感知变异器编码器, 用于捕捉用户语调中的情感商数, 以便产生人性式的同情反应。 我们的论文贡献如下:(1) 一个经过投入语调培训的情感探测器模块, 确定用户在初始阶段的感官状态 ;(2) 提议一个新型变异器编码器, 将词嵌入情感嵌入的词添加和正常化, 从而整合输入语调- 响应的语调和感官方面 3 。 编码器和解变异器库属于变异器- XL 结构, 这是最新语言模型的状态。 在基准的 AI 感光对话模块中进行实验, 确定用户在初始阶段的感知状态状态 ; 新的变异变变变器- 数据系统 正在确认我们模型- 的虚拟变现的变式 变式 变式 变式 变式 变式 变式 变式 变式 变式 变式 变式 变式 变式 变式 变式 变式 变式 变式 变式 变式 变式 变式 变式 变式 变式 变式 变式 变式 变式 变式 变式 变式 变式 变式 变式 变式 变式 变式 变式 变式 变式 变式 变式 变式 变式 变式 变式 变式 变式 变式 变式 变式 变式 变式 变式 变式 变式 变式 变式 变式 变式 变式 变式 变式 变式 变式 变式 变式 变式 变式 变式 变式 变式 变式 变式 变式 变式 变式 变式 变式 变式 变式 变式 变式 变式