End-to-end spoken language understanding (SLU) systems that process human-human or human-computer interactions are often context independent and process each turn of a conversation independently. Spoken conversations on the other hand, are very much context dependent, and dialog history contains useful information that can improve the processing of each conversational turn. In this paper, we investigate the importance of dialog history and how it can be effectively integrated into end-to-end SLU systems. While processing a spoken utterance, our proposed RNN transducer (RNN-T) based SLU model has access to its dialog history in the form of decoded transcripts and SLU labels of previous turns. We encode the dialog history as BERT embeddings, and use them as an additional input to the SLU model along with the speech features for the current utterance. We evaluate our approach on a recently released spoken dialog data set, the HarperValleyBank corpus. We observe significant improvements: 8% for dialog action and 30% for caller intent recognition tasks, in comparison to a competitive context independent end-to-end baseline system.


翻译:处理人与人或人- 计算机互动的端到端口语理解系统( SLU), 通常具有背景独立性, 并独立处理每个对话的转折。 而口语交谈则非常依赖上下文, 对话历史包含有用的信息, 可以改进对每个对话转弯的处理。 在本文中, 我们调查对话历史的重要性, 以及如何有效地将其纳入端到端口语 SLU 系统中。 在处理一个口语时, 我们提议的基于 SLU 的 RNN 传输器( RNNN- T) 模式可以使用其对话历史, 其形式是解码记录和前转折号的 SLU 标签。 我们将对话历史编码为 BERT 嵌入, 并将其作为 SLU 模式的附加投入, 以及当前语句的语音特征 。 我们评估了我们最近发布的语音对话数据集( HarperValley Bank campro) 的处理方法。 我们观察到显著的改进: 对话动作为8%, 调用30% 意向识别任务, 与竞争性独立端到端端基线系统相比, 。

0
下载
关闭预览

相关内容

Integration:Integration, the VLSI Journal。 Explanation:集成,VLSI杂志。 Publisher:Elsevier。 SIT:http://dblp.uni-trier.de/db/journals/integration/
专知会员服务
16+阅读 · 2021年8月19日
Hierarchically Structured Meta-learning
CreateAMind
26+阅读 · 2019年5月22日
Unsupervised Learning via Meta-Learning
CreateAMind
42+阅读 · 2019年1月3日
A Technical Overview of AI & ML in 2018 & Trends for 2019
待字闺中
17+阅读 · 2018年12月24日
语音顶级会议Interspeech2018接受论文列表!
专知
6+阅读 · 2018年6月10日
小冰,请接电话!
微软丹棱街5号
5+阅读 · 2018年4月18日
推荐|深度强化学习聊天机器人(附论文)!
全球人工智能
4+阅读 · 2018年1月30日
多轮对话之对话管理:Dialog Management
PaperWeekly
18+阅读 · 2018年1月15日
Arxiv
0+阅读 · 2021年10月13日
Arxiv
4+阅读 · 2018年11月12日
Arxiv
6+阅读 · 2018年11月1日
VIP会员
相关VIP内容
专知会员服务
16+阅读 · 2021年8月19日
Top
微信扫码咨询专知VIP会员