There has been a rapid development in data-driven task-oriented dialogue systems with the benefit of large-scale datasets. However, the progress of dialogue systems in low-resource languages lags far behind due to the lack of high-quality data. To advance the cross-lingual technology in building dialog systems, DSTC9 introduces the task of cross-lingual dialog state tracking, where we test the DST module in a low-resource language given the rich-resource training dataset. This paper studies the transferability of a cross-lingual generative dialogue state tracking system using a multilingual pre-trained seq2seq model. We experiment under different settings, including joint-training or pre-training on cross-lingual and cross-ontology datasets. We also find out the low cross-lingual transferability of our approaches and provides investigation and discussion.


翻译:利用大规模数据集,数据驱动的任务导向对话系统迅速发展,然而,由于缺乏高质量数据,低资源语言对话系统的进展远远落后于高质量数据。为了在建立对话系统的过程中推进跨语言技术,DSTC9提出了跨语言对话状态跟踪任务,根据丰富的资源培训数据集,我们用一种低资源语言测试DST模块。本文研究使用多语言预先培训的后继等模式,跨语言的基因化对话国家跟踪系统的可转让性。我们在不同环境下进行实验,包括就跨语言和跨主题数据集进行联合培训或预培训。我们还发现我们方法的跨语言传输能力低,并提供调查和讨论。

0
下载
关闭预览

相关内容

最新《自监督表示学习》报告,70页ppt
专知会员服务
86+阅读 · 2020年12月22日
【EMNLP2020】自然语言生成,Neural Language Generation
专知会员服务
39+阅读 · 2020年11月20日
专知会员服务
19+阅读 · 2020年10月13日
零样本文本分类,Zero-Shot Learning for Text Classification
专知会员服务
96+阅读 · 2020年5月31日
最新BERT相关论文清单,BERT-related Papers
专知会员服务
53+阅读 · 2019年9月29日
Transferring Knowledge across Learning Processes
CreateAMind
28+阅读 · 2019年5月18日
计算机类 | ISCC 2019等国际会议信息9条
Call4Papers
5+阅读 · 2018年12月25日
人工智能 | PRICAI 2019等国际会议信息9条
Call4Papers
6+阅读 · 2018年12月13日
COLING 2018-最新论文最全分类-整理分享
深度学习与NLP
6+阅读 · 2018年7月6日
Hierarchical Disentangled Representations
CreateAMind
4+阅读 · 2018年4月15日
多轮对话之对话管理:Dialog Management
PaperWeekly
18+阅读 · 2018年1月15日
Arxiv
5+阅读 · 2019年11月22日
Arxiv
6+阅读 · 2019年3月19日
Arxiv
3+阅读 · 2018年3月2日
VIP会员
Top
微信扫码咨询专知VIP会员