【导读】对话系统(Dialogue system,DS)由于其广泛的应用前景,已经吸引了工业界和学术界极大的关注。研究人员通常根据对话系统的功能对其进行分类.然而许多对话需要DS在不同的功能之间来回切换。例如,电影评论就需要在对话和问答之间切换,交流式推荐就需要系统在对话与推荐之间转换。因此,根据功能进行分类并不足以适应当前的发展趋势。我们基于背景知识对DS进行分类。特别地,我们基于非结构化的文本来研究目前最新的对话系统。我们把基于文档对话系统(Document Grounded Dialogue System,DGDS)定义为围绕给定的文本进行对话交流的对话系统。DGDS可以被应用在诸多场景之中,如根据产品手册谈论商品,评论新闻报道等。我们相信抽取非结构化的信息是对话系统未来的发展趋势,因为在这些非结构化的文本之中蕴藏着大量的人类知识。研究DGDS一方面是因为其广泛的应用前景,另一方面是因为其能够促进AI更好的理解人类知识和自然语言。我们从DGDS的类别,架构,数据集,模型和未来的发展方向进行了论述。
原文链接:
https://arxiv.org/abs/2004.13818
介绍
很长时间以来,研究人员致力于开发出一款能够和人类自然交流的对话系统。早期的对话系统,诸如Eliza,Parry以及Alice等都尝试着模仿人类在对话交谈中的行为,并且挑战了各种图灵测试。尽管这些系统表现不错但都局限于特定的环境,面向开放域的对话系统仍旧是一个非常具有挑战性的任务。尽管面向任务的对话系统和开放域的对话系统最初都是出于不同的目的而进行开发,但是目前的对话系统越来越倾向于把多种功能整合到一起来改善对话系统的用户体验,这使得基于功能分类的对话系统不能够充分地满足当前对于对话系统的巨大需求。在这篇论文中,我们通过背景知识对对话系统进行分类,其中背景知识被定义为除交流内容之外且能够在对话期间使用的非结构化的文本知识。特别地,我们基于非结构化的文本来研究对话系统,即DGDS。
这篇文章的结构如下:
在Introduction中,我们简短的介绍了对话系统和DGDS。
在Comparision中,我们我们分析了DGDS和对话系统三种不同类别之间的区别,然后详细地比较了对话阅读理解(Conversational Reading Comprehensio,CRC)和基于文档的对话(Document-Based Dialogue,DBD).
在Architecture中,我们描述了DGDS模型的主要框架。
在Datasets中,我们回顾了目前已经公开的DGDS数据集。
在CRC模型和DBD模型中,我们基于预定义的框架分别讨论了CRC和DBD方法。
在Future work中,我们从基础研究和技术发展两个方面探讨了该领域有前景的研究方向。
在文章中,阐述了DGDS和传统DS不同种类之间的区别,详细地分析了CRC和DBD之间的异同点。
最近,大量的DGDS数据集和DGDS模型被用来挖掘在交谈当中的非结构化的文本信息。根据任务的特点,目前的方法主要有5部分组成:联合建模(JM),知识选择(KS),回复生成(RC),评估(EV)和存储(MM)。我们将联合建模和知识选择视作自然语言理解问题,将回复生成和评估归类为自然语言生成问题。DGDS的一般性架构如图3所示:
我们分别介绍了对话阅读理解(Conversational Reading Comprehensio,CRC)和基于文档的对话(Document-Based Dialogue,DBD)中与DGDS相关的数据集。
在文章中,根据先前的定义总结和分析了目前的对话阅读理解模型。
并根据前面提出的体系结构分析目前的基于文档的对话模型
部分论文展示:
专知便捷查看
便捷下载,请关注专知公众号(点击上方蓝色专知关注)
后台回复“DGDS” 可以获取《基于文档的对话系统综述》专知下载链接索引
点击“阅读原文”,了解使用专知,查看获取5000+AI主题知识资源