In recent years, dialogue systems have attracted significant interests in both academia and industry. Especially the discipline of open-domain dialogue systems, aka chatbots, has gained great momentum. Yet, a long standing challenge that bothers the researchers is the lack of effective automatic evaluation metrics, which results in significant impediment in the current research. Common practice in assessing the performance of open-domain dialogue models involves extensive human evaluation on the final deployed models, which is both time- and cost- intensive. Moreover, a recent trend in building open-domain chatbots involve pre-training dialogue models with a large amount of social media conversation data. However, the information contained in the social media conversations may be offensive and inappropriate. Indiscriminate usage of such data can result in insensitive and toxic generative models. This paper describes the data, baselines and results obtained for the Track 5 at the Dialogue System Technology Challenge 10 (DSTC10).


翻译:近年来,对话系统吸引了学术界和产业界的极大兴趣,特别是开放式对话系统(aka chatbots)的纪律已获得巨大势头,然而,令研究人员困扰的长期挑战在于缺乏有效的自动评价指标,这严重妨碍了目前的研究;评估开放式对话模式的通用做法是对最后部署模式进行广泛的人力评价,既需要时间,也需要费用;此外,最近建立开放式聊天平台的趋势涉及培训前对话模式,并有大量社交媒体对话数据;然而,社交媒体对话中的信息可能具有攻击性和不适当性;滥用这些数据可能导致产生敏感和有毒的基因化模式;本文介绍了对话系统技术挑战10(DST10)第5轨的数据、基线和结果。

0
下载
关闭预览

相关内容

专知会员服务
95+阅读 · 2021年8月28日
计算机视觉最佳实践、代码示例和相关文档
专知会员服务
19+阅读 · 2019年10月9日
量化金融强化学习论文集合
专知
13+阅读 · 2019年12月18日
LibRec 精选:你见过最有趣的论文标题是什么?
LibRec智能推荐
4+阅读 · 2019年11月6日
CCF A类 | 顶级会议RTSS 2019诚邀稿件
Call4Papers
10+阅读 · 2019年4月17日
计算机类 | ISCC 2019等国际会议信息9条
Call4Papers
5+阅读 · 2018年12月25日
LibRec 精选:推荐的可解释性[综述]
LibRec智能推荐
10+阅读 · 2018年5月4日
推荐|深度强化学习聊天机器人(附论文)!
全球人工智能
4+阅读 · 2018年1月30日
推荐|Andrew Ng计算机视觉教程总结
全球人工智能
3+阅读 · 2017年11月23日
VIP会员
相关VIP内容
专知会员服务
95+阅读 · 2021年8月28日
计算机视觉最佳实践、代码示例和相关文档
专知会员服务
19+阅读 · 2019年10月9日
Top
微信扫码咨询专知VIP会员