User engagement is a critical metric for evaluating the quality of open-domain dialogue systems. Prior work has focused on conversation-level engagement by using heuristically constructed features such as the number of turns and the total time of the conversation. In this paper, we investigate the possibility and efficacy of estimating utterance-level engagement and define a novel metric, {\em predictive engagement}, for automatic evaluation of open-domain dialogue systems. Our experiments demonstrate that (1) human annotators have high agreement on assessing utterance-level engagement scores; (2) conversation-level engagement scores can be predicted from properly aggregated utterance-level engagement scores. Furthermore, we show that the utterance-level engagement scores can be learned from data. These scores can improve automatic evaluation metrics for open-domain dialogue systems, as shown by correlation with human judgements. This suggests that predictive engagement can be used as a real-time feedback for training better dialogue models.


翻译:用户参与是评价开放域对话系统质量的关键衡量标准。 先前的工作重点是通过使用诸如旋转次数和对话总时间等超自然构建的特征进行对话级接触。 在本文中,我们调查了估计发言级接触的可能性和有效性,并定义了对开放域对话系统进行自动评价的新颖衡量标准, 即 ~ eem 预测性接触 。 我们的实验表明:(1) 人类通知员对评估谈话级接触分数高度一致;(2) 对话级接触分数可以从适当汇总的谈话级接触分数中预测。 此外,我们表明,从数据中可以学到发言级接触分数。 这些分数可以改进开放域对话系统的自动评价度量,这与人类的判断有关。 这意味着,预测性接触可以作为实时反馈,用于培训更好的对话模式。

11
下载
关闭预览

相关内容

强化学习最新教程,17页pdf
专知会员服务
182+阅读 · 2019年10月11日
计算机 | 入门级EI会议ICVRIS 2019诚邀稿件
Call4Papers
10+阅读 · 2019年6月24日
逆强化学习-学习人先验的动机
CreateAMind
16+阅读 · 2019年1月18日
Unsupervised Learning via Meta-Learning
CreateAMind
44+阅读 · 2019年1月3日
推荐|深度强化学习聊天机器人(附论文)!
全球人工智能
4+阅读 · 2018年1月30日
论文笔记 | How NOT To Evaluate Your Dialogue System
科技创新与创业
13+阅读 · 2017年12月23日
Arxiv
14+阅读 · 2020年1月27日
Arxiv
7+阅读 · 2018年11月1日
Arxiv
8+阅读 · 2018年5月15日
Arxiv
6+阅读 · 2018年3月28日
VIP会员
相关资讯
计算机 | 入门级EI会议ICVRIS 2019诚邀稿件
Call4Papers
10+阅读 · 2019年6月24日
逆强化学习-学习人先验的动机
CreateAMind
16+阅读 · 2019年1月18日
Unsupervised Learning via Meta-Learning
CreateAMind
44+阅读 · 2019年1月3日
推荐|深度强化学习聊天机器人(附论文)!
全球人工智能
4+阅读 · 2018年1月30日
论文笔记 | How NOT To Evaluate Your Dialogue System
科技创新与创业
13+阅读 · 2017年12月23日
相关论文
Arxiv
14+阅读 · 2020年1月27日
Arxiv
7+阅读 · 2018年11月1日
Arxiv
8+阅读 · 2018年5月15日
Arxiv
6+阅读 · 2018年3月28日
Top
微信扫码咨询专知VIP会员