论文题目: Predictive Engagement: An Efficient Metric For Automatic Evaluation of Open-Domain Dialogue Systems

论文作者: Sarik Ghazarian, Ralph Weischedel, Aram Galstyan, Nanyun Peng

论文摘要: 用户参与度是评估开放域对话系统质量的关键指标。通过使用启发式构造的功能(例如转数和对话的总时间),先前的工作集中在对话级别的参与上。在本文中,我们调查了估计话语级别参与度的可能性和有效性,并定义了一种用于自动评估开放域对话系统的新指标,预测性参与度。我们的实验表明:(1)人类注释者在评估话语水平的参与分数方面具有很高的一致性; (2)对话级别的参与度得分可以根据适当汇总的话语级别的参与度得分进行预测。此外,我们表明可以从数据中学到话语水平的参与度分数。这些分数可以改善开放域对话系统的自动评估指标,如与人类判断的相关性所示。这表明预测性参与可以用作实时反馈,以训练更好的对话模型。

成为VIP会员查看完整内容
13

相关内容

“机器学习是近20多年兴起的一门多领域交叉学科,涉及概率论、统计学、逼近论、凸分析、算法复杂度理论等多门学科。机器学习理论主要是设计和分析一些让 可以自动“ 学习”的算法。机器学习算法是一类从数据中自动分析获得规律,并利用规律对未知数据进行预测的算法。因为学习算法中涉及了大量的统计学理论,机器学习与统计推断学联系尤为密切,也被称为统计学习理论。算法设计方面,机器学习理论关注可以实现的,行之有效的学习算法。很多 推论问题属于 无程序可循难度,所以部分的机器学习研究是开发容易处理的近似算法。” ——中文维基百科

知识荟萃

精品入门和进阶教程、论文和代码整理等

更多

查看相关VIP内容、论文、资讯等
[综述]基于深度学习的开放领域对话系统研究综述
专知会员服务
79+阅读 · 2019年10月12日
已删除
AI掘金志
7+阅读 · 2019年7月8日
自然语言处理常识推理综述论文,60页pdf
专知
73+阅读 · 2019年4月4日
综述 | 事件抽取及推理 (下)
开放知识图谱
38+阅读 · 2019年1月14日
一文读懂智能对话系统
数据派THU
16+阅读 · 2018年1月27日
论文笔记 | How NOT To Evaluate Your Dialogue System
科技创新与创业
13+阅读 · 2017年12月23日
Arxiv
3+阅读 · 2018年12月18日
Arxiv
3+阅读 · 2018年11月12日
Arxiv
6+阅读 · 2018年11月1日
Arxiv
6+阅读 · 2018年3月28日
VIP会员
相关VIP内容
[综述]基于深度学习的开放领域对话系统研究综述
专知会员服务
79+阅读 · 2019年10月12日
相关资讯
已删除
AI掘金志
7+阅读 · 2019年7月8日
自然语言处理常识推理综述论文,60页pdf
专知
73+阅读 · 2019年4月4日
综述 | 事件抽取及推理 (下)
开放知识图谱
38+阅读 · 2019年1月14日
一文读懂智能对话系统
数据派THU
16+阅读 · 2018年1月27日
论文笔记 | How NOT To Evaluate Your Dialogue System
科技创新与创业
13+阅读 · 2017年12月23日
微信扫码咨询专知VIP会员