在机器学习领域,用户参与度是评估开放域对话系统质量的关键指标。通过使用启发式构造的功能(例如转数和对话的总时间),先前的工作集中在对话级别的参与上。在本文中,我们调查了估计话语级别参与度的可能性和有效性,并定义了一种用于自动评估开放域对话系统的新指标,预测性参与度。我们的实验表明:(1)人类注释者在评估话语水平的参与分数方面具有很高的一致性; (2)对话级别的参与度得分可以根据适当汇总的话语级别的参与度得分进行预测。此外,我们表明可以从数据中学到话语水平的参与度分数。这些分数可以改善开放域对话系统的自动评估指标,如与人类判断的相关性所示。这表明预测性参与可以用作实时反馈,以训练更好的对话模型。
通过基准配置文件改善应用性能
谷歌开发者
0+阅读 · 2022年3月9日
文末赠书 | 实用推荐系统: 寻找有用的用户行为
机器学习与推荐算法
1+阅读 · 2021年11月12日
中视频的产品逻辑与机会,在哪?
人人都是产品经理
0+阅读 · 2020年11月29日
成功在德国发布应用或游戏的 6 个技巧
谷歌开发者
0+阅读 · 2020年7月12日
流量营收双双承压,陌陌「掉队」了吗?
如何通过私域流量运营,实现高效引流、转化和复购?
人人都是产品经理
0+阅读 · 2020年3月30日
留给微博的时间不多了
36氪
0+阅读 · 2019年11月19日
活用订阅步步为盈 | 游戏盈利策略・第二期
谷歌开发者
0+阅读 · 2019年5月5日
浓缩自 150 多个移动项目的 9 个 UX 心得
谷歌开发者
0+阅读 · 2019年4月19日
让您的应用适配更多屏幕
谷歌开发者
0+阅读 · 2019年3月23日
参考链接
微信扫码咨询专知VIP会员