We present Meena, a multi-turn open-domain chatbot trained end-to-end on data mined and filtered from public domain social media conversations. This 2.6B parameter neural network is trained to minimize perplexity, an automatic metric that we compare against human judgement of multi-turn conversation quality. To capture this judgement, we propose a human evaluation metric called Sensibleness and Specificity Average (SSA), which captures key elements of good conversation. Interestingly, our experiments show strong correlation between perplexity and SSA. The fact that the best perplexity end-to-end trained Meena scores high on SSA (72% on multi-turn evaluation) suggests that a human-level SSA of 86% is potentially within reach if we can better optimize perplexity. Additionally, the full version of Meena (with a filtering mechanism and tuned decoding) scores 79% SSA, 23% higher than the next highest scoring chatbot that we evaluated.


翻译:我们展示了Meena, 这是一种多方向开放的、经过培训的、关于从公共领域社交媒体对话中提取和过滤的数据的多方向开放聊天室的终端到终端。 这个 2.6B 参数神经网络受过培训, 以尽量减少混淆性, 这是一种与人类对多方向对话质量的判断相比较的自动衡量标准。 为了捕捉这一判断, 我们建议了一种人类评价指标, 叫做“ 感官和具体程度平均 ” ( SSA), 捕捉良好对话的关键内容。 有趣的是, 我们的实验显示, 困惑性最终到终端培训的Meena 之间有着很强的关联性。 这一事实是, 最难解的Meena 在 SSA ( 72 % 的多方向评估) 得分数很高, 表明如果我们能够更好地优化不易混淆性的话, 86 % 的人类水平的SSA( 具有过滤机制和调整解码功能), 会得分79%, 比我们所评估的下一个得分数最高的聊天室高23% 。

14
下载
关闭预览

相关内容

【经典书】人工智能及机器学习导论,457页pdf
专知会员服务
160+阅读 · 2020年7月5日
强化学习最新教程,17页pdf
专知会员服务
174+阅读 · 2019年10月11日
2019年机器学习框架回顾
专知会员服务
35+阅读 · 2019年10月11日
CCF A类 | 顶级会议RTSS 2019诚邀稿件
Call4Papers
10+阅读 · 2019年4月17日
A Technical Overview of AI & ML in 2018 & Trends for 2019
待字闺中
16+阅读 · 2018年12月24日
推荐|深度强化学习聊天机器人(附论文)!
全球人工智能
4+阅读 · 2018年1月30日
人工智能 | 国际会议/SCI期刊约稿信息9条
Call4Papers
3+阅读 · 2018年1月12日
Neural Approaches to Conversational AI
Arxiv
8+阅读 · 2018年12月13日
CoQA: A Conversational Question Answering Challenge
Arxiv
7+阅读 · 2018年8月21日
Arxiv
10+阅读 · 2018年2月9日
VIP会员
相关VIP内容
相关资讯
CCF A类 | 顶级会议RTSS 2019诚邀稿件
Call4Papers
10+阅读 · 2019年4月17日
A Technical Overview of AI & ML in 2018 & Trends for 2019
待字闺中
16+阅读 · 2018年12月24日
推荐|深度强化学习聊天机器人(附论文)!
全球人工智能
4+阅读 · 2018年1月30日
人工智能 | 国际会议/SCI期刊约稿信息9条
Call4Papers
3+阅读 · 2018年1月12日
Top
微信扫码咨询专知VIP会员