近年来,随着人工智能技术的发展,更多数据被利用,数据驱动的端到端闲聊机器人技术得到快速发展,受到了学术界和工业界的广泛关注。但是对于闲聊机器人的评价,现在没有标准的自动评价方法,而自动评价方法对于闲聊机器人对话效果的评估及闲聊机器人的快速迭代是十分重要的。该文综述了基于生成模型的闲聊机器人的自动评价方法。首先介绍了自动评价方法的研究背景及研究现状,然后介绍了对闲聊机器人的基本能力—生成合理的回复进行评价的自动评价方法,并指出了每类方法的优缺点及进一步发展的方向,其次对评价闲聊机器人的扩展能力的自动评价方法进行了介绍,扩展能力包括生成多样的回复、对话具有特定的个性、对话具有情感和对话主题具有深度和广度等。随后阐述了评价闲聊机器人综合能力的评价方法,并讨论了发展综合自动评价方法的方向,同时还介绍了如何评价自动评价方法。最后进行了分析与总结,指出研究自动评价方法的困难与挑战,并对未来发展进行了展望。

http://jcip.cipsc.org.cn/CN/abstract/abstract3097.shtml

成为VIP会员查看完整内容
32

相关内容

在机器学习中,生成模型可以用来直接对数据建模(例如根据某个变量的概率密度函数进行数据采样),也可以用来建立变量间的条件概率分布。条件概率分布可以由生成模型根据贝叶斯定理形成。
专知会员服务
39+阅读 · 2021年5月30日
专知会员服务
64+阅读 · 2021年5月29日
专知会员服务
79+阅读 · 2021年5月27日
专知会员服务
69+阅读 · 2021年5月21日
专知会员服务
50+阅读 · 2021年5月15日
基于深度学习的行人检测方法综述
专知会员服务
68+阅读 · 2021年4月14日
专知会员服务
45+阅读 · 2021年3月24日
专知会员服务
38+阅读 · 2021年3月3日
基于深度学习的数据融合方法研究综述
专知会员服务
136+阅读 · 2020年12月10日
[综述]基于深度学习的开放领域对话系统研究综述
专知会员服务
78+阅读 · 2019年10月12日
多模态视觉语言表征学习研究综述
专知
27+阅读 · 2020年12月3日
实体关系抽取方法研究综述
专知
11+阅读 · 2020年7月19日
文本匹配相关方向打卡点总结
夕小瑶的卖萌屋
8+阅读 · 2019年10月18日
【质量检测】机器视觉表面缺陷检测综述
产业智能官
30+阅读 · 2018年9月24日
最新人机对话系统简略综述
专知
26+阅读 · 2018年3月10日
干货 | 论文解读:基于动态词表的对话生成研究
微软研究院AI头条
3+阅读 · 2018年1月9日
赛尔原创 | 对话系统评价方法综述
哈工大SCIR
11+阅读 · 2017年11月13日
Arxiv
35+阅读 · 2021年1月27日
Arxiv
136+阅读 · 2018年10月8日
Paraphrase Generation with Deep Reinforcement Learning
Arxiv
5+阅读 · 2018年5月5日
VIP会员
相关VIP内容
专知会员服务
39+阅读 · 2021年5月30日
专知会员服务
64+阅读 · 2021年5月29日
专知会员服务
79+阅读 · 2021年5月27日
专知会员服务
69+阅读 · 2021年5月21日
专知会员服务
50+阅读 · 2021年5月15日
基于深度学习的行人检测方法综述
专知会员服务
68+阅读 · 2021年4月14日
专知会员服务
45+阅读 · 2021年3月24日
专知会员服务
38+阅读 · 2021年3月3日
基于深度学习的数据融合方法研究综述
专知会员服务
136+阅读 · 2020年12月10日
[综述]基于深度学习的开放领域对话系统研究综述
专知会员服务
78+阅读 · 2019年10月12日
相关资讯
多模态视觉语言表征学习研究综述
专知
27+阅读 · 2020年12月3日
实体关系抽取方法研究综述
专知
11+阅读 · 2020年7月19日
文本匹配相关方向打卡点总结
夕小瑶的卖萌屋
8+阅读 · 2019年10月18日
【质量检测】机器视觉表面缺陷检测综述
产业智能官
30+阅读 · 2018年9月24日
最新人机对话系统简略综述
专知
26+阅读 · 2018年3月10日
干货 | 论文解读:基于动态词表的对话生成研究
微软研究院AI头条
3+阅读 · 2018年1月9日
赛尔原创 | 对话系统评价方法综述
哈工大SCIR
11+阅读 · 2017年11月13日
微信扫码咨询专知VIP会员