In this paper, we propose FFCI, a framework for automatic summarization evaluation that comprises four elements: Faithfulness, Focus, Coverage, and Inter-sentential coherence. We design FFCI by comprehensively studying traditional evaluation metrics and model-based evaluations, including question answering (QA) approaches, STS, next-sentence prediction (NSP), and scores from 19 pre-trained language models. Our study reveals three key findings: (1) calculating BertSCORE between the summary and article sentences yields a higher correlation score than recently-proposed QA-based evaluation methods for faithfulness evaluation; (2) GPT2Score has the best Pearson's correlation for focus and coverage; and (3) a simple NSP model is effective at evaluating inter-sentential coherence.


翻译:在本文中,我们提议FFCI,这是一个自动总结评价框架,由四个要素组成:信仰、焦点、覆盖面和理论间的一致性。我们通过全面研究传统的评价指标和基于模型的评价来设计FFCI,包括问答方法、STS、下一句判决预测和19个预先培训的语言模型的分数。我们的研究揭示了三个主要结论:(1)计算摘要与文章句子之间的BertSCORE得出了比最近提出的基于QA的忠诚评价方法更高的相关得分;(2)GPT2Score在重点和覆盖面方面具有最好的皮尔逊人相关性;(3)一个简单的NSP模式能够有效地评价当前的一致性。

0
下载
关闭预览

相关内容

《可解释的机器学习-interpretable-ml》238页pdf
专知会员服务
206+阅读 · 2020年2月24日
【哈佛大学商学院课程Fall 2019】机器学习可解释性
专知会员服务
104+阅读 · 2019年10月9日
Hierarchically Structured Meta-learning
CreateAMind
26+阅读 · 2019年5月22日
IEEE | DSC 2019诚邀稿件 (EI检索)
Call4Papers
10+阅读 · 2019年2月25日
A Technical Overview of AI & ML in 2018 & Trends for 2019
待字闺中
17+阅读 · 2018年12月24日
已删除
将门创投
4+阅读 · 2018年12月10日
disentangled-representation-papers
CreateAMind
26+阅读 · 2018年9月12日
「知识表示学习」专题论文推荐 | 每周论文清单
计算机视觉近一年进展综述
机器学习研究会
9+阅读 · 2017年11月25日
【推荐】自然语言处理(NLP)指南
机器学习研究会
35+阅读 · 2017年11月17日
Arxiv
3+阅读 · 2018年12月18日
Arxiv
19+阅读 · 2018年10月25日
Arxiv
3+阅读 · 2017年12月23日
VIP会员
相关VIP内容
相关资讯
Hierarchically Structured Meta-learning
CreateAMind
26+阅读 · 2019年5月22日
IEEE | DSC 2019诚邀稿件 (EI检索)
Call4Papers
10+阅读 · 2019年2月25日
A Technical Overview of AI & ML in 2018 & Trends for 2019
待字闺中
17+阅读 · 2018年12月24日
已删除
将门创投
4+阅读 · 2018年12月10日
disentangled-representation-papers
CreateAMind
26+阅读 · 2018年9月12日
「知识表示学习」专题论文推荐 | 每周论文清单
计算机视觉近一年进展综述
机器学习研究会
9+阅读 · 2017年11月25日
【推荐】自然语言处理(NLP)指南
机器学习研究会
35+阅读 · 2017年11月17日
Top
微信扫码咨询专知VIP会员