Sports game summarization aims at generating sports news from live commentaries. However, existing datasets are all constructed through automated collection and cleaning processes, resulting in a lot of noise. Besides, current works neglect the knowledge gap between live commentaries and sports news, which limits the performance of sports game summarization. In this paper, we introduce K-SportsSum, a new dataset with two characteristics: (1) K-SportsSum collects a large amount of data from massive games. It has 7,854 commentary-news pairs. To improve the quality, K-SportsSum employs a manual cleaning process; (2) Different from existing datasets, to narrow the knowledge gap, K-SportsSum further provides a large-scale knowledge corpus that contains the information of 523 sports teams and 14,724 sports players. Additionally, we also introduce a knowledge-enhanced summarizer that utilizes both live commentaries and the knowledge to generate sports news. Extensive experiments on K-SportsSum and SportsSum datasets show that our model achieves new state-of-the-art performances. Qualitative analysis and human study further verify that our model generates more informative sports news.


翻译:体育游戏总和旨在从现场评论中产生体育新闻。然而,现有的数据集都是通过自动收集和清理程序构建的,造成大量噪音。此外,目前的工作忽略了现场评论和体育新闻之间的知识差距,从而限制了体育游戏总和的性能。在本文中,我们引入了K-SportsSum,这是一个具有两个特点的新数据集:(1)K-SportsSum从大型游戏中收集了大量数据。它有7,854对评论-新闻。为了提高质量,K-SportsSum采用人工清理程序;(2)与现有的数据集不同,为了缩小知识差距,K-SportsSum进一步提供了包含523个体育队和14,724个体育运动员信息的大规模知识库。此外,我们还引入了一个利用现场评论和知识生成体育新闻的知识强化摘要。K-Sportsum和SportSum数据集的广泛实验显示,我们的模型实现了新的状态和艺术模型;(2)与现有数据集不同,以缩小知识差距,K-SportsSum进一步提供了包含523个体育队和14,724个体育运动员的信息。此外,我们还引入了知识强化的分析和人类研究。

0
下载
关闭预览

相关内容

《计算机信息》杂志发表高质量的论文,扩大了运筹学和计算的范围,寻求有关理论、方法、实验、系统和应用方面的原创研究论文、新颖的调查和教程论文,以及描述新的和有用的软件工具的论文。官网链接:https://pubsonline.informs.org/journal/ijoc
如何撰写一篇好的科研论文?这份22页ppt为你指点一二
专知会员服务
65+阅读 · 2021年7月11日
专知会员服务
44+阅读 · 2020年12月18日
【论文推荐】文本摘要简述
专知会员服务
69+阅读 · 2020年7月20日
知识图谱推理,50页ppt,Salesforce首席科学家Richard Socher
专知会员服务
109+阅读 · 2020年6月10日
【快讯】KDD2020论文出炉,216篇上榜, 你的paper中了吗?
专知会员服务
51+阅读 · 2020年5月16日
最新BERT相关论文清单,BERT-related Papers
专知会员服务
53+阅读 · 2019年9月29日
【知识图谱】知识图谱嵌入模型简介
深度学习自然语言处理
4+阅读 · 2020年10月10日
【文本摘要】Text Summarization文本摘要与注意力机制
深度学习自然语言处理
9+阅读 · 2020年3月15日
Transferring Knowledge across Learning Processes
CreateAMind
28+阅读 · 2019年5月18日
学术会议 | 知识图谱顶会 ISWC 征稿:Poster/Demo
开放知识图谱
5+阅读 · 2019年4月16日
LibRec 精选:连通知识图谱与推荐系统
LibRec智能推荐
3+阅读 · 2018年8月9日
【SIGIR2018】五篇对抗训练文章
专知
12+阅读 · 2018年7月9日
Jointly Improving Summarization and Sentiment Classification
黑龙江大学自然语言处理实验室
3+阅读 · 2018年6月12日
推荐|深度强化学习聊天机器人(附论文)!
全球人工智能
4+阅读 · 2018年1月30日
Arxiv
92+阅读 · 2020年2月28日
Paraphrase Generation with Deep Reinforcement Learning
VIP会员
相关资讯
【知识图谱】知识图谱嵌入模型简介
深度学习自然语言处理
4+阅读 · 2020年10月10日
【文本摘要】Text Summarization文本摘要与注意力机制
深度学习自然语言处理
9+阅读 · 2020年3月15日
Transferring Knowledge across Learning Processes
CreateAMind
28+阅读 · 2019年5月18日
学术会议 | 知识图谱顶会 ISWC 征稿:Poster/Demo
开放知识图谱
5+阅读 · 2019年4月16日
LibRec 精选:连通知识图谱与推荐系统
LibRec智能推荐
3+阅读 · 2018年8月9日
【SIGIR2018】五篇对抗训练文章
专知
12+阅读 · 2018年7月9日
Jointly Improving Summarization and Sentiment Classification
黑龙江大学自然语言处理实验室
3+阅读 · 2018年6月12日
推荐|深度强化学习聊天机器人(附论文)!
全球人工智能
4+阅读 · 2018年1月30日
Top
微信扫码咨询专知VIP会员