【WWW2020-UIUC】为新闻故事生成具有代表性的标题

2020 年 3 月 18 日 专知



每天都有数以百万计的新闻文章在网上发布,这对读者来说是难以承受的。将报道同一事件的文章分组成新闻报道是帮助读者进行新闻消费的一种常见方式。然而,如何高效、有效地为每一个故事生成一个有代表性的标题仍然是一个具有挑战性的研究问题。文档集自动摘要的研究已经有几十年的历史了,但是很少有研究关注于为一组文章生成具有代表性的标题。摘要的目的是用最少的冗余捕获最多的信息,而标题的目的是短篇幅捕获由story文章共同共享的信息,并排除对每一篇文章过于具体的信息。在这项工作中,我们研究的问题,产生具有代表性的新闻故事标题。我们开发了一种远监督方法来训练大规模的没有任何人工标注的生成模型。这种方法集中在两个技术组件上。首先,我们提出了一个多层次的预训练框架,该框架融合了大量不同质量的未标记语料库。我们证明,在这个框架内训练的模型比那些使用纯人类策展语料库训练的模型表现得更好。其次,我们提出了一种新的基于自投票的文章注意层来提取多篇文章共享的显著信息。我们证明了该层模型对新闻中潜在的干扰具有较强的鲁棒性,无论是否存在干扰,其性能都优于已有的基线。我们可以通过合并人类标签来进一步增强我们的模型,我们展示了我们的远监督方法,这大大减少了对标签数据的需求。


https://arxiv.org/abs/2001.09386


专知便捷查看

便捷下载,请关注专知公众号(点击上方蓝色专知关注)

  • 后台回复“GRH” 就可以获取为新闻故事生成具有代表性的标题》专知下载链接

专知,专业可信的人工智能知识分发,让认知协作更快更好!欢迎注册登录专知www.zhuanzhi.ai,获取5000+AI主题干货知识资料!
欢迎微信扫一扫加入专知人工智能知识星球群,获取最新AI专业干货知识教程资料和与专家交流咨询
点击“ 阅读原文 ”,了解使用 专知 ,查看获取5000+AI主题知识资源
登录查看更多
0

相关内容

COVID-19文献知识图谱构建,UIUC-哥伦比亚大学
专知会员服务
43+阅读 · 2020年7月2日
知识图谱简史:从1950到2019
专知
25+阅读 · 2019年12月2日
基于知识图谱的文本挖掘 - 超越文本挖掘
专知
38+阅读 · 2019年8月18日
论文浅尝 | 基于图注意力的常识对话生成
开放知识图谱
8+阅读 · 2019年2月5日
Arxiv
5+阅读 · 2019年6月5日
Arxiv
3+阅读 · 2019年3月1日
Music Transformer
Arxiv
5+阅读 · 2018年12月12日
Arxiv
6+阅读 · 2018年6月20日
Arxiv
5+阅读 · 2018年1月30日
VIP会员
相关VIP内容
COVID-19文献知识图谱构建,UIUC-哥伦比亚大学
专知会员服务
43+阅读 · 2020年7月2日
相关论文
Top
微信扫码咨询专知VIP会员