This paper presents an unsupervised extractive approach to summarize scientific long documents based on the Information Bottleneck principle. Inspired by previous work which uses the Information Bottleneck principle for sentence compression, we extend it to document level summarization with two separate steps. In the first step, we use signal(s) as queries to retrieve the key content from the source document. Then, a pre-trained language model conducts further sentence search and edit to return the final extracted summaries. Importantly, our work can be flexibly extended to a multi-view framework by different signals. Automatic evaluation on three scientific document datasets verifies the effectiveness of the proposed framework. The further human evaluation suggests that the extracted summaries cover more content aspects than previous systems.


翻译:本文件介绍了一种未经监督的采掘方法,根据信息瓶颈原则对长长的科学文件进行总结。在以往使用信息瓶颈原则进行句子压缩的工作的启发下,我们将其扩展为以两个不同步骤对文件水平进行总结。第一步,我们使用信号查询源文件的关键内容。然后,经过预先培训的语言模式进行进一步的句子搜索和编辑,以归还最后摘录的摘要。重要的是,我们的工作可以通过不同的信号灵活地扩展到多视角框架。对三个科学文件数据集的自动评估可以核实拟议框架的有效性。进一步的人类评估表明,所提取的摘要的内容方面比以往系统要多。

0
下载
关闭预览

相关内容

《计算机信息》杂志发表高质量的论文,扩大了运筹学和计算的范围,寻求有关理论、方法、实验、系统和应用方面的原创研究论文、新颖的调查和教程论文,以及描述新的和有用的软件工具的论文。官网链接:https://pubsonline.informs.org/journal/ijoc
【数据科学导论书】Introduction to Datascience,253页pdf
专知会员服务
49+阅读 · 2021年11月15日
最新《Transformers模型》教程,64页ppt
专知会员服务
311+阅读 · 2020年11月26日
【深度学习视频分析/多模态学习资源大列表】
专知会员服务
92+阅读 · 2019年10月16日
周志华教授:如何做研究与写论文?
专知会员服务
155+阅读 · 2019年10月9日
计算机类 | PLDI 2020等国际会议信息6条
Call4Papers
3+阅读 · 2019年7月8日
人工智能 | SCI期刊专刊信息3条
Call4Papers
5+阅读 · 2019年1月10日
大数据 | 顶级SCI期刊专刊/国际会议信息7条
Call4Papers
10+阅读 · 2018年12月29日
已删除
将门创投
4+阅读 · 2017年12月5日
Knowledge Enhanced Sports Game Summarization
Arxiv
0+阅读 · 2021年11月24日
Arxiv
3+阅读 · 2018年12月18日
VIP会员
相关VIP内容
【数据科学导论书】Introduction to Datascience,253页pdf
专知会员服务
49+阅读 · 2021年11月15日
最新《Transformers模型》教程,64页ppt
专知会员服务
311+阅读 · 2020年11月26日
【深度学习视频分析/多模态学习资源大列表】
专知会员服务
92+阅读 · 2019年10月16日
周志华教授:如何做研究与写论文?
专知会员服务
155+阅读 · 2019年10月9日
相关资讯
计算机类 | PLDI 2020等国际会议信息6条
Call4Papers
3+阅读 · 2019年7月8日
人工智能 | SCI期刊专刊信息3条
Call4Papers
5+阅读 · 2019年1月10日
大数据 | 顶级SCI期刊专刊/国际会议信息7条
Call4Papers
10+阅读 · 2018年12月29日
已删除
将门创投
4+阅读 · 2017年12月5日
Top
微信扫码咨询专知VIP会员