We present Semantic WordRank (SWR), an unsupervised method for generating an extractive summary of a single document. Built on a weighted word graph with semantic and co-occurrence edges, SWR scores sentences using an article-structure-biased PageRank algorithm with a Softplus function adjustment, and promotes topic diversity using spectral subtopic clustering under the Word-Movers-Distance metric. We evaluate SWR on the DUC-02 and SummBank datasets and show that SWR produces better summaries than the state-of-the-art algorithms over DUC-02 under common ROUGE measures. We then show that, under the same measures over SummBank, SWR outperforms each of the three human annotators (aka. judges) and compares favorably with the combined performance of all judges.


翻译:我们提出Sermantic WordRank(SWR),这是生成单一文件的抽取摘要的一种不受监督的方法。我们用一个带有语义和共发边缘的加权字图构建了SWR, 使用带有软性功能调整的有条理结构偏向的PageRank算法进行评分,并根据Word-Movers-Disstant 指标, 利用光谱子子专题组合促进专题多样性。我们评估了DUC-02和SummBank数据集的SWR, 并表明SWR生成的提要优于根据共同的ROUGE措施的DUC-02的最新算法。然后我们表明,在SumBank的相同措施下,SWR优于所有法官的综合表现。

0
下载
关闭预览

相关内容

Gartner:2020年十大战略性技术趋势, 47页pdf
专知会员服务
77+阅读 · 2020年3月10日
最新BERT相关论文清单,BERT-related Papers
专知会员服务
52+阅读 · 2019年9月29日
强化学习的Unsupervised Meta-Learning
CreateAMind
17+阅读 · 2019年1月7日
无监督元学习表示学习
CreateAMind
27+阅读 · 2019年1月4日
Unsupervised Learning via Meta-Learning
CreateAMind
42+阅读 · 2019年1月3日
自然语言处理顶会EMNLP2018接受论文列表!
专知
87+阅读 · 2018年8月26日
【论文】变分推断(Variational inference)的总结
机器学习研究会
39+阅读 · 2017年11月16日
gan生成图像at 1024² 的 代码 论文
CreateAMind
4+阅读 · 2017年10月31日
Auto-Encoding GAN
CreateAMind
7+阅读 · 2017年8月4日
Adversarial Mutual Information for Text Generation
Arxiv
13+阅读 · 2020年6月30日
Neural Response Generation with Meta-Words
Arxiv
6+阅读 · 2019年6月14日
Arxiv
5+阅读 · 2019年4月21日
Arxiv
3+阅读 · 2018年12月18日
Arxiv
4+阅读 · 2018年3月1日
VIP会员
相关论文
Adversarial Mutual Information for Text Generation
Arxiv
13+阅读 · 2020年6月30日
Neural Response Generation with Meta-Words
Arxiv
6+阅读 · 2019年6月14日
Arxiv
5+阅读 · 2019年4月21日
Arxiv
3+阅读 · 2018年12月18日
Arxiv
4+阅读 · 2018年3月1日
Top
微信扫码咨询专知VIP会员