赛尔推荐 | 第4期

2018 年 3 月 30 日 哈工大SCIR 哈工大SCIR

该栏目每周将推荐若干篇由师生精心挑选的前沿论文,分周三、周五两次推送。


本次推荐了关于自动文摘技术、自动文摘评价、自然语言推理、阅读理解和文本风格迁移的五篇论文。


1


推荐组CR

推荐人朱泽圻(研究方向:自动文摘技术)

论文题目A Semantic QA-Based Approach for Text Summarization Evaluation

作者Ping Chen, Fei Wu, Tong Wang

出处AAAI 2018

论文主要相关自动文摘技术,自动文摘评价

简评自动文摘的评价一般依赖于对比专家写作的文摘和机器的产生的文摘。这篇文章提出了一种不需要专家写作文摘的自动化评价指标。这篇文章将评价工作分为两个步骤:第一个步骤是基于模板,从原文中生成一系列的问题;第二个步骤是利用问答系统技术,分别借助原文和摘要的内容,尝试回答上一步骤所提出的问题,并通过比较回答情况衡量摘要性能。虽然这篇文章不需要专家写作的文摘,但是生成问题的模板仍需人工定义,只是对专家的依赖相对来说弱些,迁移能力强些。这篇文章让我联想起了此前的对偶学习系列文章,两者的共同点是试图摆脱机器学习对人工标注数据的依赖。


论文链接

https://arxiv.org/abs/1704.06259


2


推荐组LA 

推荐人刘洋(研究方向:语言分析)

论文题目A Broad-Coverage Challenge Corpus for Sentence Understanding through Inference

作者Adina Williams, Nikita Nangia, Samuel R. Bowman

出处NAACL 2018

论文主要相关Natural Language Inference

简评本文构造并详细介绍了Multi-Genre Natural Language Inference(MultiNLI)语料库。该数据集用于开发和评估机器学习模型的句子理解能力,即判断句子的蕴含、中立、矛盾关系。 相比现有SNLI数据集,该数据集包含更多领域与更多数据(十种不同类型的书面和口语的英语数据),使研究者可以在此数据集上进行领域迁移等研究。


论文链接

http://www.nyu.edu/projects/bowman/multinli/paper.pdf

数据集链接

http://www.nyu.edu/projects/bowman/multinli/


3


推荐组QA 

推荐人齐乐(研究方向:问答系统)

论文题目S-NET: From Answer Extraction to Answer Generation For Machine Reading Comprehension

作者Chuanqi Tan, Furu Wei, Nan Yang, Bowen Du, Weifeng Lv, Ming Zhou

出处Arxiv

论文主要相关阅读理解

简评本文在阅读理解任务上设计了一种extraction-then-synthesis框架,不仅能回答答案是单一文档中的精确片段的问题(SQuAD),同时能回答答案来源于多个文档甚至不出现在任何一个文档中需要推理才能得到的问题。该框架包括两个部分:1、证据抽取;2、答案生成。在证据抽取部分,本文将答案片段抽取和文档排序联合在一起,提高了在多文档中抽取的结果。在答案生成部分,本文将抽取出的证据作为额外特征与问题、答案一起输入到一个seq-to-seq模型中,生成最后答案。本文在MS-MARCO数据集上进行了实验,在BLEU和ROUGE-L两个指标上均达到了state-of-the-art的结果。


论文链接

https://arxiv.org/abs/1706.04815


4


推荐组RC

推荐人李家琦(研究方向:篇章结构)

论文1题目Style Transfer from Non-Parallel Text by Cross-Alignment

论文1作者Tianxiao Shen, Tao Lei, Regina Barzilay, Tommi Jaakkola 

论文2题目Style Transfer in Text: Exploration and Evaluation

论文2作者: Zhenxin Fu, Xiaoye Tan, Nanyun Peng, Dongyan Zhao, Rui Yan

这两篇论文的第一作者沈添笑和付振新分别来自麻省理工学院和北京大学。

出处NIPS 2017,AAAI 2018

论文主要相关文本风格迁移

简评近年来,基于非平行数据的风格迁移在计算机视觉领域已被广泛研究,而这两篇文章均基于非平行语料对语言风格迁移进行了初探。语言风格迁移的核心是“Keep the content, vary the style”,即保持内容不变的情况下更改风格,其关键在于如何仅使用非平行语料将句子映射为风格独立(style-independent)的内容向量,并将该向量解码成内容相同风格不同的句子。在自动评价方面,两篇论文都预先训练了一个风格分类器对输出文本的语言风格进行自动判别。

论文一提出了交叉对齐的自动编码器(Cross-aligned auto-encoder)用于风格迁移,将迁移后的样例与另一风格的真实样例对齐,并应用于情感极性迁移、词替换密码的破译、恢复词序等三个任务。相比于传统变分自动编码器(VAE)和对齐自动编码器(Aligned AE),交叉对齐自动编码器实验效果获得了显著提升。文中最后还提出了一个开放性问题:什么时候在只给边缘分布的情况下可以恢复联合分布

论文二对文本风格迁移进行了探索并提出了Multi-decoder和Style-Embedding模型,两种方法均学习到了去风格化的内容表示c,区别在于前者通过学习不同的解码器来解码不用的风格,而后者通过学习风格的嵌入表示s来进行解码。为了验证模型性能,作者构建了新闻标题—论文标题、褒义—贬义两个非平行语料,并提出迁移强度和内容保留程度等自动评价指标。

 

论文链接

论文1

http://papers.nips.cc/paper/7259-style-transfer-from-non-parallel-text-by-cross-alignment

论文2

https://arxiv.org/abs/1711.06861

 

代码及数据

论文1

https://github.com/shentianxiao/language-style-transfer

论文2

https://github.com/fuzhenxin/text_style_transfer

https://github.com/fuzhenxin/textstyletransferdata

 

Slides

论文1

http://people.csail.mit.edu/tianxiao/papers/nips17_language-style-transfer_slides.pdf

论文2AAAI 2018论文预讲会顺利召开(附PPT下载)


往期链接

赛尔推荐 | 第3期

(多任务学习、文本分类、阅读理解、特征选择、知识融合、图像标注)

赛尔推荐 | 第2期

对话系统自动评价,优化器,复述生成,问答系统)

赛尔推荐 | 第1期

词向量,情感分析,循环神经网络,sequence-to-sequence模型、选择机制和摘要生成)

赛尔推荐 | 第0期 

人机对话,神经网络模型,知识工程,自然语言推理,基于文档集的问答,sequence-to-sequence模型,预测的可解释性和机器翻译)


本期责任编辑:  刘一佳

本期编辑:  刘元兴



“哈工大SCIR”公众号

主编:车万翔

副主编: 张伟男,丁效

责任编辑: 张伟男,丁效,赵森栋,刘一佳

编辑: 李家琦,赵得志,赵怀鹏,吴洋,刘元兴,蔡碧波,孙卓


长按下图并点击 “识别图中二维码”,即可关注哈尔滨工业大学社会计算与信息检索研究中心微信公共号:”哈工大SCIR” 。

登录查看更多
7

相关内容

就是说在不改变文档原意的情况下,利用计算机程序自动地总结出文档的主要内容。自动摘要的应用场景非常多,例如新闻标题生成、科技文献摘要生成、搜索结果片段(snippets)生成、商品评论摘要等。
【哈工大】基于抽取的高考作文生成
专知会员服务
36+阅读 · 2020年3月10日
深度学习视频中多目标跟踪:论文综述
专知会员服务
92+阅读 · 2019年10月13日
最新BERT相关论文清单,BERT-related Papers
专知会员服务
52+阅读 · 2019年9月29日
赛尔推荐 | 第22期
哈工大SCIR
6+阅读 · 2018年6月6日
赛尔推荐 | 第21期
哈工大SCIR
4+阅读 · 2018年6月1日
赛尔推荐 | 第20期
哈工大SCIR
4+阅读 · 2018年5月30日
赛尔推荐 | 第17期
哈工大SCIR
8+阅读 · 2018年5月18日
赛尔推荐 | 第14期
哈工大SCIR
3+阅读 · 2018年5月9日
赛尔推荐 | 第13期
哈工大SCIR
5+阅读 · 2018年5月4日
赛尔推荐 | 第12期
哈工大SCIR
4+阅读 · 2018年5月2日
赛尔推荐 | 第9期
哈工大SCIR
13+阅读 · 2018年4月20日
赛尔推荐 | 第5期
哈工大SCIR
13+阅读 · 2018年4月4日
赛尔推荐 | 第3期
哈工大SCIR
7+阅读 · 2018年3月28日
CoQA: A Conversational Question Answering Challenge
Arxiv
7+阅读 · 2018年8月21日
Arxiv
3+阅读 · 2018年3月2日
Arxiv
3+阅读 · 2017年12月18日
VIP会员
相关资讯
赛尔推荐 | 第22期
哈工大SCIR
6+阅读 · 2018年6月6日
赛尔推荐 | 第21期
哈工大SCIR
4+阅读 · 2018年6月1日
赛尔推荐 | 第20期
哈工大SCIR
4+阅读 · 2018年5月30日
赛尔推荐 | 第17期
哈工大SCIR
8+阅读 · 2018年5月18日
赛尔推荐 | 第14期
哈工大SCIR
3+阅读 · 2018年5月9日
赛尔推荐 | 第13期
哈工大SCIR
5+阅读 · 2018年5月4日
赛尔推荐 | 第12期
哈工大SCIR
4+阅读 · 2018年5月2日
赛尔推荐 | 第9期
哈工大SCIR
13+阅读 · 2018年4月20日
赛尔推荐 | 第5期
哈工大SCIR
13+阅读 · 2018年4月4日
赛尔推荐 | 第3期
哈工大SCIR
7+阅读 · 2018年3月28日
Top
微信扫码咨询专知VIP会员