【干货笔记】Generating Question-Answer Hierarchies阅读笔记

2020 年 3 月 29 日 深度学习自然语言处理

点击上方,选择星标置顶,每天给你送干货

阅读大概需要5分钟

跟随小博主,每天进步一丢丢


来自 | 知乎

地址 | https://zhuanlan.zhihu.com/p/86593349

作者 | 大葱的kangzhan史

编辑 | 机器学习算法与自然语言处理公众号

本文仅作学术分享,若侵权,请联系后台删文处理


文章:Generating Question-Answer Hierarchies

来源:ACL2019

链接:

https://arxiv.org/pdf/1906.02622.pdf arxiv.org

解决问题:本文介绍了SQUASH(专一性控制问题-答案层次结构)一种新颖且具有挑战性的文本生成任务,可将输入文档转换为有层次结构的问题-答案对。用户可以单击高级问题(例如“ Frodo为何离开研究金?”)来显示相关但更具体的问题(例如“ Frodo谁离开了?”)。

1.贡献:

· 一种根据问题的特殊性对问题进行分类的方法。

· 一种模型,用于控制所生成问题的特异性,这与之前进行QA的工作不同。

· 一种新颖的文本生成任务(SQUASH),它将文档转换为QA对基于特定性的层次结构。

· 用于解决SQUASH的流水线系统以及用于评估它的众包方法。

2.相关工作介绍:

3.模型:

3.1问题分类:

我们将问题分为三个粗糙的标签:GENERAL,SPECIFIC或YES-NO,根据问题的特殊性自动对SQuAD,QuAC和CoQA中的问题进行分类。具体问题通常要求低级别的信息(例如,实体或数字),而一般问题则要求更广泛的概述(例如,“ 1999年发生了什么?”)或因果信息(例如,“为什么……”)。使用简单的模板和规则可以可靠地识别许多问题类别。

对于不满足任何模板或规则的问题,手动标注了1000条数据用CNN分类器进行分类,最终将所有问题都运行了基于规则的方法,并将分类器应用于规则未涵盖的问题。

3.2生成QA对:

pipeline for SQUASH

在训练时,我们使用这些数据集中的真实答案范围作为问题生成器的输入。将输入段落中的所有单个句子视为潜在的答案范围(以生成一般和具体问题),以及所有实体和数字(仅针对具体问题)。

为了提高从句子生成的特殊问题的质量,手动删除了一些非常笼统的问题(例如“本文中发生了什么?”)。其他一些问题(例如“他在哪里出生?”)在数据集中被重复多次;我们将此类问题下采样到最大限制为10。

我们使用两层的biL-STM编码器和单层的LSTM解码器来生成问题(1997),将解码器的特殊性级别设置为“一般”,“具体”和“是-否”。每个答案范围生成十三个候选问题。

3.3形成有层次的QA对:

首先,为每个特殊问题选择一个父项----使每个一般问题的预测答案与预测答案的重叠(词级精度)最大化。如果没有与特定问题的答案重叠的一般问题的答案,我们将其映射到最接近的一般问题----其答案在特定问题的答案之前。

4.实验与评估:

对于我们所有的实验,我们使用BiDAF ++问题回答模型的AllenNLP实现。(2018)在没有对话上下文的情况下对QuAC进行了训练。

4.1生成问题评估:

我们使用各种众包实验在QuAC开发集的文档上评估了SQUASH流程。

第一行显示,产生的问题中有85.8%句法成立;第二行显示,我们的问题中有78.7%与该段落相关,而黄金问题中则有83.3%;第三行和第四行中显示包含问题答案得分

4.2结构正确性评估(抽样):

首先,我们调查我们的模型是否实际上在生成带有正确特异性标签的问题。我们对400个随机抽样的问题(一般50%,特殊50%)运行了特异性分类器(第2部分),并获得91%的高分类精度。这种自动评估表明该模型能够产生不同类型的问题。

为了查看一般问题是否确实提供了更多的高级信息,我们对200个一般-具体问题对进行了抽样。对于每对问题(不显示答案),我们请人群工作者选择问题,如果回答了问题,将为他们提供有关该段落的更多信息。在89.5%的情况下,一般问题优于特定问题,这证实了我们的特异性控制问题生成系统的优势。

5.待解决的问题:

有缺陷的数据集

信息冗余

缺乏世界知识

每个段落有多个一般QA对


交流学习,进群备注: 昵称-学校(公司)-方向,进入DL&NLP交流群。
方向有很多: 机器学习、深度学习,python,情感分析、意见挖掘、句法分析、机器翻译、人机对话、知识图谱、语音识别等



登录查看更多
4

相关内容

自动问答(Question Answering, QA)是指利用计算机自动回答用户所提出的问题以满足用户知识需求的任务。不同于现有搜索引擎,问答系统是信息服务的一种高级形式,系统返回用户的不再是基于关键词匹配排序的文档列表,而是精准的自然语言答案。近年来,随着人工智能的飞速发展,自动问答已经成为倍受关注且发展前景广泛的研究方向。

知识荟萃

精品入门和进阶教程、论文和代码整理等

更多

查看相关VIP内容、论文、资讯等
【2020新书】实战R语言4,323页pdf
专知会员服务
100+阅读 · 2020年7月1日
【阿里技术论文】AliMe KBQA:阿里小蜜中的结构化知识问答
专知会员服务
82+阅读 · 2019年12月14日
【阿里技术干货】知识结构化在阿里小蜜中的应用
专知会员服务
96+阅读 · 2019年12月14日
【论文笔记】Graph U-Nets
专知
80+阅读 · 2019年11月25日
FlowNet 论文笔记
统计学习与视觉计算组
9+阅读 · 2018年5月9日
【干货】一文读懂什么是变分自编码器
专知
12+阅读 · 2018年2月11日
论文浅尝 | Question Answering over Freebase
开放知识图谱
18+阅读 · 2018年1月9日
【干货】卷积神经网络CNN学习笔记
机器学习研究会
15+阅读 · 2017年12月17日
NLP 专题论文解读:从 Chatbot 到 NER | PaperDaily #11
PaperWeekly
5+阅读 · 2017年11月8日
超级干货 :一文读懂特征工程
数据分析
9+阅读 · 2017年9月6日
Adversarial Mutual Information for Text Generation
Arxiv
13+阅读 · 2020年6月30日
Question Generation by Transformers
Arxiv
5+阅读 · 2019年9月14日
Paraphrase Generation with Deep Reinforcement Learning
Arxiv
6+阅读 · 2018年4月21日
VIP会员
相关资讯
【论文笔记】Graph U-Nets
专知
80+阅读 · 2019年11月25日
FlowNet 论文笔记
统计学习与视觉计算组
9+阅读 · 2018年5月9日
【干货】一文读懂什么是变分自编码器
专知
12+阅读 · 2018年2月11日
论文浅尝 | Question Answering over Freebase
开放知识图谱
18+阅读 · 2018年1月9日
【干货】卷积神经网络CNN学习笔记
机器学习研究会
15+阅读 · 2017年12月17日
NLP 专题论文解读:从 Chatbot 到 NER | PaperDaily #11
PaperWeekly
5+阅读 · 2017年11月8日
超级干货 :一文读懂特征工程
数据分析
9+阅读 · 2017年9月6日
Top
微信扫码咨询专知VIP会员