从大型文本语料库(如维基百科)中收集支持证据对开放域问答(QA)来说是一个巨大的挑战。特别是对于多跳开放域的QA,需要将分散的证据片段聚集在一起,以支持答案抽取。在本文中,我们提出了一种新的检索目标——hop,用于从维基百科中收集复杂问题回答中隐藏的推理证据。具体来说,本文将hop定义为超链接与相应的出站链接文档的组合。超链接被编码为提到嵌入,它对出站链接实体在文本上下文中如何被提及的结构化知识进行建模,而相应的出站链接文档被编码为表示其中非结构化知识的嵌入文档。因此,我们构建了hopretriver,它可以在Wikipedia上检索跳跃来回答复杂的问题。在HotpotQA数据集上的实验表明,hopretriver比以前发布的证据检索方法有更大的优势。此外,我们的方法还产生了证据收集过程的可量化解释。

https://www.zhuanzhi.ai/paper/ef7d860704608c5446360ad2a0d8cbce

成为VIP会员查看完整内容
15

相关内容

专知会员服务
17+阅读 · 2021年2月17日
【AAAI2021】时间关系建模与自监督的动作分割
专知会员服务
37+阅读 · 2021年1月24日
【SIGMOD2020-腾讯】Web规模本体可扩展构建
专知会员服务
32+阅读 · 2020年4月12日
论文浅尝 | 基于复杂查询图编码的知识库问答
开放知识图谱
17+阅读 · 2019年7月22日
论文浅尝 | 基于知识图谱子图匹配以回答自然语言问题
开放知识图谱
26+阅读 · 2018年6月26日
Arxiv
0+阅读 · 2021年2月26日
VIP会员
相关VIP内容
专知会员服务
17+阅读 · 2021年2月17日
【AAAI2021】时间关系建模与自监督的动作分割
专知会员服务
37+阅读 · 2021年1月24日
【SIGMOD2020-腾讯】Web规模本体可扩展构建
专知会员服务
32+阅读 · 2020年4月12日
相关资讯
微信扫码咨询专知VIP会员