从大型文本语料库(如维基百科)中收集支持证据对开放域问答(QA)来说是一个巨大的挑战。特别是对于多跳开放域的QA,需要将分散的证据片段聚集在一起,以支持答案抽取。在本文中,我们提出了一种新的检索目标——hop,用于从维基百科中收集复杂问题回答中隐藏的推理证据。具体来说,本文将hop定义为超链接与相应的出站链接文档的组合。超链接被编码为提到嵌入,它对出站链接实体在文本上下文中如何被提及的结构化知识进行建模,而相应的出站链接文档被编码为表示其中非结构化知识的嵌入文档。因此,我们构建了hopretriver,它可以在Wikipedia上检索跳跃来回答复杂的问题。在HotpotQA数据集上的实验表明,hopretriver比以前发布的证据检索方法有更大的优势。此外,我们的方法还产生了证据收集过程的可量化解释。

https://www.zhuanzhi.ai/paper/ef7d860704608c5446360ad2a0d8cbce

成为VIP会员查看完整内容
14

相关内容

专知会员服务
16+阅读 · 2021年2月17日
【AAAI2021】知识图谱增强的预训练模型的生成式常识推理
【AAAI2021】时间关系建模与自监督的动作分割
专知会员服务
36+阅读 · 2021年1月24日
专知会员服务
44+阅读 · 2020年12月20日
【AAAI2021】 层次图胶囊网络
专知会员服务
80+阅读 · 2020年12月18日
【SIGMOD2020-腾讯】Web规模本体可扩展构建
专知会员服务
28+阅读 · 2020年4月12日
ACL2020 | 基于Knowledge Embedding的多跳知识图谱问答
AI科技评论
18+阅读 · 2020年6月29日
论文浅尝 | 基于复杂查询图编码的知识库问答
开放知识图谱
17+阅读 · 2019年7月22日
论文浅尝 | 通过文本到文本神经问题生成的机器理解
开放知识图谱
10+阅读 · 2019年6月30日
论文浅尝 | 为基于知识库的问答构建形式查询生成
开放知识图谱
10+阅读 · 2019年3月8日
论文浅尝 | 基于知识图谱子图匹配以回答自然语言问题
开放知识图谱
25+阅读 · 2018年6月26日
基于Wikipedia知识源的开放领域问答系统(读书报告)
科技创新与创业
9+阅读 · 2017年11月7日
Arxiv
0+阅读 · 2021年2月26日
Arxiv
14+阅读 · 2019年11月26日
Arxiv
8+阅读 · 2019年3月21日
VIP会员
相关VIP内容
专知会员服务
16+阅读 · 2021年2月17日
【AAAI2021】知识图谱增强的预训练模型的生成式常识推理
【AAAI2021】时间关系建模与自监督的动作分割
专知会员服务
36+阅读 · 2021年1月24日
专知会员服务
44+阅读 · 2020年12月20日
【AAAI2021】 层次图胶囊网络
专知会员服务
80+阅读 · 2020年12月18日
【SIGMOD2020-腾讯】Web规模本体可扩展构建
专知会员服务
28+阅读 · 2020年4月12日
相关资讯
ACL2020 | 基于Knowledge Embedding的多跳知识图谱问答
AI科技评论
18+阅读 · 2020年6月29日
论文浅尝 | 基于复杂查询图编码的知识库问答
开放知识图谱
17+阅读 · 2019年7月22日
论文浅尝 | 通过文本到文本神经问题生成的机器理解
开放知识图谱
10+阅读 · 2019年6月30日
论文浅尝 | 为基于知识库的问答构建形式查询生成
开放知识图谱
10+阅读 · 2019年3月8日
论文浅尝 | 基于知识图谱子图匹配以回答自然语言问题
开放知识图谱
25+阅读 · 2018年6月26日
基于Wikipedia知识源的开放领域问答系统(读书报告)
科技创新与创业
9+阅读 · 2017年11月7日
微信扫码咨询专知VIP会员