火锅 QA? 斯坦福又双叒提出了一个新 QA 数据集HotpotQA，面向自然和多跳问答！

2018 年 9 月 27 日 专知

【导读】斯坦福的上一轮阅读理解问答比赛 SQUAD1.1，于今年1月13日被阿里团队成功突破，算法的效果已经可以击败人类。前不久，他们又发布了一个新的对话问答数据集 CoQA，也就一个多月，如今又新来了一个 HotpotQA数据集，面向自然和多跳的问答。相信这个数据集，又将会带领算法突破人类，达到前所未有的成就。目前网站刚刚上线，只有发布比赛的文章里给出的 baseline 和人类的结果。趁着还没人提交，不考虑刷一下么？

文章地址 | https://arxiv.org/abs/1809.09600v1

比赛官网 | https://hotpotqa.github.io/

整理报道 | huaiwen

斯坦福和卡内基梅陇大学的自然语言处理团队，在自然语言处理顶会 EMNLP上，发表了一篇文章：HotpotQA: A Dataset for Diverse, Explainable Multi-hop Question Answering，旨在搞定自然和多跳的问题。

HotpotQA 包含了113K 对的问答数据，它的独特之处在于：

需要对多个文件进行查找和推理来回答的问题;
问题多样，不局限于已有的知识库或知识模式;
提供推理所需的句子层面支撑事实，让QA系统在强有力的监督下进行推理，并对预测进行解释;
提供了一种新型的事实比较问题来测试QA系统提取相关事实并进行必要的比较的能力。

跟现有的阅读理解问答数据集相比，HotpotQA 是一个全新的挑战。

目前网站刚刚上线，只有发布比赛文章总给出的 baseline 和人类的结果。趁着还没人提交，不考虑刷一下么？

-END-

专 · 知

人工智能领域26个主题知识资料全集获取与加入专知人工智能服务群: 欢迎微信扫一扫加入专知人工智能知识星球群，获取专业知识教程视频资料和与专家交流咨询！

请PC登录www.zhuanzhi.ai或者点击阅读原文，注册登录专知，获取更多AI知识资料！

请加专知小助手微信（扫一扫如下二维码添加），加入专知主题群（请备注主题类型：AI、NLP、CV、 KG等）交流~

AI 项目技术 & 商务合作：bd@zhuanzhi.ai, 或扫描上面二维码联系！

请关注专知公众号，获取人工智能的专业知识！

点击“阅读原文”，使用专知

登录查看更多

相关内容

HotpotQA

关注 0

ACL2020 开始了！看这份Tutorial《开放域问答》，普林斯顿陈丹琦

专知会员服务

59+阅读 · 2020年7月5日

【翻译-ACL2020】使用知识库嵌入改进知识图上的多跳问答

专知会员服务

70+阅读 · 2020年7月3日

斯坦福2020硬课《分布式算法与优化》

专知会员服务

123+阅读 · 2020年5月6日

【IJCAI2020-CMU】结构注意力的神经抽象摘要

专知会员服务

22+阅读 · 2020年4月23日

重磅！Geoffrey Hinton新论文「视觉表示对比学习简单框架」自监督学习建立新SOTA-ImageNet准确率76.5%

专知会员服务

33+阅读 · 2020年2月15日

机器阅读理解的任务与模式研究，61页pdf，多伦多约克大学

专知会员服务

22+阅读 · 2020年1月28日

专知会员服务

47+阅读 · 2019年11月24日

【NLP| 推荐文章】神经阅读理解与超越（Neural Reading Comprehension And Beyond）

专知会员服务

26+阅读 · 2019年11月23日

【清华大学】利用知识增强的图神经网络进行多段推理，Multi-Paragraph Reasoning with Knowledge-enhanced Graph Neural Network

专知会员服务

95+阅读 · 2019年11月8日

斯坦福陈丹琦博士论文：神经网络阅读理解与更多【附156页pdf】

专知会员服务

64+阅读 · 2019年10月27日

论文浅尝 | XQA：一个跨语言开放域问答数据集

开放知识图谱

25+阅读 · 2019年9月11日

AI会话能力超越人类！CoQA挑战赛微软创新纪录

智东西

12+阅读 · 2019年5月5日

视觉推理任务中的ImageNet：斯坦福GQA数据集重磅发布

专知

23+阅读 · 2019年1月30日

斯坦福陈丹琦博士论文：神经网络阅读理解与更多【附156页pdf】

专知

62+阅读 · 2018年12月15日

新任务&数据集：视觉常识推理(VCR)

专知

50+阅读 · 2018年12月1日

CMU多语种语音数据集：700多种语言的语音/文本对齐语料

专知

4+阅读 · 2018年11月19日

资源 |「火锅问答」是啥？面向自然语言和多步推理问题，新型问答数据集HotpotQA面世

机器之心

6+阅读 · 2018年10月1日

【EMNLP2018】RecipeQA - 食谱多模态阅读理解数据集

专知

16+阅读 · 2018年9月8日

CoQA！斯坦福召开新一轮QA比赛，剑指对话问答！

专知

6+阅读 · 2018年8月23日

Facebook开源问答系统DrQA：基于单一信源回答开放域提问

量子位

8+阅读 · 2017年7月27日

GQA: A New Dataset for Real-World Visual Reasoning and Compositional Question Answering

Arxiv

3+阅读 · 2019年5月10日

A BERT Baseline for the Natural Questions

Arxiv

8+阅读 · 2019年3月21日

Improving Question Answering by Commonsense-Based Pre-Training

Arxiv

5+阅读 · 2018年10月5日

HotpotQA: A Dataset for Diverse, Explainable Multi-hop Question Answering

Arxiv

4+阅读 · 2018年9月25日

Commonsense for Generative Multi-Hop Question Answering Tasks

Arxiv

4+阅读 · 2018年9月17日

CoQA: A Conversational Question Answering Challenge

Arxiv

7+阅读 · 2018年8月21日

Question Answering through Transfer Learning from Large Fine-grained Supervision Data

Arxiv

3+阅读 · 2018年5月31日

QA4IE: A Question Answering based Framework for Information Extraction

Arxiv

4+阅读 · 2018年4月10日

DVQA: Understanding Data Visualizations via Question Answering

Arxiv

8+阅读 · 2018年1月24日

VQA: Visual Question Answering

Arxiv

9+阅读 · 2016年10月27日

VIP会员