火锅 QA? 斯坦福又双叒提出了一个新 QA 数据集HotpotQA,面向自然和多跳问答!

【导读】斯坦福的上一轮阅读理解问答比赛 SQUAD1.1,于今年1月13日被阿里团队成功突破,算法的效果已经可以击败人类。前不久,他们又发布了一个新的对话问答数据集 CoQA, 也就一个多月,如今又新来了一个 HotpotQA数据集,面向自然和多跳的问答。相信这个数据集,又将会带领算法突破人类,达到前所未有的成就。目前网站刚刚上线, 只有发布比赛的文章里给出的 baseline 和 人类的结果。 趁着还没人提交,不考虑刷一下么?


文章地址 | https://arxiv.org/abs/1809.09600v1

比赛官网 | https://hotpotqa.github.io/

整理报道 | huaiwen


斯坦福和卡内基梅陇大学的自然语言处理团队,在自然语言处理顶会 EMNLP上,发表了一篇文章:HotpotQA: A Dataset for Diverse, Explainable Multi-hop Question Answering, 旨在搞定自然和多跳的问题。


HotpotQA 包含了113K 对的问答数据, 它的独特之处在于:

  • 需要对多个文件进行查找和推理来回答的问题;

  • 问题多样,不局限于已有的知识库或知识模式;

  • 提供推理所需的句子层面支撑事实,让QA系统在强有力的监督下进行推理,并对预测进行解释;

  • 提供了一种新型的事实比较问题来测试QA系统提取相关事实并进行必要的比较的能力。

跟现有的阅读理解问答数据集相比,HotpotQA 是一个全新的挑战。


目前网站刚刚上线, 只有发布比赛文章总给出的 baseline 和 人类的结果。 趁着还没人提交,不考虑刷一下么?


-END-

专 · 知


人工智能领域26个主题知识资料全集获取与加入专知人工智能服务群: 欢迎微信扫一扫加入专知人工智能知识星球群,获取专业知识教程视频资料和与专家交流咨询!



请PC登录www.zhuanzhi.ai或者点击阅读原文,注册登录专知,获取更多AI知识资料!


请加专知小助手微信(扫一扫如下二维码添加),加入专知主题群(请备注主题类型:AI、NLP、CV、 KG等)交流~

 AI 项目技术 & 商务合作:bd@zhuanzhi.ai, 或扫描上面二维码联系!

请关注专知公众号,获取人工智能的专业知识!

点击“阅读原文”,使用专知

展开全文
Top
微信扫码咨询专知VIP会员