视觉推理任务中的ImageNet：斯坦福GQA数据集重磅发布 - 专知

会员服务 ·

0

视觉推理任务中的ImageNet：斯坦福GQA数据集重磅发布

2019 年 1 月 30 日 专知

【导读】近日，斯坦福NLP研究组发布了最新整理视觉问答数据集——GQA，以推动真实场景下的视觉-语言理解的研究进程，其中包括问答、图片、语义信息等内容，并且本数据集将被应用于2019年的VQA track中。

介绍：

GQA——关于图像场景下的问答数据集。这是一个新的数据集，将被用于对现实世界中的图像进行视觉推理与组合回答的任务中。该数据集中包括了有关各种日常图像的近2000万条问题。每个图像都与一组场景图（scene graph）对应。每个问题都与其语义的结构化表示相关联在一起，并且约束应答者必须采用特定的推理步骤来回答它。

许多GQA的问题中涉及到了多种的推理技巧，空间理解和多步推理等，因此，通常比社区中使用的视觉问答数据集更有挑战性。在本次的收集过程中，我们还确保了数据集的平衡性，严格控制不同问题组的答案分布，以防止使用语言和先验信息进行猜测。

最后，我们采用了一套新的指标来补充数据集，不仅可以测试模型响应的准确性，还可以测试模型的一致性、有效性和合理性，从而更加了解其行为。虽然问题是自动生成的，但他们基于自然语言的众包场景图，使得问题具有语法性、多样性和惯用性。

为鼓励人们尝试使用GQA数据集，我们将从2019年2月开始举办比赛，期望GQA能够成为更强大、更有说服力的推理模型的研究基石，并助力于推进场景理解和视觉问答的领域。

【论文完整版下载】

请关注专知公众号（点击上方蓝色专知关注）

后台回复“GQASTF”就可以获取数据集介绍完整版的下载链接~

专知2019年《深度学习：算法到实战》精品课程，欢迎扫码报名学习！

原文链接：

https://cs.stanford.edu/people/dorarad/gqa/index.html

附数据集介绍PDF：

-END-

专 · 知

专知《深度学习:算法到实战》课程全部完成！460+位同学在学习，现在报名，限时优惠！网易云课堂人工智能畅销榜首位！

请加专知小助手微信（扫一扫如下二维码添加），咨询《深度学习:算法到实战》参团限时优惠报名~

欢迎微信扫一扫加入专知人工智能知识星球群，获取专业知识教程视频资料和与专家交流咨询！

请PC登录www.zhuanzhi.ai或者点击阅读原文，注册登录专知，获取更多AI知识资料！

点击“阅读原文”，了解报名专知《深度学习:算法到实战》课程

登录查看更多

23

相关内容

视觉推理

【ACL2020-密歇根州立大学】语言和视觉推理的跨模态关联

【ACL2020-密歇根州立大学】语言和视觉推理的跨模态关联

专知会员服务

57+阅读 · 2020年5月14日

【CVPR2020】视觉推理-可微自适应计算时间

【CVPR2020】视觉推理-可微自适应计算时间

专知会员服务

13+阅读 · 2020年4月28日

【IJCAI2020-CMU】结构注意力的神经抽象摘要

【IJCAI2020-CMU】结构注意力的神经抽象摘要

专知会员服务

22+阅读 · 2020年4月23日

近期必读的5篇顶会WWW 2020【知识图谱+图神经网络（KG+GNN）】相关论文

近期必读的5篇顶会WWW 2020【知识图谱+图神经网络（KG+GNN）】相关论文

专知会员服务

151+阅读 · 2020年4月21日

重磅！Geoffrey Hinton新论文「视觉表示对比学习简单框架」自监督学习建立新SOTA-ImageNet准确率76.5%

重磅！Geoffrey Hinton新论文「视觉表示对比学习简单框架」自监督学习建立新SOTA-ImageNet准确率76.5%

专知会员服务

33+阅读 · 2020年2月15日

多模态多任务学习新论文

多模态多任务学习新论文

专知

46+阅读 · 2019年2月9日

上海交大发布：《中国人工智能医疗白皮书》-附207页PDF

上海交大发布：《中国人工智能医疗白皮书》-附207页PDF

专知

23+阅读 · 2019年1月29日

新任务&数据集：视觉常识推理(VCR)

新任务&数据集：视觉常识推理(VCR)

专知

50+阅读 · 2018年12月1日

火锅 QA? 斯坦福又双叒提出了一个新 QA 数据集HotpotQA，面向自然和多跳问答！

火锅 QA? 斯坦福又双叒提出了一个新 QA 数据集HotpotQA，面向自然和多跳问答！

专知

29+阅读 · 2018年9月27日

CoQA！斯坦福召开新一轮QA比赛，剑指对话问答！

CoQA！斯坦福召开新一轮QA比赛，剑指对话问答！

专知

6+阅读 · 2018年8月23日

GQA: A New Dataset for Real-World Visual Reasoning and Compositional Question Answering

Arxiv

3+阅读 · 2019年5月10日

A BERT Baseline for the Natural Questions

Arxiv

8+阅读 · 2019年3月21日

Multi-Instance Learning for End-to-End Knowledge Base Question Answering

Multi-Instance Learning for End-to-End Knowledge Base Question Answering

Arxiv

4+阅读 · 2019年3月6日

Improving Question Answering by Commonsense-Based Pre-Training

Arxiv

5+阅读 · 2018年10月5日

CoQA: A Conversational Question Answering Challenge

CoQA: A Conversational Question Answering Challenge

Arxiv

7+阅读 · 2018年8月21日

VIP会员

相关主题

ImageNet (数据集)

相关VIP内容

【ACL2020-密歇根州立大学】语言和视觉推理的跨模态关联

【ACL2020-密歇根州立大学】语言和视觉推理的跨模态关联

专知会员服务

57+阅读 · 2020年5月14日

【CVPR2020】视觉推理-可微自适应计算时间

【CVPR2020】视觉推理-可微自适应计算时间

专知会员服务

13+阅读 · 2020年4月28日

【IJCAI2020-CMU】结构注意力的神经抽象摘要

【IJCAI2020-CMU】结构注意力的神经抽象摘要

专知会员服务

22+阅读 · 2020年4月23日

近期必读的5篇顶会WWW 2020【知识图谱+图神经网络（KG+GNN）】相关论文

近期必读的5篇顶会WWW 2020【知识图谱+图神经网络（KG+GNN）】相关论文

专知会员服务

151+阅读 · 2020年4月21日

重磅！Geoffrey Hinton新论文「视觉表示对比学习简单框架」自监督学习建立新SOTA-ImageNet准确率76.5%

重磅！Geoffrey Hinton新论文「视觉表示对比学习简单框架」自监督学习建立新SOTA-ImageNet准确率76.5%

专知会员服务

33+阅读 · 2020年2月15日

热门VIP内容

开通专知VIP会员享更多权益服务

大模型推理时代的知识编辑

《利用人工智能对军事行动进行建模》

【MIT博士论文】加速科学发现的因果建模实践算法

机器人、无人机与实时影像：应对城市爆炸威胁的三大技术方案

相关资讯

多模态多任务学习新论文

多模态多任务学习新论文

专知

46+阅读 · 2019年2月9日

上海交大发布：《中国人工智能医疗白皮书》-附207页PDF

上海交大发布：《中国人工智能医疗白皮书》-附207页PDF

专知

23+阅读 · 2019年1月29日

新任务&数据集：视觉常识推理(VCR)

新任务&数据集：视觉常识推理(VCR)

专知

50+阅读 · 2018年12月1日

火锅 QA? 斯坦福又双叒提出了一个新 QA 数据集HotpotQA，面向自然和多跳问答！

火锅 QA? 斯坦福又双叒提出了一个新 QA 数据集HotpotQA，面向自然和多跳问答！

专知

29+阅读 · 2018年9月27日

CoQA！斯坦福召开新一轮QA比赛，剑指对话问答！

CoQA！斯坦福召开新一轮QA比赛，剑指对话问答！

专知

6+阅读 · 2018年8月23日

相关论文

GQA: A New Dataset for Real-World Visual Reasoning and Compositional Question Answering

Arxiv

3+阅读 · 2019年5月10日

A BERT Baseline for the Natural Questions

Arxiv

8+阅读 · 2019年3月21日

Multi-Instance Learning for End-to-End Knowledge Base Question Answering

Multi-Instance Learning for End-to-End Knowledge Base Question Answering

Arxiv

4+阅读 · 2019年3月6日

Improving Question Answering by Commonsense-Based Pre-Training

Arxiv

5+阅读 · 2018年10月5日

CoQA: A Conversational Question Answering Challenge

CoQA: A Conversational Question Answering Challenge

Arxiv

7+阅读 · 2018年8月21日

大家都在搜

大型语言模型

蓝牙安全攻防

朱克爱德华兹家族

模型压缩 | 知识蒸馏经典解读

微信扫码咨询专知VIP会员