微软旗下Maluuba推出看图问答数据集，想让AI看懂图表

2017 年 10 月 24 日 量子位 专注报道AI

安妮编译整理
量子位出品 | 公众号 QbitAI

科学图表能简洁地概括趋势、速率和比例等有价值的信息，让我们直观地了解概念。而机器对这种结构化视觉信息的理解能帮助我们从大量文献中提取信息。

这不，微软旗下的Maluuba对这事的研究有了新进展。

近日，Maluuba推出了一个用于推理的可视化数据集FigureQA，并将研究相关论文《FigureQA: An Annotated Figure Dataset for Visual Reasoning》发布在ArXiv上。量子位挑其重点编译整理，与大家分享。

数据集简介

在关系推理最新研究的启发下，研究人员推出了FigureQA数据集，其中包含了基于10多张图表的100多万对问答，用于研究机器理解和推理方面的问题。

FigureQA数据集中有五种常见的图表模型，这些图表能显示连续的和分类信息，分别为折线图、点图、垂直柱状图、水平条形图和饼图。而其中的问答对，会涉及到图表中元素一对一和一对多的关系，例如：X是中位数吗？X与Y相交吗？得出正确答案需要对多图表中的要素进行推理。

△ 数据集中包含的5种图表类型

数据集中的问题，共有15种类型，涉及到数值大小、最大值、最小值、中值、曲线下面积、平滑度和图像交叉点等信息。

△ FigureQA中包含的15类问题

问答集中问题均基于上述问题，答案统一为“是”或“否”。

△ 数据集以问答的形式呈现。Q：Medium Seafoam和Light Gold相交吗？A：是。Q：Medium Seafoam是否有最低值？A：否

微软团队在介绍论文中表示：“FigureQA是一个合成的数据集，类似视觉推理相关的CLEVR数据集。虽然数据没有真实环境中那么丰富，但能更大程度控制任务的复杂性，还支持辅助监管信号。此外，通过分析在FigureQA上训练的模型真实数据，还能扩展语料库处理弱项问题。”

制作过程

FigureQA数据集的生成制作分阶段进行。

首先，研究人员根据一组经过仔细调整的约束和启发式设计对数值数据进行采样，让使取样数据显得更自然。随后，研究人员用开源可视化库Bokeh绘制图表中的数据，得到定量数据。

此外，研究人员修改了所有图表的Bokeh后端输出的边界信息：包括数据点、坐标轴、坐标轴标签、标记和图注等信息。他们还提供了底层数值数据和一组边界数据作为每张图表的补充信息。

最后，研究人员平衡了每个问题答案中“是”和“否”的比例，这保证模型不会利用回答频率上的偏差来推断结果，而忽略视觉内容。

测试结果

在论文中，研究人员表示，FigureQA中测试集的准确率还达不到人类水平。接下来，研究人员计划测试在FigureQA上训练的模型在真实科学数据上的表现，并将数据集扩展到人类编写的自然语言问题上。FigureQA“官方”版的数据集可公开使用，是未来研究的基准。

△ 数据集与人类回答15种问题的准确性对比

研究人员还提供了生成脚本，它们配置容易，使用户能调整生成参数生成自己数据。

资料下载

FigureQA数据集已经可以下载了，可以移步Maluuba官网下载此数据集：

https://datasets.maluuba.com/FigureQA/dl

关于FigureQA的介绍我们可以在ArXiv上一探究竟：

https://arxiv.org/abs/1710.07300

祝你玩得愉快~

— 完 —

加入社群

量子位AI社群10群开始招募啦，欢迎对AI感兴趣的同学，加小助手微信qbitbot4入群；

此外，量子位专业细分群(自动驾驶、CV、NLP、机器学习等)正在招募，面向正在从事相关领域的工程师及研究人员。

进群请加小助手微信号qbitbot3，并务必备注相应群的关键词~通过审核后我们将邀请进群。（专业群审核较严，敬请谅解）

诚挚招聘

量子位正在招募编辑/记者，工作地点在北京中关村。期待有才气、有热情的同学加入我们！相关细节，请在量子位公众号(QbitAI)对话界面，回复“招聘”两个字。

量子位 QbitAI

վ'ᴗ' ի 追踪AI技术和产品新动态

登录查看更多

相关内容

Maluuba

关注 0

Maluuba

【翻译-ACL2020】使用知识库嵌入改进知识图上的多跳问答

专知会员服务

70+阅读 · 2020年7月3日

【MIT-ICML2020】图神经网络的泛化与表示的局限

专知会员服务

43+阅读 · 2020年6月23日

【微软】最新《异构网络表示学习》综述论文

专知会员服务

39+阅读 · 2020年6月7日

【ICML2020-哈佛】深度语言表示中可分流形

专知会员服务

13+阅读 · 2020年6月2日

经典书最新版《贝叶斯数据分析(第三版)》，677页pdf，哥伦比亚大学《Bayesian Data Analysis, 3ed》

专知会员服务

253+阅读 · 2020年4月5日

【CVPR2020-上海交大】自组织记忆模块来解决网络图片中的标签噪声和背景噪声

专知会员服务

28+阅读 · 2020年3月18日

如何构建多模态BERT? 这份UNC76页《LXMERT: 从Transformer学习跨模态编码表示》PPT告诉您，附论文代码

专知会员服务

85+阅读 · 2020年2月27日

必读的10篇 CVPR 2019【生成对抗网络】相关论文和代码

专知会员服务

33+阅读 · 2020年1月10日

【Google&Waymo】自动驾驶感知的可扩展性:Waymo开放数据集，23位学者联名出品

专知会员服务

13+阅读 · 2019年12月18日

【CCF优秀博士学位论文奖-2019初评】基于深度学习的场景分割技术研究，中科院计算所张蕊

专知会员服务

32+阅读 · 2019年11月8日

论文浅尝 | 一种用于多关系问答的可解释推理网络

开放知识图谱

18+阅读 · 2019年5月21日

动态 | 微软刷新CoQA对话问答挑战赛纪录，模型性能达到人类同等水平

AI研习社

4+阅读 · 2019年5月8日

微软机器阅读理解超越人类水平，CoQA数据集得分刷新记录

机器之心

5+阅读 · 2019年5月4日

【EMNLP2018】RecipeQA - 食谱多模态阅读理解数据集

专知

16+阅读 · 2018年9月8日

用机器学习预测谁将夺得世界杯冠军？附完整代码！

CSDN

4+阅读 · 2018年6月14日

ACL 2018 | 最佳短论文SQuAD 2.0：斯坦福大学发布的机器阅读理解问答数据集

机器之心

4+阅读 · 2018年6月13日

机器学习-我妈妈也能看懂的入门篇

深度学习世界

4+阅读 · 2018年5月16日

AI challenger发起零样本学习算法大赛，推出零样本数据集

量子位

4+阅读 · 2018年3月21日

手把手丨10分钟教你看懂K线图交易策略（附python绘图代码）

大数据文摘

8+阅读 · 2018年1月24日

哈佛用NBA比赛数据生成报道，评测各模型效果 | 数据集+论文+代码

深度学习世界

9+阅读 · 2017年7月28日

OK-VQA: A Visual Question Answering Benchmark Requiring External Knowledge

Arxiv

10+阅读 · 2019年9月4日

Neural Graph Collaborative Filtering

Arxiv

8+阅读 · 2019年5月20日

Factor Graph Attention

Arxiv

6+阅读 · 2019年4月11日

Multi-Instance Learning for End-to-End Knowledge Base Question Answering

Arxiv

4+阅读 · 2019年3月6日

Robustness Analysis of Visual QA Models by Basic Questions

Arxiv

4+阅读 · 2018年5月26日

Differential Attention for Visual Question Answering

Arxiv

5+阅读 · 2018年4月3日

The Web as a Knowledge-base for Answering Complex Questions

Arxiv

5+阅读 · 2018年3月18日

VizWiz Grand Challenge: Answering Visual Questions from Blind People

Arxiv

9+阅读 · 2018年2月22日

Complex Sequential Question Answering: Towards Learning to Converse Over Linked Question Answer Pairs with a Knowledge Graph

Arxiv

8+阅读 · 2018年1月31日

Benchmark Visual Question Answer Models by using Focus Map

Arxiv

9+阅读 · 2018年1月13日

VIP会员

微软旗下Maluuba推出看图问答数据集，想让AI看懂图表

安妮 编译整理量子位 出品 | 公众号 QbitAI

数据集简介

△ 数据集中包含的5种图表类型

△ FigureQA中包含的15类问题

△ 数据集以问答的形式呈现。Q：Medium Seafoam和Light Gold相交吗？A：是。Q：Medium Seafoam是否有最低值？A：否

制作过程

测试结果

△ 数据集与人类回答15种问题的准确性对比

资料下载

相关内容

安妮编译整理
量子位出品 | 公众号 QbitAI