Accurately answering a question about a given image requires combining observations with general knowledge. While this is effortless for humans, reasoning with general knowledge remains an algorithmic challenge. To advance research in this direction a novel `fact-based' visual question answering (FVQA) task has been introduced recently along with a large set of curated facts which link two entities, i.e., two possible answers, via a relation. Given a question-image pair, deep network techniques have been employed to successively reduce the large set of facts until one of the two entities of the final remaining fact is predicted as the answer. We observe that a successive process which considers one fact at a time to form a local decision is sub-optimal. Instead, we develop an entity graph and use a graph convolutional network to `reason' about the correct answer by jointly considering all entities. We show on the challenging FVQA dataset that this leads to an improvement in accuracy of around 7% compared to the state of the art.


翻译:准确回答关于特定图像的问题需要结合观察和一般知识。 虽然对于人类来说,这是毫无努力的,但一般知识的推理仍然是一个算法挑战。为了推进这方面的研究,最近提出了一个新的“基于事实”的视觉问题回答(FVQA)任务,同时提出了大量经过分析的事实,将两个实体联系起来,即通过关系,两个可能的答案。鉴于一个问题-图像对,深网络技术被用来连续减少大量事实,直到最后最后两个实体中的一个被预测为答案。我们观察到,一个在时间考虑一个事实以形成当地决定的连续过程是次最佳的。相反,我们开发了一个实体图,并使用一个图形革命网络,通过共同考虑所有实体来“推理”正确答案。我们用具有挑战性的FVQA数据集显示,这导致比艺术状态的准确率提高约7%。

5
下载
关闭预览

相关内容

因果图,Causal Graphs,52页ppt
专知会员服务
246+阅读 · 2020年4月19日
[综述]深度学习下的场景文本检测与识别
专知会员服务
77+阅读 · 2019年10月10日
Transferring Knowledge across Learning Processes
CreateAMind
27+阅读 · 2019年5月18日
A Technical Overview of AI & ML in 2018 & Trends for 2019
待字闺中
16+阅读 · 2018年12月24日
Capsule Networks解析
机器学习研究会
11+阅读 · 2017年11月12日
【推荐】YOLO实时目标检测(6fps)
机器学习研究会
20+阅读 · 2017年11月5日
Arxiv
3+阅读 · 2018年11月29日
Arxiv
3+阅读 · 2018年3月29日
Arxiv
9+阅读 · 2016年10月27日
VIP会员
相关资讯
Transferring Knowledge across Learning Processes
CreateAMind
27+阅读 · 2019年5月18日
A Technical Overview of AI & ML in 2018 & Trends for 2019
待字闺中
16+阅读 · 2018年12月24日
Capsule Networks解析
机器学习研究会
11+阅读 · 2017年11月12日
【推荐】YOLO实时目标检测(6fps)
机器学习研究会
20+阅读 · 2017年11月5日
Top
微信扫码咨询专知VIP会员