【2022新书】视觉问答 (VQA)：从理论到应用

2022 年 5 月 24 日 专知

视觉问答(Visual Question answer, VQA)通常是将图像、视频等视觉输入与与输入相关的自然语言问题结合起来，生成一个自然语言答案作为输出。这本质上是一个多学科的研究问题，涉及计算机视觉(CV)、自然语言处理(NLP)、知识表示与推理(KR)等。

此外，VQA必须克服一般图像理解和问答任务的挑战，以及使用混合质量输入的大规模数据库所带来的困难。然而，随着深度学习(DL)的出现，在CV和NLP中先进技术的存在以及相关大规模数据集的可用性的驱动下，我们最近看到了VQA方面的巨大进步，出现了更多的系统和有前景的结果。

这本书提供了VQA的全面概述，包括基本理论，模型，数据集，和有前途的未来方向。考虑到它的范围，它可以作为一本关于计算机视觉和自然语言处理的教科书，特别是对于研究人员和学生在视觉问题回答领域。它还强调了VQA中使用的关键模型。

https://link.springer.com/book/10.1007/978-981-19-0964-1

专知便捷查看

便捷下载，请关注专知公众号（点击上方蓝色专知关注）

后台回复“VQAB” 就可以获取《【2022新书】视觉问答 (VQA)：从理论到应用》专知下载链接

专知，专业可信的人工智能知识分发 ，让认知协作更快更好！欢迎注册登录专知www.zhuanzhi.ai，获取70000+AI(AI与军事、医药、公安等)主题干货知识资料！

欢迎微信扫一扫加入专知人工智能知识星球群，获取最新AI专业干货知识教程资料和与专家交流咨询！

点击“ 阅读原文 ”，了解使用专知 ，查看获取70000+AI主题知识资料

登录查看更多

知识荟萃

精品入门和进阶教程、论文和代码整理等

查看相关VIP内容、论文、资讯等

【2022新书】知识表示和机器学习的预测和分析，232页pdf，Prediction and Analysis for Knowledge Representation and Machine Learning

专知会员服务

120+阅读 · 2022年3月11日

【2021干货书】人工智能的挑战:从机器学习和计算机视觉到情感智能，241页pdf

专知会员服务

81+阅读 · 2022年1月21日

【2021新书】深度学习计算机视觉，320页pdf

专知会员服务

194+阅读 · 2021年5月20日

【干货书】面向机器学习的自然语言标注，341页pdf

专知会员服务

68+阅读 · 2021年2月7日

知识驱动的视觉知识学习，以VQA视觉问答为例，31页ppt

专知会员服务

36+阅读 · 2020年9月25日

【2022新书】机器学习中的概率数值计算，412页pdf

专知

32+阅读 · 2022年7月7日

【2022新书】知识表示和机器学习的预测和分析，232页pdf

专知

41+阅读 · 2022年3月12日

【2022干货书】人工智能的挑战:从机器学习和计算机视觉到情感智能，241页pdf

专知

5+阅读 · 2022年1月21日

机器学习必读新书-《凸优化算法原理详解》，334页pdf

专知

10+阅读 · 2022年1月4日

【2020新书】《金融机器学习：从理论到实践》，附565页pdf与随书代码

专知

40+阅读 · 2020年12月15日

图的边覆盖染色

国家自然科学基金

1+阅读 · 2014年12月31日

非线性反馈移位寄存器序列子簇的研究

国家自然科学基金

0+阅读 · 2012年12月31日

覆盖粗糙集的抽象结构及其应用

国家自然科学基金

0+阅读 · 2011年12月31日

覆盖决策信息系统理论及其在复杂系统决策中的应用

国家自然科学基金

1+阅读 · 2011年12月31日

超协调缺省逻辑及其应用

国家自然科学基金

0+阅读 · 2009年12月31日

Uncertainty-based Visual Question Answering: Estimating Semantic Inconsistency between Image and Knowledge Base

Arxiv

0+阅读 · 2022年7月27日

LayoutLM: Pre-training of Text and Layout for Document Image Understanding

Arxiv

12+阅读 · 2020年2月19日

Improving Knowledge-aware Dialogue Generation via Knowledge Base Question Answering

Arxiv

16+阅读 · 2019年12月16日

Learning Conceptual-Contexual Embeddings for Medical Text

Arxiv

27+阅读 · 2019年8月16日

Bottom-Up and Top-Down Attention for Image Captioning and Visual Question Answering

Arxiv

14+阅读 · 2018年3月14日

VIP会员

【2022新书】视觉问答 (VQA)：从理论到应用

相关内容

知识荟萃

更多