视觉问答热门内容 - 专知

会员服务 ·

视觉问答

视觉问答（Visual Question Answering，VQA），是一种涉及计算机视觉和自然语言处理的学习任务。这一任务的定义如下： A VQA system takes as input an image and a free-form, open-ended, natural-language question about the image and produces a natural-language answer as the output[1]。翻译为中文：一个VQA系统以一张图片和一个关于这张图片形式自由、开放式的自然语言问题作为输入，以生成一条自然语言答案作为输出。简单来说，VQA就是给定的图片进行问答。

邓力、何晓冬深度解读：多模态智能未来的研究热点

邓力、何晓冬深度解读：多模态智能未来的研究热点

AI科技评论

2+阅读 · 2020年6月12日

VizWiz数据集：用计算机视觉回答盲人的问题

VizWiz数据集：用计算机视觉回答盲人的问题

论智

10+阅读 · 2018年2月26日

CVPR 2019 | 让机器帮你做行测题，UCLA朱松纯团队提出关系和类比视觉推理数据集RAVEN

CVPR 2019 | 让机器帮你做行测题，UCLA朱松纯团队提出关系和类比视觉推理数据集RAVEN

机器之心

0+阅读 · 2019年3月11日

CVPR 2018 | 逆视觉问答任务：一种根据回答与图像想问题的模型

CVPR 2018 | 逆视觉问答任务：一种根据回答与图像想问题的模型

全球人工智能

1+阅读 · 2018年6月21日

打包看 ——2018年图形图像论文

打包看 ——2018年图形图像论文

计算机研究与发展

0+阅读 · 2019年1月8日

大咖 | 香侬科技对话FB AI研究院首席科学家Devi Parikh：视觉问答数据集VQA的前世今生

大咖 | 香侬科技对话FB AI研究院首席科学家Devi Parikh：视觉问答数据集VQA的前世今生

大数据文摘

2+阅读 · 2018年8月23日

博客 | 总结+paper分享|对话系统中的自然语言生成技术（NLG）

博客 | 总结+paper分享|对话系统中的自然语言生成技术（NLG）

AI研习社

16+阅读 · 2018年12月4日

IJCAI 2022 | 使用陈述句进行视觉问答的Prompt Tuning

IJCAI 2022 | 使用陈述句进行视觉问答的Prompt Tuning

PaperWeekly

3+阅读 · 2022年9月21日

BERT新转变：面向视觉基础进行预训练！

BERT新转变：面向视觉基础进行预训练！

AI科技评论

1+阅读 · 2019年12月28日

双线性池化（Bilinear Pooling）详解、改进及应用

双线性池化（Bilinear Pooling）详解、改进及应用

极市平台

2+阅读 · 2020年1月7日

【笔记】双线性池化（Bilinear Pooling）详解、改进及应用

【笔记】双线性池化（Bilinear Pooling）详解、改进及应用

深度学习自然语言处理

6+阅读 · 2020年2月9日

超50篇论文串联起从VQA到多模态预训练大模型的前世今生—Part 1

超50篇论文串联起从VQA到多模态预训练大模型的前世今生—Part 1

PaperWeekly

15+阅读 · 2022年4月29日

还在熬夜憋思路？这12篇最新论文打包送给你 | 本周值得读

还在熬夜憋思路？这12篇最新论文打包送给你 | 本周值得读

PaperWeekly

10+阅读 · 2018年6月4日

一文纵览 Vision-and-Language 领域最新研究与进展

一文纵览 Vision-and-Language 领域最新研究与进展

AI科技评论

7+阅读 · 2019年5月14日

人工智能 | SCI期刊专刊信息5条

人工智能 | SCI期刊专刊信息5条

Call4Papers

2+阅读 · 2019年7月4日

参考链接

父主题

计算机视觉

微信扫码咨询专知VIP会员