视觉问答最新内容 - 专知

会员服务 ·

视觉问答

视觉问答（Visual Question Answering，VQA），是一种涉及计算机视觉和自然语言处理的学习任务。这一任务的定义如下： A VQA system takes as input an image and a free-form, open-ended, natural-language question about the image and produces a natural-language answer as the output[1]。翻译为中文：一个VQA系统以一张图片和一个关于这张图片形式自由、开放式的自然语言问题作为输入，以生成一条自然语言答案作为输出。简单来说，VQA就是给定的图片进行问答。

CIKM2022 | ChiQA-一个基于20万个真实用户问题的图片问答数据集

CIKM2022 | ChiQA-一个基于20万个真实用户问题的图片问答数据集

机器之心

2+阅读 · 2022年11月7日

语言偏见不是唯一的捷径：视觉问答的捷径学习数据集

语言偏见不是唯一的捷径：视觉问答的捷径学习数据集

PaperWeekly

3+阅读 · 2022年11月3日

AAAI 2022 | MAVEx—基于知识的视觉问答方法

AAAI 2022 | MAVEx—基于知识的视觉问答方法

PaperWeekly

3+阅读 · 2022年10月8日

IJCAI 2022 | 使用陈述句进行视觉问答的Prompt Tuning

IJCAI 2022 | 使用陈述句进行视觉问答的Prompt Tuning

PaperWeekly

3+阅读 · 2022年9月21日

ICML 2022 | 字节提出首个用于评测预训练视觉语言模型真正泛化能力的基准评测平台 VLUE

ICML 2022 | 字节提出首个用于评测预训练视觉语言模型真正泛化能力的基准评测平台 VLUE

PaperWeekly

0+阅读 · 2022年8月7日

【NUS博士论文】学习视觉场景的结构化表示，137页pdf

【NUS博士论文】学习视觉场景的结构化表示，137页pdf

专知

6+阅读 · 2022年7月15日

CVPR 2022：字节跳动多项竞赛夺冠，发力无障碍技术创新

CVPR 2022：字节跳动多项竞赛夺冠，发力无障碍技术创新

新智元

3+阅读 · 2022年7月7日

【2022新书】视觉问答 (VQA)：从理论到应用

【2022新书】视觉问答 (VQA)：从理论到应用

专知

7+阅读 · 2022年5月24日

超50篇论文串联起从VQA到多模态预训练大模型的前世今生—Part 2

超50篇论文串联起从VQA到多模态预训练大模型的前世今生—Part 2

PaperWeekly

13+阅读 · 2022年5月21日

超50篇论文串联起从VQA到多模态预训练大模型的前世今生—Part 1

超50篇论文串联起从VQA到多模态预训练大模型的前世今生—Part 1

PaperWeekly

16+阅读 · 2022年4月29日

CVPR 2022 Oral | 开源9288个视频数据集，人大高瓴人工智能学院让AI学会了听音乐

CVPR 2022 Oral | 开源9288个视频数据集，人大高瓴人工智能学院让AI学会了听音乐

极市平台

1+阅读 · 2022年4月18日

CVPR 2022 Oral | 人大高瓴人工智能学院让AI学会了听音乐，还开源9288个视频数据集

CVPR 2022 Oral | 人大高瓴人工智能学院让AI学会了听音乐，还开源9288个视频数据集

机器之心

0+阅读 · 2022年4月18日

CVPR 2022 Oral | 人大高瓴AI学院提出：面向动态视音场景的问答学习机制

CVPR 2022 Oral | 人大高瓴AI学院提出：面向动态视音场景的问答学习机制

CVer

0+阅读 · 2022年4月17日

CVPR2022 Oral | AI学会“欣赏”音乐会，还get了推理技能，来自人大高瓴AI学院

CVPR2022 Oral | AI学会“欣赏”音乐会，还get了推理技能，来自人大高瓴AI学院

量子位

0+阅读 · 2022年4月13日

万字深度好文！视觉-语言（VL）智能：任务、表征学习和大型模型

万字深度好文！视觉-语言（VL）智能：任务、表征学习和大型模型

大数据文摘

3+阅读 · 2022年3月31日

参考链接

微信扫码咨询专知VIP会员