【CVPR2021】基于反事实推断的视觉问答框架

2021 年 3 月 4 日 专知

论文题目:Counterfactual VQA: A Cause-Effect Look at Language Bias

作者:牛玉磊,汤凯华,张含望,卢志武,华先胜,文继荣


论文概述:近期研究发现,视觉问答模型在训练过程中会倾向于探索数据中的语言偏差,并依赖语言偏差进行推理和作答。这一倾向使得视觉问答模型未能充分地从视觉和语言两个模态中学习多模态知识,进而做出错误的回答。本文研究如何将视觉问答任务中的语言偏差进行捕获并去除。本文从因果推理的视角出发,提出了一种全新的基于反事实推断的视觉问答框架。反事实推断框架将语言偏差建模为问题对答案的直接因果效应,并通过从总体因果效应中减去语言的直接效应的方式去除语言偏差。实验证明反事实推断框架能够有效地克服语言偏差的影响,并具有良好的泛化性和鲁棒性。此外,本文从因果推理的角度为部分相关工作提供了理论解释。


https://www.zhuanzhi.ai/paper/f473e5b1a4c67df978867288e72d73f6



专知便捷查看

便捷下载,请关注专知公众号(点击上方蓝色专知关注)

  • 后台回复“CVQA” 就可以获取【CVPR2021】基于反事实推断的视觉问答框架》专知下载链接

专知,专业可信的人工智能知识分发,让认知协作更快更好!欢迎注册登录专知www.zhuanzhi.ai,获取5000+AI主题干货知识资料!
欢迎微信扫一扫加入专知人工智能知识星球群,获取最新AI专业干货知识教程资料和与专家交流咨询
点击“ 阅读原文 ”,了解使用 专知 ,查看获取5000+AI主题知识资源
登录查看更多
38

相关内容

专知会员服务
20+阅读 · 2021年5月4日
专知会员服务
17+阅读 · 2021年4月27日
【CVPR2021】基于端到端预训练的视觉-语言表征学习
专知会员服务
38+阅读 · 2021年4月9日
【CVPR2021】现实世界域泛化的自适应方法
专知会员服务
56+阅读 · 2021年3月31日
【CVPR2021】神经网络中的知识演化
专知会员服务
25+阅读 · 2021年3月11日
专知会员服务
22+阅读 · 2021年3月9日
【CVPR2021】自监督几何感知
专知会员服务
46+阅读 · 2021年3月6日
知识驱动的视觉知识学习,以VQA视觉问答为例,31页ppt
专知会员服务
36+阅读 · 2020年9月25日
【KDD2020】复杂异构网络中的高阶聚类
专知
8+阅读 · 2020年8月27日
【KDD2020-阿里】可调控的多兴趣推荐框架
专知
9+阅读 · 2020年8月11日
联邦学习安全与隐私保护研究综述
专知
12+阅读 · 2020年8月7日
【ICML2020】小样本目标检测
专知
7+阅读 · 2020年6月2日
新任务&数据集:视觉常识推理(VCR)
专知
50+阅读 · 2018年12月1日
Generating Rationales in Visual Question Answering
Arxiv
5+阅读 · 2020年4月4日
Arxiv
5+阅读 · 2018年3月16日
Arxiv
9+阅读 · 2016年10月27日
VIP会员
相关VIP内容
专知会员服务
20+阅读 · 2021年5月4日
专知会员服务
17+阅读 · 2021年4月27日
【CVPR2021】基于端到端预训练的视觉-语言表征学习
专知会员服务
38+阅读 · 2021年4月9日
【CVPR2021】现实世界域泛化的自适应方法
专知会员服务
56+阅读 · 2021年3月31日
【CVPR2021】神经网络中的知识演化
专知会员服务
25+阅读 · 2021年3月11日
专知会员服务
22+阅读 · 2021年3月9日
【CVPR2021】自监督几何感知
专知会员服务
46+阅读 · 2021年3月6日
知识驱动的视觉知识学习,以VQA视觉问答为例,31页ppt
专知会员服务
36+阅读 · 2020年9月25日
Top
微信扫码咨询专知VIP会员