【CVPR2021】一种基于知识蒸馏的弱监督图像文本匹配模型

一种基于知识蒸馏的弱监督图像文本匹配模型

Improving Weakly Supervised Visual Grounding by Contrastive Knowledge Distillation

本文由腾讯 AI Lab 主导完成。弱监督的图像文本匹配旨在学习仅使用图像句子的对应来得到细颗粒度的图像区域和短语的对应. 因此，主要的挑战在于训练期间图像区域和句子短语之间缺少匹配的数据。

为了应对这一挑战，我们在训练时利用了通用的物体检测器知识蒸馏，并提出了利用对比学习来得到图像和文本细颗粒度匹配的新方法。我们的方法在弱监督的视觉区域和短语匹配任务上超越了以前的方法。

https://www.zhuanzhi.ai/paper/d59e9b614122852f5a78b38a14d43921

成为VIP会员查看完整内容

相关内容

知识蒸馏

关注 22

【CVPR2021】基于跨领域自适应聚类的半监督领域自适应算法

专知会员服务

58+阅读 · 2021年5月19日

【CVPR2021】密集对比学习的自监督视觉预训练

专知会员服务

39+阅读 · 2021年5月16日

【CVPR2021】基于特征解构与重构学习的人脸表情识别

专知会员服务

44+阅读 · 2021年4月18日

【CVPR2021】基于Transformer的视频分割领域

专知会员服务

38+阅读 · 2021年4月16日

【CVPR2021】基于端到端预训练的视觉-语言表征学习

专知会员服务

38+阅读 · 2021年4月9日

CVPR2021-单目实时全身捕捉的方法

专知会员服务

20+阅读 · 2021年3月18日

【CVPR2021】细粒度多标签分类

专知会员服务

61+阅读 · 2021年3月8日

【CVPR2021】自监督几何感知

专知会员服务

46+阅读 · 2021年3月6日

【ECCV2020】通过最小化逆动力学分歧来实现从观察中模仿学习

专知会员服务

15+阅读 · 2020年9月6日

【CVPR2020】跨模态哈希的无监督知识蒸馏

专知会员服务

61+阅读 · 2020年6月25日

【CVPR2021】细粒度多标签分类

专知

44+阅读 · 2021年3月8日

【CVPR2021】半监督迁移学习的自适应一致性正则化

专知

41+阅读 · 2021年3月7日

【AAAI2021】自监督对应学习的对比转换

专知

12+阅读 · 2020年12月11日

83.7 mIoU！北大提出：通过解耦的主体和边缘监督改进语义分割 | ECCV 2020

CVer

7+阅读 · 2020年7月23日

四大指标超现有模型！少样本的无监督图像翻译效果逆天| 技术头条

AI100

6+阅读 · 2019年5月13日

性能优越！李飞飞团队首次提出一种补全视觉信息库的半监督方法

AI前线

6+阅读 · 2019年5月11日

CVPR 2019 | 无监督领域特定单图像去模糊

PaperWeekly

14+阅读 · 2019年3月20日

通过时空模型迁移学习的无监督的跨数据集行人重新识别

统计学习与视觉计算组

8+阅读 · 2018年10月23日

CVPR 2018 | 伯克利等提出无监督特征学习新方法，代码已开源

AI前线

12+阅读 · 2018年5月13日

香港中大-商汤科技联合实验室AAAI录用论文详解：自监督语义分割的混合与匹配调节

商汤科技

3+阅读 · 2018年2月26日

Language-Driven Image Style Transfer

Arxiv

0+阅读 · 2021年6月1日

Product Progression: a machine learning approach to forecasting industrial upgrading

Arxiv

0+阅读 · 2021年5月31日

SiT: Self-supervised vIsion Transformer

Arxiv

19+阅读 · 2021年4月8日

Self-supervised pre-training and contrastive representation learning for multiple-choice video QA

Arxiv

5+阅读 · 2020年12月14日

Improving Weakly Supervised Visual Grounding by Contrastive Knowledge Distillation

Arxiv

13+阅读 · 2020年7月3日

Self-Supervised Learning For Few-Shot Image Classification

Arxiv

19+阅读 · 2019年11月14日

S$^\mathbf{4}$L: Self-Supervised Semi-Supervised Learning

Arxiv

5+阅读 · 2019年5月9日

Improving Question Answering by Commonsense-Based Pre-Training

Arxiv

4+阅读 · 2019年3月1日

Multi-Stage Self-Supervised Learning for Graph Convolutional Networks

Arxiv

7+阅读 · 2019年2月28日

Learning Semantic Sentence Embeddings using Pair-wise Discriminator

Arxiv

6+阅读 · 2018年6月15日

VIP会员