【CVPR2022】UniVIP：自监督视觉预训练的统一框架 - 专知

会员服务 ·

0

【CVPR2022】UniVIP：自监督视觉预训练的统一框架

2022 年 3 月 16 日 专知

论文标题：UniVIP: A Unified Framework for Self-Supervised Visual Pre-training

论文链接：https://arxiv.org/abs/2203.06965

作者单位：中国科学院自动化研究所 & 商汤科技 & 南洋理工大学

自监督学习 (SSL) 有望利用大量未标记的数据。然而，流行的 SSL 方法的成功仅限于像 ImageNet 中的单中心对象图像，并且忽略了场景和实例之间的相关性，以及场景中实例的语义差异。为了解决上述问题，我们提出了统一自监督视觉预训练（UniVIP），这是一种新颖的自监督框架，用于在单中心对象或非标志性数据集上学习通用视觉表示。该框架考虑了三个层次的表示学习：1）场景-场景的相似性，2）场景-实例的相关性，3）实例的判别。在学习过程中，我们采用最优传输算法来自动测量实例的区分度。大量实验表明，在非标志性 COCO 上预训练的 UniVIP 在图像分类、半监督学习、对象检测和分割等各种下游任务上实现了最先进的传输性能。此外，我们的方法还可以利用 ImageNet 等单中心对象数据集，并且在线性探测中使用相同的预训练 epoch 时比 BYOL 高 2.5%，并且在 COCO 数据集上超越了当前的自监督对象检测方法，证明了它的普遍性和潜在性能。

专知便捷查看

便捷下载，请关注专知公众号（点击上方蓝色专知关注）

后台回复“UniVIP” 就可以获取《【CVPR2022】UniVIP：自监督视觉预训练的统一框架》专知下载链接

请扫码加入专知人工智能群（长按二维码），或者加专知小助手微信（zhuanzhi02），加入专知主题群（请备注主题类型：AI、NLP、CV、 KG、论文等）交流~

专知，专业可信的人工智能知识分发 ，让认知协作更快更好！欢迎注册登录专知www.zhuanzhi.ai，获取70000+AI主题干货知识资料！

欢迎微信扫一扫加入专知人工智能知识星球群，获取最新AI专业干货知识教程资料和与专家交流咨询！

点击“ 阅读原文 ”，了解使用专知 ，查看获取70000+AI主题知识资源

登录查看更多

1

相关内容

UniVIP

【CVPR2021】密集对比学习的自监督视觉预训练

专知会员服务

39+阅读 · 2021年5月16日

【CVPR2021】用于行人重识别的无监督多源域自适应

专知会员服务

21+阅读 · 2021年5月1日

【CVPR2021】无监督时空表示学习的大规模研究

专知会员服务

23+阅读 · 2021年5月1日

【CVPR2021】用于目标检测的通用实例蒸馏

【CVPR2021】用于目标检测的通用实例蒸馏

专知会员服务

24+阅读 · 2021年3月22日

【CVPR2021】空间一致性表示学习

专知会员服务

63+阅读 · 2021年3月12日

【CVPR2022】基于渐进自蒸馏的鲁棒跨模态表示学习

【CVPR2022】基于渐进自蒸馏的鲁棒跨模态表示学习

专知

4+阅读 · 2022年4月13日

【CVPR2022】ContrastMask:对比学习来分割各种

【CVPR2022】ContrastMask:对比学习来分割各种

专知

0+阅读 · 2022年3月21日

【CVPR2022】双曲图像分割

【CVPR2022】双曲图像分割

专知

2+阅读 · 2022年3月14日

【CVPR2021】基于Transformer的视频分割领域

【CVPR2021】基于Transformer的视频分割领域

专知

2+阅读 · 2021年4月16日

【CVPR2021】空间一致性表示学习

【CVPR2021】空间一致性表示学习

专知

0+阅读 · 2021年3月12日

两类噪声背景下的非局部图像去噪研究

国家自然科学基金

2+阅读 · 2014年12月31日

共形几何代数框架下时空拓扑关系的统一表达与计算方法研究

国家自然科学基金

0+阅读 · 2014年12月31日

弱监督在线学习方法及其在视觉目标跟踪中的应用

国家自然科学基金

4+阅读 · 2011年12月31日

数据集多尺度特征提取与表达的视觉凹度方法

国家自然科学基金

1+阅读 · 2011年12月31日

基于局部不变性特征流的相异场景密集匹配

国家自然科学基金

0+阅读 · 2011年12月31日

BLISS: Robust Sequence-to-Sequence Learning via Self-Supervised Input Representation

Arxiv

0+阅读 · 2022年4月16日

Nonlinear Reduced DNN Models for State Estimation

Arxiv

0+阅读 · 2022年4月16日

Deep Learning for Weakly-Supervised Object Detection and Object Localization: A Survey

Deep Learning for Weakly-Supervised Object Detection and Object Localization: A Survey

Arxiv

16+阅读 · 2021年5月26日

SiT: Self-supervised vIsion Transformer

Arxiv

19+阅读 · 2021年4月8日

Look-into-Object: Self-supervised Structure Modeling for Object Recognition

Look-into-Object: Self-supervised Structure Modeling for Object Recognition

Arxiv

15+阅读 · 2020年3月31日

VIP会员

相关主题

视觉预训练

相关VIP内容

【CVPR2021】密集对比学习的自监督视觉预训练

专知会员服务

39+阅读 · 2021年5月16日

【CVPR2021】用于行人重识别的无监督多源域自适应

专知会员服务

21+阅读 · 2021年5月1日

【CVPR2021】无监督时空表示学习的大规模研究

专知会员服务

23+阅读 · 2021年5月1日

【CVPR2021】用于目标检测的通用实例蒸馏

【CVPR2021】用于目标检测的通用实例蒸馏

专知会员服务

24+阅读 · 2021年3月22日

【CVPR2021】空间一致性表示学习

专知会员服务

63+阅读 · 2021年3月12日

热门VIP内容

开通专知VIP会员享更多权益服务

因果强化学习的统一框架：综述、分类体系、算法与应用

《无人机系统 - 反无人机系统：测试方法》364页

【MIT博士论文】语言模型的推理时学习算法

美军低成本无人作战攻击系统（LUCAS）：扩大无人机战争规模

相关资讯

【CVPR2022】基于渐进自蒸馏的鲁棒跨模态表示学习

【CVPR2022】基于渐进自蒸馏的鲁棒跨模态表示学习

专知

4+阅读 · 2022年4月13日

【CVPR2022】ContrastMask:对比学习来分割各种

【CVPR2022】ContrastMask:对比学习来分割各种

专知

0+阅读 · 2022年3月21日

【CVPR2022】双曲图像分割

【CVPR2022】双曲图像分割

专知

2+阅读 · 2022年3月14日

【CVPR2021】基于Transformer的视频分割领域

【CVPR2021】基于Transformer的视频分割领域

专知

2+阅读 · 2021年4月16日

【CVPR2021】空间一致性表示学习

【CVPR2021】空间一致性表示学习

专知

0+阅读 · 2021年3月12日

相关基金

两类噪声背景下的非局部图像去噪研究

国家自然科学基金

2+阅读 · 2014年12月31日

共形几何代数框架下时空拓扑关系的统一表达与计算方法研究

国家自然科学基金

0+阅读 · 2014年12月31日

弱监督在线学习方法及其在视觉目标跟踪中的应用

国家自然科学基金

4+阅读 · 2011年12月31日

数据集多尺度特征提取与表达的视觉凹度方法

国家自然科学基金

1+阅读 · 2011年12月31日

基于局部不变性特征流的相异场景密集匹配

国家自然科学基金

0+阅读 · 2011年12月31日

相关论文

BLISS: Robust Sequence-to-Sequence Learning via Self-Supervised Input Representation

Arxiv

0+阅读 · 2022年4月16日

Nonlinear Reduced DNN Models for State Estimation

Arxiv

0+阅读 · 2022年4月16日

Deep Learning for Weakly-Supervised Object Detection and Object Localization: A Survey

Deep Learning for Weakly-Supervised Object Detection and Object Localization: A Survey

Arxiv

16+阅读 · 2021年5月26日

SiT: Self-supervised vIsion Transformer

Arxiv

19+阅读 · 2021年4月8日

Look-into-Object: Self-supervised Structure Modeling for Object Recognition

Look-into-Object: Self-supervised Structure Modeling for Object Recognition

Arxiv

15+阅读 · 2020年3月31日

大家都在搜

大型语言模型

朱克爱德华兹家族

蓝牙安全攻防

从传统方法到深度学习—— bilateral filter 到 HDRNet的演进

微信扫码咨询专知VIP会员