【NeurIPS2022】VICRegL:局部视觉特征的自监督学习 - 专知

会员服务 ·

0

【NeurIPS2022】VICRegL:局部视觉特征的自监督学习

2022 年 10 月 6 日 专知

大多数最近的学习图像表示的自监督方法集中于生成具有不变性的全局特征或生成一组局部特征。前者最适合于分类任务，后者最适合于检测和分割任务。本文探讨了学习局部特征和全局特征之间的基本权衡。提出了一种新的VICRegL方法，该方法同时学习良好的全局和局部特征，在保持良好的分类任务性能的同时，在检测和分割任务上取得了优异的性能。具体地说，一个标准卷积网结构的两个相同的分支被提供相同图像的两个不同的扭曲版本。VICReg准则应用于全局特征向量对。同时，VICReg准则应用于出现在最后一个池化层之前的局部特征向量对。如果两个局部特征向量的l2距离小于阈值，或者它们的相对位置与两个输入图像之间的已知几何变换相一致，则它们会相互吸引。我们在线性分类和分割转移任务上展示了强大的性能。代码和经过预先训练的模型可以在https://github.com/facebookresearch/VICRegL上公开获取。

专知便捷查看

便捷下载，请关注专知公众号（点击上方蓝色专知关注）

后台回复“VICR” 就可以获取《【NeurIPS2022】VICRegL:局部视觉特征的自监督学习》专知下载链接

专知，专业可信的人工智能知识分发 ，让认知协作更快更好！欢迎注册登录专知www.zhuanzhi.ai，获取100000+AI(AI与军事、医药、公安等)主题干货知识资料！

欢迎微信扫一扫加入专知人工智能知识星球群，获取最新AI专业干货知识教程资料和与专家交流咨询！

点击“ 阅读原文 ”，了解使用专知 ，查看获取100000+AI主题知识资料

登录查看更多

0

相关内容

VICRegL

【NeurIPS2022】扩散视觉反事实解释

【NeurIPS2022】扩散视觉反事实解释

专知会员服务

24+阅读 · 2022年10月24日

【NeurIPS2022】基于最大熵编码的自监督学习

【NeurIPS2022】基于最大熵编码的自监督学习

专知会员服务

27+阅读 · 2022年10月23日

【伯克利博士论文】学习在动态环境中泛化，103页pdf

【伯克利博士论文】学习在动态环境中泛化，103页pdf

专知会员服务

72+阅读 · 2022年10月12日

【AAAI2022】用于在线视频实例分割的混合实例觉知时序融合方法

【AAAI2022】用于在线视频实例分割的混合实例觉知时序融合方法

专知会员服务

12+阅读 · 2022年1月29日

【NeurIPS2021】用于视频分割的密集无监督学习

【NeurIPS2021】用于视频分割的密集无监督学习

专知会员服务

15+阅读 · 2021年11月14日

【NeurIPS2021】利用领域特定特征来增强领域泛化

专知会员服务

26+阅读 · 2021年10月20日

【ICML2021】全局鲁棒神经网络

专知会员服务

22+阅读 · 2021年8月26日

【NeurIPS2020】针对弱监督目标检测的综合注意力自蒸馏

【NeurIPS2020】针对弱监督目标检测的综合注意力自蒸馏

专知会员服务

32+阅读 · 2020年11月12日

【NeurIPS2020】图神经网络中的池化再思考

【NeurIPS2020】图神经网络中的池化再思考

专知会员服务

52+阅读 · 2020年10月25日

【NeurIPS2020】无限可能的联合对比学习

专知会员服务

29+阅读 · 2020年10月2日

【NeurIPS2022】扩散视觉反事实解释

【NeurIPS2022】扩散视觉反事实解释

专知

0+阅读 · 2022年10月24日

【NeurIPS2022】基于最大熵编码的自监督学习

【NeurIPS2022】基于最大熵编码的自监督学习

专知

1+阅读 · 2022年10月23日

【NeurIPS2022】基于结构聚类的自监督异构图预训练

【NeurIPS2022】基于结构聚类的自监督异构图预训练

专知

1+阅读 · 2022年10月20日

【伯克利博士论文】学习在动态环境中泛化，103页pdf

【伯克利博士论文】学习在动态环境中泛化，103页pdf

专知

6+阅读 · 2022年10月12日

【ICML2022】基于自适应上下文池化的高效表示学习

【ICML2022】基于自适应上下文池化的高效表示学习

专知

0+阅读 · 2022年7月9日

【CVPR2022】DiRA:用于自监督医学图像分析的判别性、恢复性和对抗性学习

【CVPR2022】DiRA:用于自监督医学图像分析的判别性、恢复性和对抗性学习

专知

4+阅读 · 2022年4月26日

【AAAI2022】用于在线视频实例分割的混合实例觉知时序融合方法

【AAAI2022】用于在线视频实例分割的混合实例觉知时序融合方法

专知

1+阅读 · 2022年1月29日

【NeurIPS2021】用于视频分割的密集无监督学习

【NeurIPS2021】用于视频分割的密集无监督学习

专知

0+阅读 · 2021年11月14日

【NeurIPS2021】ResT:一个有效的视觉识别转换器

【NeurIPS2021】ResT:一个有效的视觉识别转换器

专知

0+阅读 · 2021年10月25日

【MIT】硬负样本的对比学习

【MIT】硬负样本的对比学习

专知

13+阅读 · 2020年10月15日

基于共性视觉特征与反馈机制的SAR图像目标检测方法研究

国家自然科学基金

3+阅读 · 2017年12月31日

知觉学习影响视觉刺激显著性的神经机制

国家自然科学基金

1+阅读 · 2015年12月31日

深度低秩的结构-纹理图像分割模型和算法研究

国家自然科学基金

0+阅读 · 2014年12月31日

运用排序和相似度学习进行基于区域的图像检索研究

国家自然科学基金

0+阅读 · 2012年12月31日

最小化图像描述子敏感度的大规模图像索引及检索方法

国家自然科学基金

0+阅读 · 2012年12月31日

基于视觉显著内容的图像半脆弱自恢复水印算法研究

国家自然科学基金

0+阅读 · 2012年12月31日

医学图像的高容量及鲁棒可逆水印的研究

国家自然科学基金

1+阅读 · 2012年12月31日

工作记忆对视知觉的功能性影响

国家自然科学基金

0+阅读 · 2012年12月31日

基于不变性知觉的双目视觉注意机制研究

国家自然科学基金

0+阅读 · 2009年12月31日

基于图域几何PDE与特征不变量的离散曲面处理

国家自然科学基金

0+阅读 · 2009年12月31日

ASiT: Audio Spectrogram vIsion Transformer for General Audio Representation

ASiT: Audio Spectrogram vIsion Transformer for General Audio Representation

Arxiv

0+阅读 · 2022年11月23日

Data Augmentation Vision Transformer for Fine-grained Image Classification

Arxiv

0+阅读 · 2022年11月23日

Teaching Structured Vision&Language Concepts to Vision&Language Models

Arxiv

0+阅读 · 2022年11月21日

Few-shot Learning with Noisy Labels

Arxiv

13+阅读 · 2022年4月12日

Cross-Domain Few-Shot Graph Classification

Arxiv

13+阅读 · 2022年1月20日

K-Net: Towards Unified Image Segmentation

Arxiv

12+阅读 · 2021年11月1日

Generalizing to Unseen Domains: A Survey on Domain Generalization

Arxiv

30+阅读 · 2021年3月10日

Machine Reading Comprehension: The Role of Contextualized Language Models and Beyond

Arxiv

15+阅读 · 2020年5月13日

Self-Supervised Learning For Few-Shot Image Classification

Self-Supervised Learning For Few-Shot Image Classification

Arxiv

19+阅读 · 2019年11月14日

How to Fine-Tune BERT for Text Classification?

How to Fine-Tune BERT for Text Classification?

Arxiv

13+阅读 · 2019年5月14日

VIP会员

相关主题

自监督学习

相关VIP内容

【NeurIPS2022】扩散视觉反事实解释

【NeurIPS2022】扩散视觉反事实解释

专知会员服务

24+阅读 · 2022年10月24日

【NeurIPS2022】基于最大熵编码的自监督学习

【NeurIPS2022】基于最大熵编码的自监督学习

专知会员服务

27+阅读 · 2022年10月23日

【伯克利博士论文】学习在动态环境中泛化，103页pdf

【伯克利博士论文】学习在动态环境中泛化，103页pdf

专知会员服务

72+阅读 · 2022年10月12日

【AAAI2022】用于在线视频实例分割的混合实例觉知时序融合方法

【AAAI2022】用于在线视频实例分割的混合实例觉知时序融合方法

专知会员服务

12+阅读 · 2022年1月29日

【NeurIPS2021】用于视频分割的密集无监督学习

【NeurIPS2021】用于视频分割的密集无监督学习

专知会员服务

15+阅读 · 2021年11月14日

【NeurIPS2021】利用领域特定特征来增强领域泛化

专知会员服务

26+阅读 · 2021年10月20日

【ICML2021】全局鲁棒神经网络

专知会员服务

22+阅读 · 2021年8月26日

【NeurIPS2020】针对弱监督目标检测的综合注意力自蒸馏

【NeurIPS2020】针对弱监督目标检测的综合注意力自蒸馏

专知会员服务

32+阅读 · 2020年11月12日

【NeurIPS2020】图神经网络中的池化再思考

【NeurIPS2020】图神经网络中的池化再思考

专知会员服务

52+阅读 · 2020年10月25日

【NeurIPS2020】无限可能的联合对比学习

专知会员服务

29+阅读 · 2020年10月2日

热门VIP内容

开通专知VIP会员享更多权益服务

【博士论文】扩展可扩展会话推荐的边界

别想太多：高效 R1 风格大型推理模型综述

【ACMMM2025】EvoVLMA: 进化式视觉-语言模型自适应

智能体网络：用AI智能体编织下一代网络

相关资讯

【NeurIPS2022】扩散视觉反事实解释

【NeurIPS2022】扩散视觉反事实解释

专知

0+阅读 · 2022年10月24日

【NeurIPS2022】基于最大熵编码的自监督学习

【NeurIPS2022】基于最大熵编码的自监督学习

专知

1+阅读 · 2022年10月23日

【NeurIPS2022】基于结构聚类的自监督异构图预训练

【NeurIPS2022】基于结构聚类的自监督异构图预训练

专知

1+阅读 · 2022年10月20日

【伯克利博士论文】学习在动态环境中泛化，103页pdf

【伯克利博士论文】学习在动态环境中泛化，103页pdf

专知

6+阅读 · 2022年10月12日

【ICML2022】基于自适应上下文池化的高效表示学习

【ICML2022】基于自适应上下文池化的高效表示学习

专知

0+阅读 · 2022年7月9日

【CVPR2022】DiRA:用于自监督医学图像分析的判别性、恢复性和对抗性学习

【CVPR2022】DiRA:用于自监督医学图像分析的判别性、恢复性和对抗性学习

专知

4+阅读 · 2022年4月26日

【AAAI2022】用于在线视频实例分割的混合实例觉知时序融合方法

【AAAI2022】用于在线视频实例分割的混合实例觉知时序融合方法

专知

1+阅读 · 2022年1月29日

【NeurIPS2021】用于视频分割的密集无监督学习

【NeurIPS2021】用于视频分割的密集无监督学习

专知

0+阅读 · 2021年11月14日

【NeurIPS2021】ResT:一个有效的视觉识别转换器

【NeurIPS2021】ResT:一个有效的视觉识别转换器

专知

0+阅读 · 2021年10月25日

【MIT】硬负样本的对比学习

【MIT】硬负样本的对比学习

专知

13+阅读 · 2020年10月15日

相关基金

基于共性视觉特征与反馈机制的SAR图像目标检测方法研究

国家自然科学基金

3+阅读 · 2017年12月31日

知觉学习影响视觉刺激显著性的神经机制

国家自然科学基金

1+阅读 · 2015年12月31日

深度低秩的结构-纹理图像分割模型和算法研究

国家自然科学基金

0+阅读 · 2014年12月31日

运用排序和相似度学习进行基于区域的图像检索研究

国家自然科学基金

0+阅读 · 2012年12月31日

最小化图像描述子敏感度的大规模图像索引及检索方法

国家自然科学基金

0+阅读 · 2012年12月31日

基于视觉显著内容的图像半脆弱自恢复水印算法研究

国家自然科学基金

0+阅读 · 2012年12月31日

医学图像的高容量及鲁棒可逆水印的研究

国家自然科学基金

1+阅读 · 2012年12月31日

工作记忆对视知觉的功能性影响

国家自然科学基金

0+阅读 · 2012年12月31日

基于不变性知觉的双目视觉注意机制研究

国家自然科学基金

0+阅读 · 2009年12月31日

基于图域几何PDE与特征不变量的离散曲面处理

国家自然科学基金

0+阅读 · 2009年12月31日

相关论文

ASiT: Audio Spectrogram vIsion Transformer for General Audio Representation

ASiT: Audio Spectrogram vIsion Transformer for General Audio Representation

Arxiv

0+阅读 · 2022年11月23日

Data Augmentation Vision Transformer for Fine-grained Image Classification

Arxiv

0+阅读 · 2022年11月23日

Teaching Structured Vision&Language Concepts to Vision&Language Models

Arxiv

0+阅读 · 2022年11月21日

Few-shot Learning with Noisy Labels

Arxiv

13+阅读 · 2022年4月12日

Cross-Domain Few-Shot Graph Classification

Arxiv

13+阅读 · 2022年1月20日

K-Net: Towards Unified Image Segmentation

Arxiv

12+阅读 · 2021年11月1日

Generalizing to Unseen Domains: A Survey on Domain Generalization

Arxiv

30+阅读 · 2021年3月10日

Machine Reading Comprehension: The Role of Contextualized Language Models and Beyond

Arxiv

15+阅读 · 2020年5月13日

Self-Supervised Learning For Few-Shot Image Classification

Self-Supervised Learning For Few-Shot Image Classification

Arxiv

19+阅读 · 2019年11月14日

How to Fine-Tune BERT for Text Classification?

How to Fine-Tune BERT for Text Classification?

Arxiv

13+阅读 · 2019年5月14日

大家都在搜

大型语言模型

软件无线电

国防科技创新

无人机航拍交通事故现场勘查处置系统——行业第一的警用事故处理软件

微信扫码咨询专知VIP会员