【ICML2023】改善自监督Vision Transformers的视觉提示调优 - 专知VIP

会员服务 ·

19

ICML 2023 · Transformer · 提示学习 ·

2023 年 6 月 12 日

【ICML2023】改善自监督Vision Transformers的视觉提示调优

专知会员服务

专知，提供专业可信的知识分发服务，让认知协作更快更好！

视觉提示调优（VPT）是一种有效的调整方法，用于将预训练的Vision Transformers (ViTs)适应到下游任务。它利用额外的可学习的标记，称为提示，来引导冻结的预训练的ViTs。尽管VPT已经证明了其在监督视觉变换器中的应用性，但在自我监督的视觉变换器中常常表现不佳。通过实证观察，我们推断出VPT的有效性在很大程度上取决于提示标记与之交互的ViT块。具体来说，当提示标记插入到后面的块而不是第一个块时，VPT在图像分类任务中的性能有所提高，例如MAE和MoCo v3。这些观察表明，存在一个插入提示标记的块的最优位置。不幸的是，确定每个自我监督ViT中提示的最佳块以适应多样的未来场景是一个成本高昂的过程。为了缓解这个问题，我们提出了一种简单而有效的方法，该方法学习每个ViT块的一个门，以调整其对提示标记的干预。通过我们的方法，提示标记被选择性地受到需要进行任务适应的块的影响。我们的方法在FGVC和VTAB图像分类以及ADE20K语义分割中优于VPT变体。代码可在

https://github.com/ryongithub/GatedPromptTuning 获取。

成为VIP会员查看完整内容

36

相关内容

ICML 2023

国际机器学习大会(International Conference on Machine Learning，简称ICML ) 是由国际机器学习学会（IMLS）主办的机器学习国际顶级会议。 2023年7月23日至29日周六在夏威夷会议中心举行。

视觉中怎么用提示？南洋理工CVPR2023《视觉提示》教程，附290页ppt

视觉中怎么用提示？南洋理工CVPR2023《视觉提示》教程，附290页ppt

专知会员服务

82+阅读 · 2023年6月30日

【CVPR2023】视觉Transformer学习长尾数据，解决不平衡标注数据

【CVPR2023】视觉Transformer学习长尾数据，解决不平衡标注数据

专知会员服务

33+阅读 · 2023年6月16日

【ICML2023】POUF:面向提示的大型预训练模型无监督微调

【ICML2023】POUF:面向提示的大型预训练模型无监督微调

专知会员服务

39+阅读 · 2023年5月18日

ICML2023 | 轻量级视觉Transformer(ViT)的预训练实践手册

ICML2023 | 轻量级视觉Transformer(ViT)的预训练实践手册

专知会员服务

41+阅读 · 2023年5月10日

【ICML2022】时序自监督视频transformer

【ICML2022】时序自监督视频transformer

专知会员服务

31+阅读 · 2022年7月28日

【ICML2022】CtrlFormer: 通过Transformer学习视觉控制的可迁移状态表示

【ICML2022】CtrlFormer: 通过Transformer学习视觉控制的可迁移状态表示

专知会员服务

16+阅读 · 2022年6月21日

【ICML2022】Transformer是元强化学习器

【ICML2022】Transformer是元强化学习器

专知会员服务

56+阅读 · 2022年6月15日

【CVPR2022】提示分布学习

【CVPR2022】提示分布学习

专知会员服务

31+阅读 · 2022年5月17日

【南洋理工-CVPR2022】视觉语言模型的条件提示学习

【南洋理工-CVPR2022】视觉语言模型的条件提示学习

专知会员服务

34+阅读 · 2022年3月13日

【CVPR 2022】视觉提示调整（VPT），Vision Prompt Tuning

【CVPR 2022】视觉提示调整（VPT），Vision Prompt Tuning

专知会员服务

32+阅读 · 2022年3月12日

【CVPR2023】Vita-CLIP:通过多模态提示的视频和文本自适应CLIP

【CVPR2023】Vita-CLIP:通过多模态提示的视频和文本自适应CLIP

专知

5+阅读 · 2023年4月11日

预训练模型如何用在视觉任务？南洋理工最新《视觉语言模型》综述，全面概述视觉语言模型方法体系

预训练模型如何用在视觉任务？南洋理工最新《视觉语言模型》综述，全面概述视觉语言模型方法体系

专知

5+阅读 · 2023年4月4日

NeurlPS 2022 | 全新大模型参数高效微调方法：仅需训练0.3M的参数

NeurlPS 2022 | 全新大模型参数高效微调方法：仅需训练0.3M的参数

PaperWeekly

0+阅读 · 2022年11月9日

全新大模型参数高效微调方法SSF：仅需训练0.3M的参数，效果卓越（NeurlPS 22 ）

全新大模型参数高效微调方法SSF：仅需训练0.3M的参数，效果卓越（NeurlPS 22 ）

极市平台

0+阅读 · 2022年11月7日

使用PyTorch进行小样本学习的图像分类

使用PyTorch进行小样本学习的图像分类

极市平台

1+阅读 · 2022年11月4日

MetaFormer的视觉Baseline开源！颜水成团队再出马，顺带刷新ImageNet新记录！

MetaFormer的视觉Baseline开源！颜水成团队再出马，顺带刷新ImageNet新记录！

极市平台

0+阅读 · 2022年10月26日

【NeurIPS2022】基于结构聚类的自监督异构图预训练

【NeurIPS2022】基于结构聚类的自监督异构图预训练

专知

1+阅读 · 2022年10月20日

ECCV2022｜一个Trick 搞定 CNN与Transformer，即插即涨点即提速！

ECCV2022｜一个Trick 搞定 CNN与Transformer，即插即涨点即提速！

极市平台

0+阅读 · 2022年10月19日

【NeurIPS2022】不用微调的加速大规模视觉Transformer的密集预测

【NeurIPS2022】不用微调的加速大规模视觉Transformer的密集预测

专知

0+阅读 · 2022年10月5日

中文版-BERT-预训练的深度双向Transformer语言模型-详细介绍

中文版-BERT-预训练的深度双向Transformer语言模型-详细介绍

深度学习与NLP

30+阅读 · 2019年3月30日

基于自学习对比度视觉注意模型和自适应深度特征的无分类目标检测

国家自然科学基金

2+阅读 · 2015年12月31日

知觉学习影响视觉刺激显著性的神经机制

国家自然科学基金

1+阅读 · 2015年12月31日

基于主动增量式学习的故障诊断知识挖掘方法

国家自然科学基金

2+阅读 · 2013年12月31日

AMPK/自噬通路在骨髓间充质干细胞心肌保护中的作用及机制研究

国家自然科学基金

0+阅读 · 2012年12月31日

缺氧预处理提高骨髓间充质干细胞心肌修复疗效：瘦素的作用及机制研究

国家自然科学基金

0+阅读 · 2012年12月31日

面向图像与视频特征表示的深度编码方法研究

国家自然科学基金

0+阅读 · 2012年12月31日

尼古丁对BMSCs修复关节软骨缺损的干预作用及机制研究

国家自然科学基金

0+阅读 · 2012年12月31日

巨噬细胞吞噬干细胞后的旁分泌在细胞移植治疗急性心肌梗死的心肌修复中的作用及机制

国家自然科学基金

0+阅读 · 2010年12月31日

HLA-G5在骨髓间充质干细胞免疫调节功能中的作用及其机制研究

国家自然科学基金

0+阅读 · 2009年12月31日

抗阻训练对红细胞参数的影响及其机制

国家自然科学基金

0+阅读 · 2009年12月31日

Relational Contrastive Learning for Scene Text Recognition

Arxiv

0+阅读 · 2023年8月1日

WC-SBERT: Zero-Shot Text Classification via SBERT with Self-Training for Wikipedia Categories

Arxiv

0+阅读 · 2023年7月28日

Cascaded Cross-Modal Transformer for Request and Complaint Detection

Arxiv

0+阅读 · 2023年7月27日

Conditional Prompt Learning for Vision-Language Models

Conditional Prompt Learning for Vision-Language Models

Arxiv

13+阅读 · 2022年3月10日

Attention Mechanisms in Computer Vision: A Survey

Arxiv

58+阅读 · 2021年11月15日

A Survey of Visual Transformers

Arxiv

39+阅读 · 2021年11月11日

SVT-Net: Super Light-Weight Sparse Voxel Transformer for Large Scale Place Recognition

Arxiv

12+阅读 · 2021年5月30日

Efficient Transformers: A Survey

Arxiv

23+阅读 · 2020年9月16日

Graph Transformer Networks

Arxiv

15+阅读 · 2020年2月5日

Self-training with Noisy Student improves ImageNet classification

Arxiv

15+阅读 · 2019年11月11日

VIP会员

相关主题

相关VIP内容

视觉中怎么用提示？南洋理工CVPR2023《视觉提示》教程，附290页ppt

视觉中怎么用提示？南洋理工CVPR2023《视觉提示》教程，附290页ppt

专知会员服务

82+阅读 · 2023年6月30日

【CVPR2023】视觉Transformer学习长尾数据，解决不平衡标注数据

【CVPR2023】视觉Transformer学习长尾数据，解决不平衡标注数据

专知会员服务

33+阅读 · 2023年6月16日

【ICML2023】POUF:面向提示的大型预训练模型无监督微调

【ICML2023】POUF:面向提示的大型预训练模型无监督微调

专知会员服务

39+阅读 · 2023年5月18日

ICML2023 | 轻量级视觉Transformer(ViT)的预训练实践手册

ICML2023 | 轻量级视觉Transformer(ViT)的预训练实践手册

专知会员服务

41+阅读 · 2023年5月10日

【ICML2022】时序自监督视频transformer

【ICML2022】时序自监督视频transformer

专知会员服务

31+阅读 · 2022年7月28日

【ICML2022】CtrlFormer: 通过Transformer学习视觉控制的可迁移状态表示

【ICML2022】CtrlFormer: 通过Transformer学习视觉控制的可迁移状态表示

专知会员服务

16+阅读 · 2022年6月21日

【ICML2022】Transformer是元强化学习器

【ICML2022】Transformer是元强化学习器

专知会员服务

56+阅读 · 2022年6月15日

【CVPR2022】提示分布学习

【CVPR2022】提示分布学习

专知会员服务

31+阅读 · 2022年5月17日

【南洋理工-CVPR2022】视觉语言模型的条件提示学习

【南洋理工-CVPR2022】视觉语言模型的条件提示学习

专知会员服务

34+阅读 · 2022年3月13日

【CVPR 2022】视觉提示调整（VPT），Vision Prompt Tuning

【CVPR 2022】视觉提示调整（VPT），Vision Prompt Tuning

专知会员服务

32+阅读 · 2022年3月12日

热门VIP内容

开通专知VIP会员享更多权益服务

操作系统智能体：基于多模态大模型（MLLM）的通用计算设备智能体综述

《美国太空军系统全生命周期建模、仿真与分析效能提升方案》最新84页报告

【博士论文】推进数据高效的深度学习：非参数 Transformer、主动测试与上下文学习

自主人工智能：未来战争是否将是自主化的？

相关资讯

【CVPR2023】Vita-CLIP:通过多模态提示的视频和文本自适应CLIP

【CVPR2023】Vita-CLIP:通过多模态提示的视频和文本自适应CLIP

专知

5+阅读 · 2023年4月11日

预训练模型如何用在视觉任务？南洋理工最新《视觉语言模型》综述，全面概述视觉语言模型方法体系

预训练模型如何用在视觉任务？南洋理工最新《视觉语言模型》综述，全面概述视觉语言模型方法体系

专知

5+阅读 · 2023年4月4日

NeurlPS 2022 | 全新大模型参数高效微调方法：仅需训练0.3M的参数

NeurlPS 2022 | 全新大模型参数高效微调方法：仅需训练0.3M的参数

PaperWeekly

0+阅读 · 2022年11月9日

全新大模型参数高效微调方法SSF：仅需训练0.3M的参数，效果卓越（NeurlPS 22 ）

全新大模型参数高效微调方法SSF：仅需训练0.3M的参数，效果卓越（NeurlPS 22 ）

极市平台

0+阅读 · 2022年11月7日

使用PyTorch进行小样本学习的图像分类

使用PyTorch进行小样本学习的图像分类

极市平台

1+阅读 · 2022年11月4日

MetaFormer的视觉Baseline开源！颜水成团队再出马，顺带刷新ImageNet新记录！

MetaFormer的视觉Baseline开源！颜水成团队再出马，顺带刷新ImageNet新记录！

极市平台

0+阅读 · 2022年10月26日

【NeurIPS2022】基于结构聚类的自监督异构图预训练

【NeurIPS2022】基于结构聚类的自监督异构图预训练

专知

1+阅读 · 2022年10月20日

ECCV2022｜一个Trick 搞定 CNN与Transformer，即插即涨点即提速！

ECCV2022｜一个Trick 搞定 CNN与Transformer，即插即涨点即提速！

极市平台

0+阅读 · 2022年10月19日

【NeurIPS2022】不用微调的加速大规模视觉Transformer的密集预测

【NeurIPS2022】不用微调的加速大规模视觉Transformer的密集预测

专知

0+阅读 · 2022年10月5日

中文版-BERT-预训练的深度双向Transformer语言模型-详细介绍

中文版-BERT-预训练的深度双向Transformer语言模型-详细介绍

深度学习与NLP

30+阅读 · 2019年3月30日

相关基金

基于自学习对比度视觉注意模型和自适应深度特征的无分类目标检测

国家自然科学基金

2+阅读 · 2015年12月31日

知觉学习影响视觉刺激显著性的神经机制

国家自然科学基金

1+阅读 · 2015年12月31日

基于主动增量式学习的故障诊断知识挖掘方法

国家自然科学基金

2+阅读 · 2013年12月31日

AMPK/自噬通路在骨髓间充质干细胞心肌保护中的作用及机制研究

国家自然科学基金

0+阅读 · 2012年12月31日

缺氧预处理提高骨髓间充质干细胞心肌修复疗效：瘦素的作用及机制研究

国家自然科学基金

0+阅读 · 2012年12月31日

面向图像与视频特征表示的深度编码方法研究

国家自然科学基金

0+阅读 · 2012年12月31日

尼古丁对BMSCs修复关节软骨缺损的干预作用及机制研究

国家自然科学基金

0+阅读 · 2012年12月31日

巨噬细胞吞噬干细胞后的旁分泌在细胞移植治疗急性心肌梗死的心肌修复中的作用及机制

国家自然科学基金

0+阅读 · 2010年12月31日

HLA-G5在骨髓间充质干细胞免疫调节功能中的作用及其机制研究

国家自然科学基金

0+阅读 · 2009年12月31日

抗阻训练对红细胞参数的影响及其机制

国家自然科学基金

0+阅读 · 2009年12月31日

相关论文

Relational Contrastive Learning for Scene Text Recognition

Arxiv

0+阅读 · 2023年8月1日

WC-SBERT: Zero-Shot Text Classification via SBERT with Self-Training for Wikipedia Categories

Arxiv

0+阅读 · 2023年7月28日

Cascaded Cross-Modal Transformer for Request and Complaint Detection

Arxiv

0+阅读 · 2023年7月27日

Conditional Prompt Learning for Vision-Language Models

Conditional Prompt Learning for Vision-Language Models

Arxiv

13+阅读 · 2022年3月10日

Attention Mechanisms in Computer Vision: A Survey

Arxiv

58+阅读 · 2021年11月15日

A Survey of Visual Transformers

Arxiv

39+阅读 · 2021年11月11日

SVT-Net: Super Light-Weight Sparse Voxel Transformer for Large Scale Place Recognition

Arxiv

12+阅读 · 2021年5月30日

Efficient Transformers: A Survey

Arxiv

23+阅读 · 2020年9月16日

Graph Transformer Networks

Arxiv

15+阅读 · 2020年2月5日

Self-training with Noisy Student improves ImageNet classification

Arxiv

15+阅读 · 2019年11月11日

微信扫码咨询专知VIP会员