【AAAI2023】SEPT:迈向可扩展和高效的视觉预训练 - 专知VIP

会员服务 ·

5

AAAI 2023 · 视觉预训练 · 自监督学习 ·

2022 年 12 月 14 日

【AAAI2023】SEPT:迈向可扩展和高效的视觉预训练

专知会员服务

专知，提供专业可信的知识分发服务，让认知协作更快更好！

最近，自监督预训练范式在利用大规模无标记数据来提高下游任务性能方面显示出了巨大的潜力。然而，在现实场景中增加无标记预训练数据的规模，需要惊人的计算成本，并面临着未经策划的样本的挑战。为解决这些问题，本文从数据选择的角度构建了一个特定于任务的自监督预训练框架，基于一个简单的假设，对与目标任务分布相似的未标记样本进行预训练，可以带来实质性的性能提升。在该假设的支持下，通过引入数据选择的检索管道，提出了第一个可扩展和高效的视觉预训练(SEPT)的新框架。首先利用自监督预训练模型提取整个未标记数据集的特征，用于检索管道初始化;然后，针对特定的目标任务，基于每个目标实例的特征相似度，从无标记数据集中检索最相似的样本进行预训练;最后，使用选取的无标签样本对目标模型进行自监督预训练，实现目标数据微调。通过解耦预训练规模和目标任务的可用上游数据，SEPT实现了上游数据集的高可扩展性和预训练的高效性，从而实现了高模型架构灵活性。在各种下游任务上的结果表明，与ImageNet预训练相比，SEPT可以实现具有竞争力甚至更好的性能，同时将训练样本的大小减少一个量级，而不需要借助任何额外的注释。

成为VIP会员查看完整内容

12

相关内容

AAAI 2023

【NeurIPS2022】不用微调的加速大规模视觉Transformer的密集预测

【NeurIPS2022】不用微调的加速大规模视觉Transformer的密集预测

专知会员服务

14+阅读 · 2022年10月5日

【MIT博士论文】实用机器学习的高效鲁棒算法，142页pdf

【MIT博士论文】实用机器学习的高效鲁棒算法，142页pdf

专知会员服务

59+阅读 · 2022年9月7日

【港科大博士论文】高效迁移学习的低资源自然语言理解

【港科大博士论文】高效迁移学习的低资源自然语言理解

专知会员服务

34+阅读 · 2022年8月24日

【CVPR2022】UniVIP：自监督视觉预训练的统一框架

【CVPR2022】UniVIP：自监督视觉预训练的统一框架

专知会员服务

28+阅读 · 2022年3月16日

【CVPR 2022】领域意识和任务意识的预训练，DATA: Domain-Aware and Task-Aware Pre-training

【CVPR 2022】领域意识和任务意识的预训练，DATA: Domain-Aware and Task-Aware Pre-training

专知会员服务

7+阅读 · 2022年3月12日

【AAAI2022】基于对比学习的预训练语言模型剪枝压缩

【AAAI2022】基于对比学习的预训练语言模型剪枝压缩

专知会员服务

29+阅读 · 2022年1月24日

【KDD2021】大规模异质图上的预训练框架

专知会员服务

46+阅读 · 2021年6月20日

【CVPR2021】密集对比学习的自监督视觉预训练

专知会员服务

39+阅读 · 2021年5月16日

SiT: 自监督视觉Transformer

专知会员服务

65+阅读 · 2021年4月11日

【AAAI2021】图神经网路自监督预训练策略

专知会员服务

41+阅读 · 2021年1月9日

NeurIPS 2022 | 稀疏且鲁棒的预训练语言模型

NeurIPS 2022 | 稀疏且鲁棒的预训练语言模型

PaperWeekly

0+阅读 · 2022年11月11日

【NeurIPS2022】不用微调的加速大规模视觉Transformer的密集预测

【NeurIPS2022】不用微调的加速大规模视觉Transformer的密集预测

专知

0+阅读 · 2022年10月5日

【港科大博士论文】高效迁移学习的低资源自然语言理解，164页pdf

【港科大博士论文】高效迁移学习的低资源自然语言理解，164页pdf

专知

0+阅读 · 2022年8月24日

如何高效、精准地进行图片搜索？看看轻量化视觉预训练模型

如何高效、精准地进行图片搜索？看看轻量化视觉预训练模型

微软研究院AI头条

1+阅读 · 2022年7月28日

【AAAI2022】基于对比学习的预训练语言模型剪枝压缩

【AAAI2022】基于对比学习的预训练语言模型剪枝压缩

专知

0+阅读 · 2022年1月24日

超越ImageNet预训练，Meta AI提出SplitMask，小数据集也能自监督预训练

超越ImageNet预训练，Meta AI提出SplitMask，小数据集也能自监督预训练

PaperWeekly

0+阅读 · 2022年1月17日

加速100倍，性能媲美SOTA！浙大提出无数据知识蒸馏新方法FastDFKD

加速100倍，性能媲美SOTA！浙大提出无数据知识蒸馏新方法FastDFKD

PaperWeekly

0+阅读 · 2022年1月12日

微软提出AdaLM，用于开发小型、快速且有效的领域预训练语言模型

微软提出AdaLM，用于开发小型、快速且有效的领域预训练语言模型

PaperWeekly

0+阅读 · 2022年1月7日

一个模型处理多种模态和任务，商汤等提出Uni-Perceiver，迈向通用预训练感知模型

一个模型处理多种模态和任务，商汤等提出Uni-Perceiver，迈向通用预训练感知模型

机器之心

0+阅读 · 2021年12月12日

何恺明团队开源3D目标检测新框架VoteNet：模型更简单、效率更高

何恺明团队开源3D目标检测新框架VoteNet：模型更简单、效率更高

AI前线

15+阅读 · 2019年9月1日

面向多云块并行移动计算迁移的环境自适应程序分割技术研究

国家自然科学基金

1+阅读 · 2015年12月31日

面向大规模动态异构网络的支持多用户并发任务的物联网应用构建方法研究

国家自然科学基金

0+阅读 · 2015年12月31日

异构众核芯片的可扩展全局功耗管理机制与算法研究

国家自然科学基金

0+阅读 · 2013年12月31日

求解可分凸规划的并行分裂算法研究

国家自然科学基金

0+阅读 · 2013年12月31日

面向绿色云计算的先进光数据中心网络支持下的能量有效数据管理

国家自然科学基金

0+阅读 · 2012年12月31日

基于SAS数据的水下复杂场景中目标识别研究

国家自然科学基金

1+阅读 · 2012年12月31日

面向高性能计算的高效平台虚拟化关键技术研究

国家自然科学基金

1+阅读 · 2011年12月31日

可扩展的高效XML数据管理关键技术研究

国家自然科学基金

0+阅读 · 2011年12月31日

基于二维随机映射和一范数优化的有监督图像分类研究

国家自然科学基金

3+阅读 · 2011年12月31日

网络存储中的RAID高效扩展技术研究

国家自然科学基金

0+阅读 · 2009年12月31日

Combinatorial Depth Measures for Hyperplane Arrangements

Arxiv

0+阅读 · 2023年2月15日

Self-Supervised Learning for Modeling Gamma-ray Variability in Blazars

Arxiv

0+阅读 · 2023年2月15日

Million-scale Object Detection with Large Vision Model

Arxiv

0+阅读 · 2023年2月14日

IDMS: Instance Depth for Multi-scale Monocular 3D Object Detection

Arxiv

0+阅读 · 2023年2月13日

CoMAE: Single Model Hybrid Pre-training on Small-Scale RGB-D Datasets

Arxiv

0+阅读 · 2023年2月13日

ViDeBERTa: A powerful pre-trained language model for Vietnamese

Arxiv

0+阅读 · 2023年2月10日

Selective In-Context Data Augmentation for Intent Detection using Pointwise V-Information

Arxiv

0+阅读 · 2023年2月10日

SE(3)-Equivariant Attention Networks for Shape Reconstruction in Function Space

Arxiv

0+阅读 · 2023年2月10日

UniLMv2: Pseudo-Masked Language Models for Unified Language Model Pre-Training

Arxiv

15+阅读 · 2020年2月28日

Distance-based Self-Attention Network for Natural Language Inference

Arxiv

10+阅读 · 2017年12月6日

VIP会员

相关主题

视觉预训练

自监督学习

相关VIP内容

【NeurIPS2022】不用微调的加速大规模视觉Transformer的密集预测

【NeurIPS2022】不用微调的加速大规模视觉Transformer的密集预测

专知会员服务

14+阅读 · 2022年10月5日

【MIT博士论文】实用机器学习的高效鲁棒算法，142页pdf

【MIT博士论文】实用机器学习的高效鲁棒算法，142页pdf

专知会员服务

59+阅读 · 2022年9月7日

【港科大博士论文】高效迁移学习的低资源自然语言理解

【港科大博士论文】高效迁移学习的低资源自然语言理解

专知会员服务

34+阅读 · 2022年8月24日

【CVPR2022】UniVIP：自监督视觉预训练的统一框架

【CVPR2022】UniVIP：自监督视觉预训练的统一框架

专知会员服务

28+阅读 · 2022年3月16日

【CVPR 2022】领域意识和任务意识的预训练，DATA: Domain-Aware and Task-Aware Pre-training

【CVPR 2022】领域意识和任务意识的预训练，DATA: Domain-Aware and Task-Aware Pre-training

专知会员服务

7+阅读 · 2022年3月12日

【AAAI2022】基于对比学习的预训练语言模型剪枝压缩

【AAAI2022】基于对比学习的预训练语言模型剪枝压缩

专知会员服务

29+阅读 · 2022年1月24日

【KDD2021】大规模异质图上的预训练框架

专知会员服务

46+阅读 · 2021年6月20日

【CVPR2021】密集对比学习的自监督视觉预训练

专知会员服务

39+阅读 · 2021年5月16日

SiT: 自监督视觉Transformer

专知会员服务

65+阅读 · 2021年4月11日

【AAAI2021】图神经网路自监督预训练策略

专知会员服务

41+阅读 · 2021年1月9日

热门VIP内容

开通专知VIP会员享更多权益服务

《巡飞弹药（爆炸性无人机）威胁态势分析》最新24页报告

《军用后勤无人机：破解战场运输挑战的创新方案》

人工智能战争：以色列、伊朗与新型AI战争形态

《俄乌战争：现代战争未来的启示与经验》

相关资讯

NeurIPS 2022 | 稀疏且鲁棒的预训练语言模型

NeurIPS 2022 | 稀疏且鲁棒的预训练语言模型

PaperWeekly

0+阅读 · 2022年11月11日

【NeurIPS2022】不用微调的加速大规模视觉Transformer的密集预测

【NeurIPS2022】不用微调的加速大规模视觉Transformer的密集预测

专知

0+阅读 · 2022年10月5日

【港科大博士论文】高效迁移学习的低资源自然语言理解，164页pdf

【港科大博士论文】高效迁移学习的低资源自然语言理解，164页pdf

专知

0+阅读 · 2022年8月24日

如何高效、精准地进行图片搜索？看看轻量化视觉预训练模型

如何高效、精准地进行图片搜索？看看轻量化视觉预训练模型

微软研究院AI头条

1+阅读 · 2022年7月28日

【AAAI2022】基于对比学习的预训练语言模型剪枝压缩

【AAAI2022】基于对比学习的预训练语言模型剪枝压缩

专知

0+阅读 · 2022年1月24日

超越ImageNet预训练，Meta AI提出SplitMask，小数据集也能自监督预训练

超越ImageNet预训练，Meta AI提出SplitMask，小数据集也能自监督预训练

PaperWeekly

0+阅读 · 2022年1月17日

加速100倍，性能媲美SOTA！浙大提出无数据知识蒸馏新方法FastDFKD

加速100倍，性能媲美SOTA！浙大提出无数据知识蒸馏新方法FastDFKD

PaperWeekly

0+阅读 · 2022年1月12日

微软提出AdaLM，用于开发小型、快速且有效的领域预训练语言模型

微软提出AdaLM，用于开发小型、快速且有效的领域预训练语言模型

PaperWeekly

0+阅读 · 2022年1月7日

一个模型处理多种模态和任务，商汤等提出Uni-Perceiver，迈向通用预训练感知模型

一个模型处理多种模态和任务，商汤等提出Uni-Perceiver，迈向通用预训练感知模型

机器之心

0+阅读 · 2021年12月12日

何恺明团队开源3D目标检测新框架VoteNet：模型更简单、效率更高

何恺明团队开源3D目标检测新框架VoteNet：模型更简单、效率更高

AI前线

15+阅读 · 2019年9月1日

相关基金

面向多云块并行移动计算迁移的环境自适应程序分割技术研究

国家自然科学基金

1+阅读 · 2015年12月31日

面向大规模动态异构网络的支持多用户并发任务的物联网应用构建方法研究

国家自然科学基金

0+阅读 · 2015年12月31日

异构众核芯片的可扩展全局功耗管理机制与算法研究

国家自然科学基金

0+阅读 · 2013年12月31日

求解可分凸规划的并行分裂算法研究

国家自然科学基金

0+阅读 · 2013年12月31日

面向绿色云计算的先进光数据中心网络支持下的能量有效数据管理

国家自然科学基金

0+阅读 · 2012年12月31日

基于SAS数据的水下复杂场景中目标识别研究

国家自然科学基金

1+阅读 · 2012年12月31日

面向高性能计算的高效平台虚拟化关键技术研究

国家自然科学基金

1+阅读 · 2011年12月31日

可扩展的高效XML数据管理关键技术研究

国家自然科学基金

0+阅读 · 2011年12月31日

基于二维随机映射和一范数优化的有监督图像分类研究

国家自然科学基金

3+阅读 · 2011年12月31日

网络存储中的RAID高效扩展技术研究

国家自然科学基金

0+阅读 · 2009年12月31日

相关论文

Combinatorial Depth Measures for Hyperplane Arrangements

Arxiv

0+阅读 · 2023年2月15日

Self-Supervised Learning for Modeling Gamma-ray Variability in Blazars

Arxiv

0+阅读 · 2023年2月15日

Million-scale Object Detection with Large Vision Model

Arxiv

0+阅读 · 2023年2月14日

IDMS: Instance Depth for Multi-scale Monocular 3D Object Detection

Arxiv

0+阅读 · 2023年2月13日

CoMAE: Single Model Hybrid Pre-training on Small-Scale RGB-D Datasets

Arxiv

0+阅读 · 2023年2月13日

ViDeBERTa: A powerful pre-trained language model for Vietnamese

Arxiv

0+阅读 · 2023年2月10日

Selective In-Context Data Augmentation for Intent Detection using Pointwise V-Information

Arxiv

0+阅读 · 2023年2月10日

SE(3)-Equivariant Attention Networks for Shape Reconstruction in Function Space

Arxiv

0+阅读 · 2023年2月10日

UniLMv2: Pseudo-Masked Language Models for Unified Language Model Pre-Training

Arxiv

15+阅读 · 2020年2月28日

Distance-based Self-Attention Network for Natural Language Inference

Arxiv

10+阅读 · 2017年12月6日

微信扫码咨询专知VIP会员