【ICCV2023】视觉Transformers的累积空间知识蒸馏 - 专知VIP

会员服务 ·

17

ICCV 2023 · Transformers · 计算机视觉 ·

2023 年 7 月 18 日

【ICCV2023】视觉Transformers的累积空间知识蒸馏

专知会员服务

专知，提供专业可信的知识分发服务，让认知协作更快更好！

“累积空间知识蒸馏”（Cumulative Spatial Knowledge Distillation，CSKD）是一个深度学习中针对视觉变换器（ViTs）进行知识蒸馏的方法。CSKD的设计目标是解决从卷积神经网络（CNNs）中提取知识时所遇到的两大问题：(1) CNN和ViT网络设计完全不同，导致中间特征的语义级别不同，使得基于空间的知识传递方法（例如，特征模拟）效率低下；(2) 从CNN中提取知识会限制ViT在后期训练中的网络收敛，因为CNN的局部归纳偏见监督抑制了ViT整合全局信息的能力。 CSKD方法从CNN对应的空间响应中提取基于空间的知识，然后将其蒸馏到ViT的所有补丁令牌，而无需引入中间特征。此外，CSKD利用了累积知识融合（CKF）模块，该模块引入了CNN的全局响应，并在训练过程中逐渐强调其重要性。应用CKF在早期训练期间利用了CNN的局部归纳偏见，而在后期充分发挥了ViT的全局能力。在ImageNet-1k和下游数据集上的大量实验和分析证明了我们的CSKD方法的优越性。代码将公开发布。

成为VIP会员查看完整内容

38

相关内容

ICCV 2023

【KDD2023】分布外图学习

【KDD2023】分布外图学习

专知会员服务

31+阅读 · 2023年8月17日

【NeurIPS2022】扩散视觉反事实解释

【NeurIPS2022】扩散视觉反事实解释

专知会员服务

24+阅读 · 2022年10月24日

【ICML2022】可达性约束强化学习

【ICML2022】可达性约束强化学习

专知会员服务

23+阅读 · 2022年5月18日

【WWW2022】再思考图卷积网络的知识图谱补全

【WWW2022】再思考图卷积网络的知识图谱补全

专知会员服务

34+阅读 · 2022年2月15日

IEEE TPAMI | 基于标注偏差估计的实例相关PU学习

IEEE TPAMI | 基于标注偏差估计的实例相关PU学习

专知会员服务

12+阅读 · 2021年10月23日

【ACL2021】可学习知识引导的事件因果关系识别数据增强方法

专知会员服务

35+阅读 · 2021年8月11日

【ICML2021】面向异构联邦学习的无数据知识蒸馏

专知会员服务

36+阅读 · 2021年7月9日

【ICML2021】授权驱动探索的元强化学习

专知会员服务

28+阅读 · 2021年5月24日

【WWW2021】本体增强零样本学习

【WWW2021】本体增强零样本学习

专知会员服务

35+阅读 · 2021年2月26日

超越深度学习：梯度提升机Gradient Boosting Machines (GBM)，73页ppt

超越深度学习：梯度提升机Gradient Boosting Machines (GBM)，73页ppt

专知会员服务

52+阅读 · 2020年6月21日

【AAAI2023】基于序图的因果结构强化学习

【AAAI2023】基于序图的因果结构强化学习

专知

5+阅读 · 2022年11月25日

【NeurIPS2022】解决持续学习问题的理论研究

【NeurIPS2022】解决持续学习问题的理论研究

专知

2+阅读 · 2022年11月7日

【NeurIPS2022】通过模型转换的可解释强化学习

【NeurIPS2022】通过模型转换的可解释强化学习

专知

1+阅读 · 2022年10月4日

【NeurIPS2022】协作多智能体强化学习中个体全局最大值的再思考

【NeurIPS2022】协作多智能体强化学习中个体全局最大值的再思考

专知

2+阅读 · 2022年9月23日

【2022新书】元学习(Meta Learning ): 自动机器学习与数据挖掘

【2022新书】元学习(Meta Learning ): 自动机器学习与数据挖掘

专知

20+阅读 · 2022年3月7日

【CVPR2021】CausalVAE: 引入因果结构的解耦表示学习

【CVPR2021】CausalVAE: 引入因果结构的解耦表示学习

专知

19+阅读 · 2021年3月28日

【NeurIPS2019】图变换网络：Graph Transformer Network

【NeurIPS2019】图变换网络：Graph Transformer Network

专知

245+阅读 · 2019年11月18日

NAACL 2019 | 一种考虑缓和KL消失的简单VAE训练方法

NAACL 2019 | 一种考虑缓和KL消失的简单VAE训练方法

PaperWeekly

20+阅读 · 2019年4月24日

【学界】Google用更少标签生成图像，还提出一个用于训练评估GAN的库

【学界】Google用更少标签生成图像，还提出一个用于训练评估GAN的库

GAN生成式对抗网络

23+阅读 · 2019年4月10日

997篇-历史最全生成对抗网络（GAN）论文串烧

997篇-历史最全生成对抗网络（GAN）论文串烧

深度学习与NLP

16+阅读 · 2018年6月26日

半线性广义Tricomi方程Cauchy问题解的生命跨度估计研究

国家自然科学基金

0+阅读 · 2017年12月31日

语义Web知识库补全关键技术研究

国家自然科学基金

16+阅读 · 2017年12月31日

信息系统直接使用与间接使用—探索基于社会权力视角的前因及其对工作绩效的影响

国家自然科学基金

1+阅读 · 2015年12月31日

P3P问题解分布的临界曲面研究

国家自然科学基金

1+阅读 · 2015年12月31日

模糊认知集群优化的聚类算法

国家自然科学基金

8+阅读 · 2015年12月31日

Schr？dinger-Poisson方程守恒DDG方法研究

国家自然科学基金

2+阅读 · 2015年12月31日

基于决策模型和预备电位的运动想象BCI研究

国家自然科学基金

3+阅读 · 2015年12月31日

CGF战场空间认知行为建模研究

国家自然科学基金

51+阅读 · 2014年12月31日

空间插值的微分几何方法研究

国家自然科学基金

0+阅读 · 2014年12月31日

海量Web用户生成内容物化关键技术

国家自然科学基金

2+阅读 · 2014年12月31日

Generalized Differentiable RANSAC

Arxiv

0+阅读 · 2023年9月8日

On Reducing Undesirable Behavior in Deep Reinforcement Learning Models

Arxiv

0+阅读 · 2023年9月6日

Learning Whole-body Manipulation for Quadrupedal Robot

Arxiv

0+阅读 · 2023年9月6日

A Comprehensive Survey on Deep Graph Representation Learning

Arxiv

103+阅读 · 2023年4月11日

A Survey of Large Language Models

A Survey of Large Language Models

Arxiv

484+阅读 · 2023年3月31日

A survey and taxonomy of loss functions in machine learning

Arxiv

26+阅读 · 2023年1月13日

Graph Contrastive Learning with Adaptive Augmentation

Arxiv

10+阅读 · 2021年2月26日

Graph Neural Networks with Heterophily

Arxiv

19+阅读 · 2021年2月4日

Heterogeneous Deep Graph Infomax

Heterogeneous Deep Graph Infomax

Arxiv

12+阅读 · 2019年11月19日

Deep Face Recognition: A Survey

Deep Face Recognition: A Survey

Arxiv

18+阅读 · 2019年2月12日

VIP会员

相关主题

计算机视觉

相关VIP内容

【KDD2023】分布外图学习

【KDD2023】分布外图学习

专知会员服务

31+阅读 · 2023年8月17日

【NeurIPS2022】扩散视觉反事实解释

【NeurIPS2022】扩散视觉反事实解释

专知会员服务

24+阅读 · 2022年10月24日

【ICML2022】可达性约束强化学习

【ICML2022】可达性约束强化学习

专知会员服务

23+阅读 · 2022年5月18日

【WWW2022】再思考图卷积网络的知识图谱补全

【WWW2022】再思考图卷积网络的知识图谱补全

专知会员服务

34+阅读 · 2022年2月15日

IEEE TPAMI | 基于标注偏差估计的实例相关PU学习

IEEE TPAMI | 基于标注偏差估计的实例相关PU学习

专知会员服务

12+阅读 · 2021年10月23日

【ACL2021】可学习知识引导的事件因果关系识别数据增强方法

专知会员服务

35+阅读 · 2021年8月11日

【ICML2021】面向异构联邦学习的无数据知识蒸馏

专知会员服务

36+阅读 · 2021年7月9日

【ICML2021】授权驱动探索的元强化学习

专知会员服务

28+阅读 · 2021年5月24日

【WWW2021】本体增强零样本学习

【WWW2021】本体增强零样本学习

专知会员服务

35+阅读 · 2021年2月26日

超越深度学习：梯度提升机Gradient Boosting Machines (GBM)，73页ppt

超越深度学习：梯度提升机Gradient Boosting Machines (GBM)，73页ppt

专知会员服务

52+阅读 · 2020年6月21日

热门VIP内容

开通专知VIP会员享更多权益服务

【NeurIPS2025】迈向鲁棒的零样本强化学习

一种基于视觉算法生成三维场景重建的多任务系统 | 2025最新200页

【普林斯顿博士论文】量化、评估与缓解现代机器学习系统中的风险

遥感中基于深度学习的领域自适应方法：全面综述

相关资讯

【AAAI2023】基于序图的因果结构强化学习

【AAAI2023】基于序图的因果结构强化学习

专知

5+阅读 · 2022年11月25日

【NeurIPS2022】解决持续学习问题的理论研究

【NeurIPS2022】解决持续学习问题的理论研究

专知

2+阅读 · 2022年11月7日

【NeurIPS2022】通过模型转换的可解释强化学习

【NeurIPS2022】通过模型转换的可解释强化学习

专知

1+阅读 · 2022年10月4日

【NeurIPS2022】协作多智能体强化学习中个体全局最大值的再思考

【NeurIPS2022】协作多智能体强化学习中个体全局最大值的再思考

专知

2+阅读 · 2022年9月23日

【2022新书】元学习(Meta Learning ): 自动机器学习与数据挖掘

【2022新书】元学习(Meta Learning ): 自动机器学习与数据挖掘

专知

20+阅读 · 2022年3月7日

【CVPR2021】CausalVAE: 引入因果结构的解耦表示学习

【CVPR2021】CausalVAE: 引入因果结构的解耦表示学习

专知

19+阅读 · 2021年3月28日

【NeurIPS2019】图变换网络：Graph Transformer Network

【NeurIPS2019】图变换网络：Graph Transformer Network

专知

245+阅读 · 2019年11月18日

NAACL 2019 | 一种考虑缓和KL消失的简单VAE训练方法

NAACL 2019 | 一种考虑缓和KL消失的简单VAE训练方法

PaperWeekly

20+阅读 · 2019年4月24日

【学界】Google用更少标签生成图像，还提出一个用于训练评估GAN的库

【学界】Google用更少标签生成图像，还提出一个用于训练评估GAN的库

GAN生成式对抗网络

23+阅读 · 2019年4月10日

997篇-历史最全生成对抗网络（GAN）论文串烧

997篇-历史最全生成对抗网络（GAN）论文串烧

深度学习与NLP

16+阅读 · 2018年6月26日

相关基金

半线性广义Tricomi方程Cauchy问题解的生命跨度估计研究

国家自然科学基金

0+阅读 · 2017年12月31日

语义Web知识库补全关键技术研究

国家自然科学基金

16+阅读 · 2017年12月31日

信息系统直接使用与间接使用—探索基于社会权力视角的前因及其对工作绩效的影响

国家自然科学基金

1+阅读 · 2015年12月31日

P3P问题解分布的临界曲面研究

国家自然科学基金

1+阅读 · 2015年12月31日

模糊认知集群优化的聚类算法

国家自然科学基金

8+阅读 · 2015年12月31日

Schr？dinger-Poisson方程守恒DDG方法研究

国家自然科学基金

2+阅读 · 2015年12月31日

基于决策模型和预备电位的运动想象BCI研究

国家自然科学基金

3+阅读 · 2015年12月31日

CGF战场空间认知行为建模研究

国家自然科学基金

51+阅读 · 2014年12月31日

空间插值的微分几何方法研究

国家自然科学基金

0+阅读 · 2014年12月31日

海量Web用户生成内容物化关键技术

国家自然科学基金

2+阅读 · 2014年12月31日

相关论文

Generalized Differentiable RANSAC

Arxiv

0+阅读 · 2023年9月8日

On Reducing Undesirable Behavior in Deep Reinforcement Learning Models

Arxiv

0+阅读 · 2023年9月6日

Learning Whole-body Manipulation for Quadrupedal Robot

Arxiv

0+阅读 · 2023年9月6日

A Comprehensive Survey on Deep Graph Representation Learning

Arxiv

103+阅读 · 2023年4月11日

A Survey of Large Language Models

A Survey of Large Language Models

Arxiv

484+阅读 · 2023年3月31日

A survey and taxonomy of loss functions in machine learning

Arxiv

26+阅读 · 2023年1月13日

Graph Contrastive Learning with Adaptive Augmentation

Arxiv

10+阅读 · 2021年2月26日

Graph Neural Networks with Heterophily

Arxiv

19+阅读 · 2021年2月4日

Heterogeneous Deep Graph Infomax

Heterogeneous Deep Graph Infomax

Arxiv

12+阅读 · 2019年11月19日

Deep Face Recognition: A Survey

Deep Face Recognition: A Survey

Arxiv

18+阅读 · 2019年2月12日

微信扫码咨询专知VIP会员