Transformer替代CNN？8篇论文概述最新进展！ - 专知VIP

会员服务 ·

6

2021 年 1 月 19 日

Transformer替代CNN？8篇论文概述最新进展！

专知会员服务

专知，提供专业可信的知识分发服务，让认知协作更快更好！

Transformer 的跨界之旅还在继续，那么未来有哪些可能的研究思路呢？

去年 12 月，来自华为诺亚方舟实验室、北京大学、悉尼大学的研究者整理了一份综述，详细归纳了多个视觉方向的 Transformer 模型。

论文链接：https://arxiv.org/pdf/2012.12556.pdf

此外，他们还在论文中初步思考并给出了三个未来的研究方向：

现有的 Visual Transformer 都还是将 NLP 中 Transformer 的结构套到视觉任务做了一些初步探索，未来针对 CV 的特性设计更适配视觉特性的 Transformer 将会带来更好的性能提升。

现有的 Visual Transformer 一般是一个模型做单个任务，近来有一些模型可以单模型做多任务，比如 IPT，未来是否可以有一个世界模型，处理所有任务？

现有的 Visual Transformer 参数量和计算量多大，比如 ViT 需要 18B FLOPs 在 ImageNet 达到 78% 左右 Top1，但是 CNN 模型如 GhostNet 只需 600M FLOPs 可以达到 79% 以上 Top1，所以高效 Transformer for CV 亟需开发以媲美 CNN。（引自 @kai.han）

类似的综述研究还有来自穆罕默德 · 本 · 扎耶德人工智能大学等机构的《Transformers in Vision: A Survey》。

成为VIP会员查看完整内容

77

相关内容

华为等发布《视觉Transformer转换器》综述论文，21页pdf

华为等发布《视觉Transformer转换器》综述论文，21页pdf

专知会员服务

86+阅读 · 2020年12月25日

多模态视觉语言表征学习研究综述

多模态视觉语言表征学习研究综述

专知会员服务

195+阅读 · 2020年12月3日

【Google】最新《高效Transformers》综述大全，Efficient Transformers: A Survey

【Google】最新《高效Transformers》综述大全，Efficient Transformers: A Survey

专知会员服务

113+阅读 · 2020年9月17日

【DeepMind硬核课】深度学习计算机视觉前沿进展，附124页ppt

【DeepMind硬核课】深度学习计算机视觉前沿进展，附124页ppt

专知会员服务

168+阅读 · 2020年6月30日

卷积神经网络的概述论文:分析、应用和展望，21页pdf

卷积神经网络的概述论文:分析、应用和展望，21页pdf

专知会员服务

91+阅读 · 2020年4月7日

机器翻译深度学习最新综述

机器翻译深度学习最新综述

专知会员服务

99+阅读 · 2020年2月20日

BERT进展2019四篇必读论文

BERT进展2019四篇必读论文

专知会员服务

69+阅读 · 2020年1月2日

2019->2020必看的十篇「深度学习领域综述」论文

2019->2020必看的十篇「深度学习领域综述」论文

专知会员服务

275+阅读 · 2020年1月1日

自动机器学习：最新进展综述

自动机器学习：最新进展综述

专知会员服务

123+阅读 · 2019年10月13日

深度神经网络模型压缩与加速综述

深度神经网络模型压缩与加速综述

专知会员服务

129+阅读 · 2019年10月12日

综述|从9篇研究综述看图神经网络GNN的最新研究进展

综述|从9篇研究综述看图神经网络GNN的最新研究进展

DataFunTalk

26+阅读 · 2020年5月28日

【论文笔记】NLP 预训练模型综述

【论文笔记】NLP 预训练模型综述

深度学习自然语言处理

8+阅读 · 2020年5月14日

进一步改进GPT和BERT：使用Transformer的语言模型

进一步改进GPT和BERT：使用Transformer的语言模型

机器之心

16+阅读 · 2019年5月1日

自然语言处理中注意力机制综述

自然语言处理中注意力机制综述

Python开发者

11+阅读 · 2019年1月31日

【论文综述】深度卷积神经网络架构最新进展综述（附60页全文下载）

【论文综述】深度卷积神经网络架构最新进展综述（附60页全文下载）

专知

29+阅读 · 2019年1月23日

BERT大火却不懂Transformer？读这一篇就够了

BERT大火却不懂Transformer？读这一篇就够了

大数据文摘

11+阅读 · 2019年1月8日

CNN已老，GNN来了！清华大学孙茂松组一文综述GNN

CNN已老，GNN来了！清华大学孙茂松组一文综述GNN

数据派THU

8+阅读 · 2019年1月6日

CNN模型压缩与加速算法综述

CNN模型压缩与加速算法综述

微信AI

6+阅读 · 2017年10月11日

干货｜CNN 模型压缩与加速算法综述

干货｜CNN 模型压缩与加速算法综述

全球人工智能

9+阅读 · 2017年8月26日

CNN 模型压缩与加速算法综述

CNN 模型压缩与加速算法综述

机器学习研究会

16+阅读 · 2017年8月25日

Deepfake Video Detection Using Convolutional Vision Transformer

Arxiv

1+阅读 · 2021年3月11日

A Survey on Visual Transformer

Arxiv

19+阅读 · 2020年12月23日

Resolution Adaptive Networks for Efficient Inference

Arxiv

5+阅读 · 2020年3月16日

A Comparative Study on Transformer vs RNN in Speech Applications

A Comparative Study on Transformer vs RNN in Speech Applications

Arxiv

4+阅读 · 2019年9月13日

Learning Deep Transformer Models for Machine Translation

Learning Deep Transformer Models for Machine Translation

Arxiv

3+阅读 · 2019年6月5日

Reverse Attention for Salient Object Detection

Arxiv

11+阅读 · 2019年4月15日

RAM: Residual Attention Module for Single Image Super-Resolution

RAM: Residual Attention Module for Single Image Super-Resolution

Arxiv

9+阅读 · 2018年11月29日

Doubly Attentive Transformer Machine Translation

Doubly Attentive Transformer Machine Translation

Arxiv

4+阅读 · 2018年7月30日

Neural Machine Translation for Bilingually Scarce Scenarios: A Deep Multi-task Learning Approach

Arxiv

9+阅读 · 2018年5月11日

Face Detection Using Improved Faster RCNN

Arxiv

6+阅读 · 2018年2月6日

VIP会员

相关主题

相关VIP内容

华为等发布《视觉Transformer转换器》综述论文，21页pdf

华为等发布《视觉Transformer转换器》综述论文，21页pdf

专知会员服务

86+阅读 · 2020年12月25日

多模态视觉语言表征学习研究综述

多模态视觉语言表征学习研究综述

专知会员服务

195+阅读 · 2020年12月3日

【Google】最新《高效Transformers》综述大全，Efficient Transformers: A Survey

【Google】最新《高效Transformers》综述大全，Efficient Transformers: A Survey

专知会员服务

113+阅读 · 2020年9月17日

【DeepMind硬核课】深度学习计算机视觉前沿进展，附124页ppt

【DeepMind硬核课】深度学习计算机视觉前沿进展，附124页ppt

专知会员服务

168+阅读 · 2020年6月30日

卷积神经网络的概述论文:分析、应用和展望，21页pdf

卷积神经网络的概述论文:分析、应用和展望，21页pdf

专知会员服务

91+阅读 · 2020年4月7日

机器翻译深度学习最新综述

机器翻译深度学习最新综述

专知会员服务

99+阅读 · 2020年2月20日

BERT进展2019四篇必读论文

BERT进展2019四篇必读论文

专知会员服务

69+阅读 · 2020年1月2日

2019->2020必看的十篇「深度学习领域综述」论文

2019->2020必看的十篇「深度学习领域综述」论文

专知会员服务

275+阅读 · 2020年1月1日

自动机器学习：最新进展综述

自动机器学习：最新进展综述

专知会员服务

123+阅读 · 2019年10月13日

深度神经网络模型压缩与加速综述

深度神经网络模型压缩与加速综述

专知会员服务

129+阅读 · 2019年10月12日

热门VIP内容

开通专知VIP会员享更多权益服务

【NTU博士论文】反事实推理在多模态对话生成中的应用

基于强化学习的智能体化搜索全面综述：基础、角色、优化、评估与应用

ICCV最佳论文出炉，朱俊彦团队用砖块积木摘得桂冠

面向具身操作的高效视觉–语言–动作模型：系统综述

相关资讯

综述|从9篇研究综述看图神经网络GNN的最新研究进展

综述|从9篇研究综述看图神经网络GNN的最新研究进展

DataFunTalk

26+阅读 · 2020年5月28日

【论文笔记】NLP 预训练模型综述

【论文笔记】NLP 预训练模型综述

深度学习自然语言处理

8+阅读 · 2020年5月14日

进一步改进GPT和BERT：使用Transformer的语言模型

进一步改进GPT和BERT：使用Transformer的语言模型

机器之心

16+阅读 · 2019年5月1日

自然语言处理中注意力机制综述

自然语言处理中注意力机制综述

Python开发者

11+阅读 · 2019年1月31日

【论文综述】深度卷积神经网络架构最新进展综述（附60页全文下载）

【论文综述】深度卷积神经网络架构最新进展综述（附60页全文下载）

专知

29+阅读 · 2019年1月23日

BERT大火却不懂Transformer？读这一篇就够了

BERT大火却不懂Transformer？读这一篇就够了

大数据文摘

11+阅读 · 2019年1月8日

CNN已老，GNN来了！清华大学孙茂松组一文综述GNN

CNN已老，GNN来了！清华大学孙茂松组一文综述GNN

数据派THU

8+阅读 · 2019年1月6日

CNN模型压缩与加速算法综述

CNN模型压缩与加速算法综述

微信AI

6+阅读 · 2017年10月11日

干货｜CNN 模型压缩与加速算法综述

干货｜CNN 模型压缩与加速算法综述

全球人工智能

9+阅读 · 2017年8月26日

CNN 模型压缩与加速算法综述

CNN 模型压缩与加速算法综述

机器学习研究会

16+阅读 · 2017年8月25日

相关论文

Deepfake Video Detection Using Convolutional Vision Transformer

Arxiv

1+阅读 · 2021年3月11日

A Survey on Visual Transformer

Arxiv

19+阅读 · 2020年12月23日

Resolution Adaptive Networks for Efficient Inference

Arxiv

5+阅读 · 2020年3月16日

A Comparative Study on Transformer vs RNN in Speech Applications

A Comparative Study on Transformer vs RNN in Speech Applications

Arxiv

4+阅读 · 2019年9月13日

Learning Deep Transformer Models for Machine Translation

Learning Deep Transformer Models for Machine Translation

Arxiv

3+阅读 · 2019年6月5日

Reverse Attention for Salient Object Detection

Arxiv

11+阅读 · 2019年4月15日

RAM: Residual Attention Module for Single Image Super-Resolution

RAM: Residual Attention Module for Single Image Super-Resolution

Arxiv

9+阅读 · 2018年11月29日

Doubly Attentive Transformer Machine Translation

Doubly Attentive Transformer Machine Translation

Arxiv

4+阅读 · 2018年7月30日

Neural Machine Translation for Bilingually Scarce Scenarios: A Deep Multi-task Learning Approach

Arxiv

9+阅读 · 2018年5月11日

Face Detection Using Improved Faster RCNN

Arxiv

6+阅读 · 2018年2月6日

微信扫码咨询专知VIP会员