【Google】高效Transformer综述，Efficient Transformers: A Survey - 专知VIP

会员服务 ·

32

Transformer · 综述论文 ·

2022 年 3 月 17 日

【Google】高效Transformer综述，Efficient Transformers: A Survey

专知会员服务

专知，提供专业可信的知识分发服务，让认知协作更快更好！

由于其在语言、视觉和强化学习等领域的有效性，Transformer模型架构最近获得了巨大的兴趣。例如，在自然语言处理领域，Transformer 已经成为现代深度学习堆栈中不可或缺的重要组成部分。最近，出现了令人眼花缭乱的“X-former”模型——Reformer、Linformer、Performer、Longformer等等——它们改进了原始Transformer架构，其中许多都围绕计算和内存效率进行了改进。为了帮助热心的研究人员在这一热潮中导航，本文列举了大量深思熟虑的近期高效的“X-former”模型，为跨多个领域的现有工作和模型提供了一个有组织的、全面的概述。

成为VIP会员查看完整内容

66

相关内容

Transformer

Transformer是谷歌发表的论文《Attention Is All You Need》提出一种完全基于Attention的翻译架构

知识荟萃

精品入门和进阶教程、论文和代码整理等

更多

查看相关VIP内容、论文、资讯等

Google最新《高效Transformers》2022综述大全，阐述九大类提升Transformers效率方式

Google最新《高效Transformers》2022综述大全，阐述九大类提升Transformers效率方式

专知会员服务

97+阅读 · 2022年3月18日

【清华大学】Delta调优:预训练语言模型参数有效方法的综合研究，Delta Tuning: A Comprehensive Study of Parameter Efficient Methods for Pre-trained Language Models

【清华大学】Delta调优:预训练语言模型参数有效方法的综合研究，Delta Tuning: A Comprehensive Study of Parameter Efficient Methods for Pre-trained Language Models

专知会员服务

26+阅读 · 2022年3月15日

南京大学医学院最新《Transformer医学图像处理应用》综述论文，Transformers in Medical Image Analysis: A Review

南京大学医学院最新《Transformer医学图像处理应用》综述论文，Transformers in Medical Image Analysis: A Review

专知会员服务

45+阅读 · 2022年3月1日

基于深度神经网络的高效视觉识别研究进展与新方向

基于深度神经网络的高效视觉识别研究进展与新方向

专知会员服务

39+阅读 · 2021年8月31日

深度学习如何又好又快? Google最新《高效深度学习: 更小、更快、更好》综述论文，43页pdf

深度学习如何又好又快? Google最新《高效深度学习: 更小、更快、更好》综述论文，43页pdf

专知会员服务

90+阅读 · 2021年6月18日

复旦最新「Transformers全面综述」论文，40页pdf概述Transformers各种变体模型与应用

复旦最新「Transformers全面综述」论文，40页pdf概述Transformers各种变体模型与应用

专知会员服务

194+阅读 · 2021年6月10日

Transformer！「预训练变换器文本排序」首篇综述书，155页pdf概述BERT类模型文本检索进展

Transformer！「预训练变换器文本排序」首篇综述书，155页pdf概述BERT类模型文本检索进展

专知会员服务

69+阅读 · 2021年3月18日

【Google】最新《高效Transformers》综述大全，Efficient Transformers: A Survey

【Google】最新《高效Transformers》综述大全，Efficient Transformers: A Survey

专知会员服务

113+阅读 · 2020年9月17日

【论文翻译】2020最新预训练语言模型综述：Pre-trained Models for Natural Language Processing: A Survey

【论文翻译】2020最新预训练语言模型综述：Pre-trained Models for Natural Language Processing: A Survey

专知会员服务

94+阅读 · 2020年4月13日

Google AI博客解读论文《Reformer: The Efficient Transformer》，百万量级注意力机制

Google AI博客解读论文《Reformer: The Efficient Transformer》，百万量级注意力机制

专知会员服务

70+阅读 · 2020年1月17日

Google最新《高效Transformers》2022综述大全，39页pdf阐述九大类提升Transformers效率方式

Google最新《高效Transformers》2022综述大全，39页pdf阐述九大类提升Transformers效率方式

新智元

2+阅读 · 2022年4月7日

深度学习模型压缩算法综述

深度学习模型压缩算法综述

极市平台

1+阅读 · 2021年12月3日

何恺明MAE大火之后，想梳理下视觉Transformer？不妨看看这篇综述

何恺明MAE大火之后，想梳理下视觉Transformer？不妨看看这篇综述

PaperWeekly

1+阅读 · 2021年11月26日

强化学习如何提升泛化性？UCL& UC Berkeley最新《深度强化学习泛化性》综述

强化学习如何提升泛化性？UCL& UC Berkeley最新《深度强化学习泛化性》综述

专知

5+阅读 · 2021年11月22日

Swin Transformer升级版来了！30亿参数，刷榜多项视觉任务

Swin Transformer升级版来了！30亿参数，刷榜多项视觉任务

PaperWeekly

0+阅读 · 2021年11月21日

中国科学院、东南大学等联合发表最新的视觉 Transformer 综述

中国科学院、东南大学等联合发表最新的视觉 Transformer 综述

极市平台

6+阅读 · 2021年11月16日

Transformers在计算机视觉概述

Transformers在计算机视觉概述

专知

3+阅读 · 2021年4月18日

深度学习的下一步：Transformer和注意力机制

深度学习的下一步：Transformer和注意力机制

云头条

56+阅读 · 2019年9月14日

图神经网络综述：模型与应用

图神经网络综述：模型与应用

PaperWeekly

198+阅读 · 2018年12月26日

基于深度学习的NLP 32页最新进展综述，190篇参考文献

基于深度学习的NLP 32页最新进展综述，190篇参考文献

人工智能学家

28+阅读 · 2018年12月4日

基于神经网络和群体智能的稀疏表示算法研究

国家自然科学基金

1+阅读 · 2014年12月31日

带有Levy跳的随机时滞微分方程的数值解法及稳定性研究

国家自然科学基金

0+阅读 · 2013年12月31日

基于大数据平台的输电网故障诊断架构研究

国家自然科学基金

3+阅读 · 2013年12月31日

基于主动轮廓模型的自然图像分割研究

国家自然科学基金

0+阅读 · 2013年12月31日

基于多源影像的显著性检测及其在图像缩放中的应用

国家自然科学基金

0+阅读 · 2012年12月31日

面向GPU的电力系统电磁暂态并行计算方法研究

国家自然科学基金

0+阅读 · 2012年12月31日

资源导向型对等网络下服务发现与服务组合的研究

国家自然科学基金

1+阅读 · 2012年12月31日

图的若干参数及算法研究

国家自然科学基金

0+阅读 · 2011年12月31日

基于压缩感知的多机器人主动同步定位与地图构建研究

国家自然科学基金

1+阅读 · 2011年12月31日

含控制器的电力系统递阶（结构化）模型研究

国家自然科学基金

0+阅读 · 2010年12月31日

Learned Queries for Efficient Local Attention

Arxiv

0+阅读 · 2022年4月19日

Temporally Efficient Vision Transformer for Video Instance Segmentation

Arxiv

0+阅读 · 2022年4月18日

Hierarchical Transformers Are More Efficient Language Models

Arxiv

3+阅读 · 2022年4月16日

A Survey of Visual Transformers

Arxiv

39+阅读 · 2021年11月11日

Large-Scale Deep Learning Optimizations: A Comprehensive Survey

Arxiv

23+阅读 · 2021年11月2日

A Survey of Quantization Methods for Efficient Neural Network Inference

Arxiv

22+阅读 · 2021年6月21日

A Survey of Transformers

Arxiv

103+阅读 · 2021年6月8日

Deep Image Retrieval: A Survey

Arxiv

16+阅读 · 2021年1月27日

A Survey on Visual Transformer

Arxiv

19+阅读 · 2020年12月23日

Efficient Transformers: A Survey

Arxiv

23+阅读 · 2020年9月16日

VIP会员

相关主题

相关VIP内容

Google最新《高效Transformers》2022综述大全，阐述九大类提升Transformers效率方式

Google最新《高效Transformers》2022综述大全，阐述九大类提升Transformers效率方式

专知会员服务

97+阅读 · 2022年3月18日

【清华大学】Delta调优:预训练语言模型参数有效方法的综合研究，Delta Tuning: A Comprehensive Study of Parameter Efficient Methods for Pre-trained Language Models

【清华大学】Delta调优:预训练语言模型参数有效方法的综合研究，Delta Tuning: A Comprehensive Study of Parameter Efficient Methods for Pre-trained Language Models

专知会员服务

26+阅读 · 2022年3月15日

南京大学医学院最新《Transformer医学图像处理应用》综述论文，Transformers in Medical Image Analysis: A Review

南京大学医学院最新《Transformer医学图像处理应用》综述论文，Transformers in Medical Image Analysis: A Review

专知会员服务

45+阅读 · 2022年3月1日

基于深度神经网络的高效视觉识别研究进展与新方向

基于深度神经网络的高效视觉识别研究进展与新方向

专知会员服务

39+阅读 · 2021年8月31日

深度学习如何又好又快? Google最新《高效深度学习: 更小、更快、更好》综述论文，43页pdf

深度学习如何又好又快? Google最新《高效深度学习: 更小、更快、更好》综述论文，43页pdf

专知会员服务

90+阅读 · 2021年6月18日

复旦最新「Transformers全面综述」论文，40页pdf概述Transformers各种变体模型与应用

复旦最新「Transformers全面综述」论文，40页pdf概述Transformers各种变体模型与应用

专知会员服务

194+阅读 · 2021年6月10日

Transformer！「预训练变换器文本排序」首篇综述书，155页pdf概述BERT类模型文本检索进展

Transformer！「预训练变换器文本排序」首篇综述书，155页pdf概述BERT类模型文本检索进展

专知会员服务

69+阅读 · 2021年3月18日

【Google】最新《高效Transformers》综述大全，Efficient Transformers: A Survey

【Google】最新《高效Transformers》综述大全，Efficient Transformers: A Survey

专知会员服务

113+阅读 · 2020年9月17日

【论文翻译】2020最新预训练语言模型综述：Pre-trained Models for Natural Language Processing: A Survey

【论文翻译】2020最新预训练语言模型综述：Pre-trained Models for Natural Language Processing: A Survey

专知会员服务

94+阅读 · 2020年4月13日

Google AI博客解读论文《Reformer: The Efficient Transformer》，百万量级注意力机制

Google AI博客解读论文《Reformer: The Efficient Transformer》，百万量级注意力机制

专知会员服务

70+阅读 · 2020年1月17日

热门VIP内容

开通专知VIP会员享更多权益服务

【博士论文】扩展可扩展会话推荐的边界

别想太多：高效 R1 风格大型推理模型综述

【ACMMM2025】EvoVLMA: 进化式视觉-语言模型自适应

智能体网络：用AI智能体编织下一代网络

相关资讯

Google最新《高效Transformers》2022综述大全，39页pdf阐述九大类提升Transformers效率方式

Google最新《高效Transformers》2022综述大全，39页pdf阐述九大类提升Transformers效率方式

新智元

2+阅读 · 2022年4月7日

深度学习模型压缩算法综述

深度学习模型压缩算法综述

极市平台

1+阅读 · 2021年12月3日

何恺明MAE大火之后，想梳理下视觉Transformer？不妨看看这篇综述

何恺明MAE大火之后，想梳理下视觉Transformer？不妨看看这篇综述

PaperWeekly

1+阅读 · 2021年11月26日

强化学习如何提升泛化性？UCL& UC Berkeley最新《深度强化学习泛化性》综述

强化学习如何提升泛化性？UCL& UC Berkeley最新《深度强化学习泛化性》综述

专知

5+阅读 · 2021年11月22日

Swin Transformer升级版来了！30亿参数，刷榜多项视觉任务

Swin Transformer升级版来了！30亿参数，刷榜多项视觉任务

PaperWeekly

0+阅读 · 2021年11月21日

中国科学院、东南大学等联合发表最新的视觉 Transformer 综述

中国科学院、东南大学等联合发表最新的视觉 Transformer 综述

极市平台

6+阅读 · 2021年11月16日

Transformers在计算机视觉概述

Transformers在计算机视觉概述

专知

3+阅读 · 2021年4月18日

深度学习的下一步：Transformer和注意力机制

深度学习的下一步：Transformer和注意力机制

云头条

56+阅读 · 2019年9月14日

图神经网络综述：模型与应用

图神经网络综述：模型与应用

PaperWeekly

198+阅读 · 2018年12月26日

基于深度学习的NLP 32页最新进展综述，190篇参考文献

基于深度学习的NLP 32页最新进展综述，190篇参考文献

人工智能学家

28+阅读 · 2018年12月4日

相关基金

基于神经网络和群体智能的稀疏表示算法研究

国家自然科学基金

1+阅读 · 2014年12月31日

带有Levy跳的随机时滞微分方程的数值解法及稳定性研究

国家自然科学基金

0+阅读 · 2013年12月31日

基于大数据平台的输电网故障诊断架构研究

国家自然科学基金

3+阅读 · 2013年12月31日

基于主动轮廓模型的自然图像分割研究

国家自然科学基金

0+阅读 · 2013年12月31日

基于多源影像的显著性检测及其在图像缩放中的应用

国家自然科学基金

0+阅读 · 2012年12月31日

面向GPU的电力系统电磁暂态并行计算方法研究

国家自然科学基金

0+阅读 · 2012年12月31日

资源导向型对等网络下服务发现与服务组合的研究

国家自然科学基金

1+阅读 · 2012年12月31日

图的若干参数及算法研究

国家自然科学基金

0+阅读 · 2011年12月31日

基于压缩感知的多机器人主动同步定位与地图构建研究

国家自然科学基金

1+阅读 · 2011年12月31日

含控制器的电力系统递阶（结构化）模型研究

国家自然科学基金

0+阅读 · 2010年12月31日

相关论文

Learned Queries for Efficient Local Attention

Arxiv

0+阅读 · 2022年4月19日

Temporally Efficient Vision Transformer for Video Instance Segmentation

Arxiv

0+阅读 · 2022年4月18日

Hierarchical Transformers Are More Efficient Language Models

Arxiv

3+阅读 · 2022年4月16日

A Survey of Visual Transformers

Arxiv

39+阅读 · 2021年11月11日

Large-Scale Deep Learning Optimizations: A Comprehensive Survey

Arxiv

23+阅读 · 2021年11月2日

A Survey of Quantization Methods for Efficient Neural Network Inference

Arxiv

22+阅读 · 2021年6月21日

A Survey of Transformers

Arxiv

103+阅读 · 2021年6月8日

Deep Image Retrieval: A Survey

Arxiv

16+阅读 · 2021年1月27日

A Survey on Visual Transformer

Arxiv

19+阅读 · 2020年12月23日

Efficient Transformers: A Survey

Arxiv

23+阅读 · 2020年9月16日

微信扫码咨询专知VIP会员