文链接:https://arxiv.org/pdf/2009.14794.pdf

Performer 使用一个高效的(线性)广义注意力框架(generalized attention framework),允许基于不同相似性度量(核)的一类广泛的注意力机制。该框架通过谷歌的新算法 FAVOR+( Fast Attention Via Positive Orthogonal Random Features)来实现,后者能够提供注意力机制的可扩展低方差、无偏估计,这可以通过随机特征图分解(常规 softmax-attention)来表达。该方法在保持线性空间和时间复杂度的同时准确率也很有保证,也可以应用到独立的 softmax 运算。此外,该方法还可以和可逆层等其他技术进行互操作。

研究者表示,他们相信该研究为注意力、Transformer 架构和核方法提供了一种新的思维方式。

代码地址:https://github.com/google-research/google-research/tree/master/performer

论文公布之后,Youtube 知名深度学习频道 Yannic Kilcher 对该文章进行了解读。

成为VIP会员查看完整内容
36

相关内容

Transformer是谷歌发表的论文《Attention Is All You Need》提出一种完全基于Attention的翻译架构

知识荟萃

精品入门和进阶教程、论文和代码整理等

更多

查看相关VIP内容、论文、资讯等
专知会员服务
39+阅读 · 2020年9月3日
【IJCAI2020南大】上下文在神经机器翻译中的充分利用
专知会员服务
15+阅读 · 2020年8月17日
基于多头注意力胶囊网络的文本分类模型
专知会员服务
72+阅读 · 2020年5月24日
【ACL2020-Google】逆向工程配置的神经文本生成模型
专知会员服务
16+阅读 · 2020年4月20日
专知会员服务
25+阅读 · 2020年2月15日
【NeurIPS2019】图变换网络:Graph Transformer Network
专知会员服务
104+阅读 · 2019年11月25日
注意力机制模型最新综述
专知会员服务
232+阅读 · 2019年10月20日
英伟达Faster Transformer:作者带你揭秘BERT优化
机器之心
12+阅读 · 2019年9月18日
一文详解Google最新NLP模型XLNet
PaperWeekly
17+阅读 · 2019年7月1日
20项任务全面碾压BERT,全新XLNet预训练模型
机器学习算法与Python学习
15+阅读 · 2019年6月20日
进一步改进GPT和BERT:使用Transformer的语言模型
机器之心
14+阅读 · 2019年5月1日
NLP预训练模型大集合!
黑龙江大学自然语言处理实验室
5+阅读 · 2018年12月31日
Arxiv
2+阅读 · 2020年12月2日
Arxiv
3+阅读 · 2020年9月30日
Arxiv
5+阅读 · 2019年7月11日
Hardness-Aware Deep Metric Learning
Arxiv
6+阅读 · 2019年3月13日
Universal Transformers
Arxiv
5+阅读 · 2019年3月5日
Music Transformer
Arxiv
5+阅读 · 2018年12月12日
Doubly Attentive Transformer Machine Translation
Arxiv
4+阅读 · 2018年7月30日
VIP会员
相关VIP内容
专知会员服务
39+阅读 · 2020年9月3日
【IJCAI2020南大】上下文在神经机器翻译中的充分利用
专知会员服务
15+阅读 · 2020年8月17日
基于多头注意力胶囊网络的文本分类模型
专知会员服务
72+阅读 · 2020年5月24日
【ACL2020-Google】逆向工程配置的神经文本生成模型
专知会员服务
16+阅读 · 2020年4月20日
专知会员服务
25+阅读 · 2020年2月15日
【NeurIPS2019】图变换网络:Graph Transformer Network
专知会员服务
104+阅读 · 2019年11月25日
注意力机制模型最新综述
专知会员服务
232+阅读 · 2019年10月20日
相关资讯
英伟达Faster Transformer:作者带你揭秘BERT优化
机器之心
12+阅读 · 2019年9月18日
一文详解Google最新NLP模型XLNet
PaperWeekly
17+阅读 · 2019年7月1日
20项任务全面碾压BERT,全新XLNet预训练模型
机器学习算法与Python学习
15+阅读 · 2019年6月20日
进一步改进GPT和BERT:使用Transformer的语言模型
机器之心
14+阅读 · 2019年5月1日
NLP预训练模型大集合!
黑龙江大学自然语言处理实验室
5+阅读 · 2018年12月31日
相关论文
Arxiv
2+阅读 · 2020年12月2日
Arxiv
3+阅读 · 2020年9月30日
Arxiv
5+阅读 · 2019年7月11日
Hardness-Aware Deep Metric Learning
Arxiv
6+阅读 · 2019年3月13日
Universal Transformers
Arxiv
5+阅读 · 2019年3月5日
Music Transformer
Arxiv
5+阅读 · 2018年12月12日
Doubly Attentive Transformer Machine Translation
Arxiv
4+阅读 · 2018年7月30日
微信扫码咨询专知VIP会员