【ICML2021】使用Transformers编码的计算感知神经架构 - 专知VIP

会员服务 ·

3

Transformer · 神经架构搜索 · 计算感知神经架构 ·

2021 年 9 月 15 日

【ICML2021】使用Transformers编码的计算感知神经架构

专知会员服务

专知，提供专业可信的知识分发服务，让认知协作更快更好！

近期工作(White et al.， 2020a;Yan et al.， 2020)证明了架构编码在神经架构搜索(NAS)中的重要性。这些编码对神经结构的结构或计算信息进行编码。与结构感知编码相比，计算感知编码以相似的精度映射到同一区域的架构，提高了下游架构搜索性能(Zhang et al., 2019; White et al., 2020a)。在本文中，我们介绍了一种基于计算感知Transformer的编码方法，称为CATE。与现有基于固定变换的计算感知编码(如路径编码)不同，CATE采用了成对的预训练方案，使用交叉注意的transformer来学习计算感知编码。这种学习编码包含神经结构的密集和上下文化计算信息。在小搜索空间和大搜索空间中，我们比较了在三个主要的编码依赖NAS子程序下，CATE和11种编码方式。我们的实验表明，CATE有利于下游搜索，特别是在大的搜索空间中。此外，外部搜索空间实验证明了它在训练所处的搜索空间之外具有优越的泛化能力。

https://arxiv.org/abs/2102.07108

成为VIP会员查看完整内容

18

相关内容

Transformer

Transformer是谷歌发表的论文《Attention Is All You Need》提出一种完全基于Attention的翻译架构

知识荟萃

精品入门和进阶教程、论文和代码整理等

更多

查看相关VIP内容、论文、资讯等

【ICML2021】基于稀疏标签编码的多维分类

专知会员服务

15+阅读 · 2021年9月29日

【ICML2021】通过文本生成统一视觉和语言任务

专知会员服务

19+阅读 · 2021年9月13日

【ICML2021】低秩Sinkhorn 分解

专知会员服务

39+阅读 · 2021年8月20日

【ICML2021】蛋白质语言模型-MSA Transformer

专知会员服务

34+阅读 · 2021年8月16日

【KDD2021】基于神经结构搜索的任务无关与自适应BERT压缩

专知会员服务

9+阅读 · 2021年6月5日

【ICML2021】具有线性复杂度的Transformer的相对位置编码

【ICML2021】具有线性复杂度的Transformer的相对位置编码

专知会员服务

25+阅读 · 2021年5月20日

【ICML2021】有向图网络

专知会员服务

82+阅读 · 2021年5月10日

【CVPR2021】用Transformers无监督预训练进行目标检测

【CVPR2021】用Transformers无监督预训练进行目标检测

专知会员服务

58+阅读 · 2021年3月3日

【ICML2020】最小化验证损失代理来搜索最佳神经网络结构

专知会员服务

24+阅读 · 2020年7月13日

【CVPR2020】用多样性最大化克服单样本NAS中的多模型遗忘

【CVPR2020】用多样性最大化克服单样本NAS中的多模型遗忘

专知会员服务

21+阅读 · 2020年5月16日

Transformer中的相对位置编码

Transformer中的相对位置编码

AINLP

5+阅读 · 2020年11月28日

【ECCV2020-Google】多模态Transformer视频检索，Multi-modal Transformer

【ECCV2020-Google】多模态Transformer视频检索，Multi-modal Transformer

专知

6+阅读 · 2020年7月22日

WWW 2020 开源论文 | 异构图Transformer

WWW 2020 开源论文 | 异构图Transformer

PaperWeekly

13+阅读 · 2020年4月3日

参数少一半，效果还更好，天津大学和微软提出Transformer压缩模型

参数少一半，效果还更好，天津大学和微软提出Transformer压缩模型

机器之心

15+阅读 · 2019年7月13日

进一步改进GPT和BERT：使用Transformer的语言模型

进一步改进GPT和BERT：使用Transformer的语言模型

机器之心

16+阅读 · 2019年5月1日

Transformer-XL：释放注意力模型的潜力

Transformer-XL：释放注意力模型的潜力

谷歌开发者

31+阅读 · 2019年2月19日

CMU、谷歌提出Transformer-XL：学习超长上下文关系

CMU、谷歌提出Transformer-XL：学习超长上下文关系

机器之心

9+阅读 · 2019年1月18日

EMNLP 2018 | 为什么使用自注意力机制？

EMNLP 2018 | 为什么使用自注意力机制？

机器之心

8+阅读 · 2018年9月17日

【泡泡点云时空】PPFNet：三维点鲁棒匹配的全局上下文感知局部特征（CVPR2018-9）

【泡泡点云时空】PPFNet：三维点鲁棒匹配的全局上下文感知局部特征（CVPR2018-9）

泡泡机器人SLAM

11+阅读 · 2018年8月22日

【NAACL 2018】Self-attention考虑相对位置，谷歌Vaswani团队最新工作

【NAACL 2018】Self-attention考虑相对位置，谷歌Vaswani团队最新工作

专知

3+阅读 · 2018年5月25日

Transformer Tracking

Arxiv

17+阅读 · 2021年3月29日

Colorization Transformer

Arxiv

9+阅读 · 2021年2月8日

Confidence-aware Non-repetitive Multimodal Transformers for TextCaps

Arxiv

5+阅读 · 2020年12月7日

How Does BERT Answer Questions? A Layer-Wise Analysis of Transformer Representations

Arxiv

4+阅读 · 2019年9月11日

Language Modeling with Deep Transformers

Arxiv

6+阅读 · 2019年7月11日

Pre-Training with Whole Word Masking for Chinese BERT

Arxiv

11+阅读 · 2019年6月19日

Universal Transformers

Universal Transformers

Arxiv

5+阅读 · 2019年3月5日

Star-Transformer

Star-Transformer

Arxiv

5+阅读 · 2019年2月28日

The Evolved Transformer

The Evolved Transformer

Arxiv

5+阅读 · 2019年1月30日

Question Answering by Reasoning Across Documents with Graph Convolutional Networks

Question Answering by Reasoning Across Documents with Graph Convolutional Networks

Arxiv

4+阅读 · 2018年8月29日

VIP会员

相关主题

神经架构搜索

计算感知神经架构

相关VIP内容

【ICML2021】基于稀疏标签编码的多维分类

专知会员服务

15+阅读 · 2021年9月29日

【ICML2021】通过文本生成统一视觉和语言任务

专知会员服务

19+阅读 · 2021年9月13日

【ICML2021】低秩Sinkhorn 分解

专知会员服务

39+阅读 · 2021年8月20日

【ICML2021】蛋白质语言模型-MSA Transformer

专知会员服务

34+阅读 · 2021年8月16日

【KDD2021】基于神经结构搜索的任务无关与自适应BERT压缩

专知会员服务

9+阅读 · 2021年6月5日

【ICML2021】具有线性复杂度的Transformer的相对位置编码

【ICML2021】具有线性复杂度的Transformer的相对位置编码

专知会员服务

25+阅读 · 2021年5月20日

【ICML2021】有向图网络

专知会员服务

82+阅读 · 2021年5月10日

【CVPR2021】用Transformers无监督预训练进行目标检测

【CVPR2021】用Transformers无监督预训练进行目标检测

专知会员服务

58+阅读 · 2021年3月3日

【ICML2020】最小化验证损失代理来搜索最佳神经网络结构

专知会员服务

24+阅读 · 2020年7月13日

【CVPR2020】用多样性最大化克服单样本NAS中的多模型遗忘

【CVPR2020】用多样性最大化克服单样本NAS中的多模型遗忘

专知会员服务

21+阅读 · 2020年5月16日

热门VIP内容

开通专知VIP会员享更多权益服务

《复杂工程系统模型驱动设计决策支持系统：早期设计阶段挑战》最新138页

《日本陆上自卫队2040年作战方式与未来作战研究》最新23页slides

人工智能作为战争武器

《后勤保障》最新23页

相关资讯

Transformer中的相对位置编码

Transformer中的相对位置编码

AINLP

5+阅读 · 2020年11月28日

【ECCV2020-Google】多模态Transformer视频检索，Multi-modal Transformer

【ECCV2020-Google】多模态Transformer视频检索，Multi-modal Transformer

专知

6+阅读 · 2020年7月22日

WWW 2020 开源论文 | 异构图Transformer

WWW 2020 开源论文 | 异构图Transformer

PaperWeekly

13+阅读 · 2020年4月3日

参数少一半，效果还更好，天津大学和微软提出Transformer压缩模型

参数少一半，效果还更好，天津大学和微软提出Transformer压缩模型

机器之心

15+阅读 · 2019年7月13日

进一步改进GPT和BERT：使用Transformer的语言模型

进一步改进GPT和BERT：使用Transformer的语言模型

机器之心

16+阅读 · 2019年5月1日

Transformer-XL：释放注意力模型的潜力

Transformer-XL：释放注意力模型的潜力

谷歌开发者

31+阅读 · 2019年2月19日

CMU、谷歌提出Transformer-XL：学习超长上下文关系

CMU、谷歌提出Transformer-XL：学习超长上下文关系

机器之心

9+阅读 · 2019年1月18日

EMNLP 2018 | 为什么使用自注意力机制？

EMNLP 2018 | 为什么使用自注意力机制？

机器之心

8+阅读 · 2018年9月17日

【泡泡点云时空】PPFNet：三维点鲁棒匹配的全局上下文感知局部特征（CVPR2018-9）

【泡泡点云时空】PPFNet：三维点鲁棒匹配的全局上下文感知局部特征（CVPR2018-9）

泡泡机器人SLAM

11+阅读 · 2018年8月22日

【NAACL 2018】Self-attention考虑相对位置，谷歌Vaswani团队最新工作

【NAACL 2018】Self-attention考虑相对位置，谷歌Vaswani团队最新工作

专知

3+阅读 · 2018年5月25日

相关论文

Transformer Tracking

Arxiv

17+阅读 · 2021年3月29日

Colorization Transformer

Arxiv

9+阅读 · 2021年2月8日

Confidence-aware Non-repetitive Multimodal Transformers for TextCaps

Arxiv

5+阅读 · 2020年12月7日

How Does BERT Answer Questions? A Layer-Wise Analysis of Transformer Representations

Arxiv

4+阅读 · 2019年9月11日

Language Modeling with Deep Transformers

Arxiv

6+阅读 · 2019年7月11日

Pre-Training with Whole Word Masking for Chinese BERT

Arxiv

11+阅读 · 2019年6月19日

Universal Transformers

Universal Transformers

Arxiv

5+阅读 · 2019年3月5日

Star-Transformer

Star-Transformer

Arxiv

5+阅读 · 2019年2月28日

The Evolved Transformer

The Evolved Transformer

Arxiv

5+阅读 · 2019年1月30日

Question Answering by Reasoning Across Documents with Graph Convolutional Networks

Question Answering by Reasoning Across Documents with Graph Convolutional Networks

Arxiv

4+阅读 · 2018年8月29日

微信扫码咨询专知VIP会员