【ECCV2022】UniNet:具有卷积、Transformer和MLP的统一架构搜索 - 专知

会员服务 ·

0

【ECCV2022】UniNet:具有卷积、Transformer和MLP的统一架构搜索

2022 年 7 月 15 日 专知

近年来，transformer和多层感知器(MLP)架构在各种视觉任务中取得了令人印象深刻的成果。然而，如何有效地将这些运算符组合在一起，形成高性能的混合视觉架构仍然是一个挑战。在这项工作中，我们通过提出一种新的统一架构搜索方法来研究卷积、transformer和MLP的可学习组合。我们的方法包含两个关键设计来实现对高性能网络的搜索。首先，我们以统一的形式对不同的可搜索运算符进行建模，从而使这些运算符可以用相同的一组配置参数来表征。这样，整体搜索空间的大小大大降低，总搜索成本变得可以承受。其次，我们提出了上下文感知下采样模块(DSMs)，以减轻不同类型操作之间的差距。我们提出的DSM能够更好地适应不同类型运算符的特征，这对于识别高性能混合架构非常重要。最后，我们将可配置算子和DSM集成到一个统一的搜索空间中，并使用基于强化学习的搜索算法进行搜索，以充分探索这些算子的最优组合。为此，我们搜索了一个基线网络，并将其扩大，得到了一个名为UniNets的模型家族，它比以前的ConvNets和transformer取得了更好的精度和效率。特别地，我们的UniNet-B5在ImageNet上实现了84.9%的top-1准确率，比efficient - net - b7和BoTNet-T7分别减少了44%和55%的失败。通过在ImageNet-21K上进行预训练，我们的UniNet-B6达到87.4%，性能优于Swin-L，失败次数减少51%，参数减少41%。代码可以在https://github.com/Sense-X/UniNet上找到。

专知便捷查看

便捷下载，请关注专知公众号（点击上方蓝色专知关注）

后台回复“UNET” 就可以获取《【ECCV2022】UniNet:具有卷积、Transformer和MLP的统一架构搜索》专知下载链接

专知，专业可信的人工智能知识分发 ，让认知协作更快更好！欢迎注册登录专知www.zhuanzhi.ai，获取100000+AI(AI与军事、医药、公安等)主题干货知识资料！

欢迎微信扫一扫加入专知人工智能知识星球群，获取最新AI专业干货知识教程资料和与专家交流咨询！

点击“ 阅读原文 ”，了解使用专知 ，查看获取100000+AI主题知识资料

登录查看更多

0

相关内容

Transformer

Transformer是谷歌发表的论文《Attention Is All You Need》提出一种完全基于Attention的翻译架构

知识荟萃

精品入门和进阶教程、论文和代码整理等

更多

查看相关VIP内容、论文、资讯等

【KDD2022】掩码与推理: 用于复杂逻辑查询的预训练知识图谱Transformers

【KDD2022】掩码与推理: 用于复杂逻辑查询的预训练知识图谱Transformers

专知会员服务

29+阅读 · 2022年8月12日

【ICML2022】在线决策Transformer

【ICML2022】在线决策Transformer

专知会员服务

34+阅读 · 2022年7月27日

【Google AI-Yi Tay】Transformer记忆为可微搜索索引”(DSI)

【Google AI-Yi Tay】Transformer记忆为可微搜索索引”(DSI)

专知会员服务

10+阅读 · 2022年3月4日

【ICML2021】使用Transformers编码的计算感知神经架构

专知会员服务

18+阅读 · 2021年9月15日

【KDD2021】用NAS实现任务无关且可动态调整尺寸的BERT压缩

【KDD2021】用NAS实现任务无关且可动态调整尺寸的BERT压缩

专知会员服务

17+阅读 · 2021年9月2日

【ICML2021】蛋白质语言模型-MSA Transformer

专知会员服务

34+阅读 · 2021年8月16日

【ICCV2021】用图神经网络提取整体知识

专知会员服务

27+阅读 · 2021年8月13日

【AAAI2021】时间关系建模与自监督的动作分割

【AAAI2021】时间关系建模与自监督的动作分割

专知会员服务

37+阅读 · 2021年1月24日

注意力图神经网络的多标签文本分类

注意力图神经网络的多标签文本分类

专知会员服务

112+阅读 · 2020年3月28日

重磅！Geoffrey Hinton新论文「视觉表示对比学习简单框架」自监督学习建立新SOTA-ImageNet准确率76.5%

重磅！Geoffrey Hinton新论文「视觉表示对比学习简单框架」自监督学习建立新SOTA-ImageNet准确率76.5%

专知会员服务

33+阅读 · 2020年2月15日

【ECCV2022】用于视频问题回答的视频图Transformer

【ECCV2022】用于视频问题回答的视频图Transformer

专知

0+阅读 · 2022年8月3日

【KDD2022】自监督超图Transformer推荐系统

【KDD2022】自监督超图Transformer推荐系统

专知

1+阅读 · 2022年8月1日

【ICML2022】时序自监督视频transformer

【ICML2022】时序自监督视频transformer

专知

1+阅读 · 2022年7月28日

【ICML2022】在线决策Transformer

【ICML2022】在线决策Transformer

专知

2+阅读 · 2022年7月27日

【ICML2022】Branchformer:并行MLP-Attention架构，捕捉局部和全局上下文，用于语音识别和理解

【ICML2022】Branchformer:并行MLP-Attention架构，捕捉局部和全局上下文，用于语音识别和理解

专知

0+阅读 · 2022年7月8日

图时卷积神经网络:架构与理论分析

图时卷积神经网络:架构与理论分析

专知

0+阅读 · 2022年7月3日

【ICLR2022】Vision Transformer 模型工作机制的最新理论

【ICLR2022】Vision Transformer 模型工作机制的最新理论

专知

0+阅读 · 2022年2月19日

用Transformer大一统ML模型，特斯拉AI总监Karpathy发推感叹AI融合趋势

用Transformer大一统ML模型，特斯拉AI总监Karpathy发推感叹AI融合趋势

专知

0+阅读 · 2021年12月9日

【NeurIPS 2021】寻找视觉Transformer的搜索空间

【NeurIPS 2021】寻找视觉Transformer的搜索空间

专知

0+阅读 · 2021年12月1日

把Transformer结构剪成ResNet结构！新的MSA和卷积操作之间的权重共享方案

把Transformer结构剪成ResNet结构！新的MSA和卷积操作之间的权重共享方案

极市平台

3+阅读 · 2021年11月28日

深度低秩的结构-纹理图像分割模型和算法研究

国家自然科学基金

0+阅读 · 2014年12月31日

高性能基准源架构及设计方法研究

国家自然科学基金

0+阅读 · 2013年12月31日

基于Wiki的垂直搜索语义技术研究

国家自然科学基金

0+阅读 · 2012年12月31日

移动对象数据库中海量时空轨迹数据压缩方法研究

国家自然科学基金

0+阅读 · 2012年12月31日

带有资源依赖学习效应的多模态项目调度交互式群智能方法

国家自然科学基金

0+阅读 · 2012年12月31日

基于二维随机映射和一范数优化的有监督图像分类研究

国家自然科学基金

3+阅读 · 2011年12月31日

基于非线性搜索的量子神经计算模型研究

国家自然科学基金

0+阅读 · 2010年12月31日

基于SoC的智能感知节点关键技术的研究

国家自然科学基金

0+阅读 · 2010年12月31日

网络的结构性质及拓扑参数研究

国家自然科学基金

1+阅读 · 2009年12月31日

线性分组码的构造及其译码算法

国家自然科学基金

0+阅读 · 2009年12月31日

Analysis of Quantization on MLP-based Vision Models

Arxiv

0+阅读 · 2022年9月14日

UniNet: Unified Architecture Search with Convolution, Transformer, and MLP

Arxiv

0+阅读 · 2022年9月12日

TokenMix: Rethinking Image Mixing for Data Augmentation in Vision Transformers

Arxiv

0+阅读 · 2022年9月12日

MaxViT: Multi-Axis Vision Transformer

Arxiv

0+阅读 · 2022年9月9日

A Survey on Vision Transformer

Arxiv

17+阅读 · 2022年2月23日

A Battle of Network Structures: An Empirical Study of CNN, Transformer, and MLP

Arxiv

12+阅读 · 2021年8月30日

Pay Attention to MLPs

Arxiv

28+阅读 · 2021年5月17日

Transformer Tracking

Arxiv

17+阅读 · 2021年3月29日

Graph Transformer Networks

Arxiv

15+阅读 · 2020年2月5日

SlowFast Networks for Video Recognition

SlowFast Networks for Video Recognition

Arxiv

19+阅读 · 2018年12月10日

VIP会员

相关主题

高性能网络

相关VIP内容

【KDD2022】掩码与推理: 用于复杂逻辑查询的预训练知识图谱Transformers

【KDD2022】掩码与推理: 用于复杂逻辑查询的预训练知识图谱Transformers

专知会员服务

29+阅读 · 2022年8月12日

【ICML2022】在线决策Transformer

【ICML2022】在线决策Transformer

专知会员服务

34+阅读 · 2022年7月27日

【Google AI-Yi Tay】Transformer记忆为可微搜索索引”(DSI)

【Google AI-Yi Tay】Transformer记忆为可微搜索索引”(DSI)

专知会员服务

10+阅读 · 2022年3月4日

【ICML2021】使用Transformers编码的计算感知神经架构

专知会员服务

18+阅读 · 2021年9月15日

【KDD2021】用NAS实现任务无关且可动态调整尺寸的BERT压缩

【KDD2021】用NAS实现任务无关且可动态调整尺寸的BERT压缩

专知会员服务

17+阅读 · 2021年9月2日

【ICML2021】蛋白质语言模型-MSA Transformer

专知会员服务

34+阅读 · 2021年8月16日

【ICCV2021】用图神经网络提取整体知识

专知会员服务

27+阅读 · 2021年8月13日

【AAAI2021】时间关系建模与自监督的动作分割

【AAAI2021】时间关系建模与自监督的动作分割

专知会员服务

37+阅读 · 2021年1月24日

注意力图神经网络的多标签文本分类

注意力图神经网络的多标签文本分类

专知会员服务

112+阅读 · 2020年3月28日

重磅！Geoffrey Hinton新论文「视觉表示对比学习简单框架」自监督学习建立新SOTA-ImageNet准确率76.5%

重磅！Geoffrey Hinton新论文「视觉表示对比学习简单框架」自监督学习建立新SOTA-ImageNet准确率76.5%

专知会员服务

33+阅读 · 2020年2月15日

热门VIP内容

开通专知VIP会员享更多权益服务

《乌克兰无人机产业：志愿者与政策在构建新兴无人机产业中的协同作用》最新报告

《人工智能辅助决策中的数据可视化：系统性综述》

人工智能驱动弹药制造现代化：美国陆军转型之路

《敏捷作战部署中枢纽-辐条基地选址优化研究》80页

相关资讯

【ECCV2022】用于视频问题回答的视频图Transformer

【ECCV2022】用于视频问题回答的视频图Transformer

专知

0+阅读 · 2022年8月3日

【KDD2022】自监督超图Transformer推荐系统

【KDD2022】自监督超图Transformer推荐系统

专知

1+阅读 · 2022年8月1日

【ICML2022】时序自监督视频transformer

【ICML2022】时序自监督视频transformer

专知

1+阅读 · 2022年7月28日

【ICML2022】在线决策Transformer

【ICML2022】在线决策Transformer

专知

2+阅读 · 2022年7月27日

【ICML2022】Branchformer:并行MLP-Attention架构，捕捉局部和全局上下文，用于语音识别和理解

【ICML2022】Branchformer:并行MLP-Attention架构，捕捉局部和全局上下文，用于语音识别和理解

专知

0+阅读 · 2022年7月8日

图时卷积神经网络:架构与理论分析

图时卷积神经网络:架构与理论分析

专知

0+阅读 · 2022年7月3日

【ICLR2022】Vision Transformer 模型工作机制的最新理论

【ICLR2022】Vision Transformer 模型工作机制的最新理论

专知

0+阅读 · 2022年2月19日

用Transformer大一统ML模型，特斯拉AI总监Karpathy发推感叹AI融合趋势

用Transformer大一统ML模型，特斯拉AI总监Karpathy发推感叹AI融合趋势

专知

0+阅读 · 2021年12月9日

【NeurIPS 2021】寻找视觉Transformer的搜索空间

【NeurIPS 2021】寻找视觉Transformer的搜索空间

专知

0+阅读 · 2021年12月1日

把Transformer结构剪成ResNet结构！新的MSA和卷积操作之间的权重共享方案

把Transformer结构剪成ResNet结构！新的MSA和卷积操作之间的权重共享方案

极市平台

3+阅读 · 2021年11月28日

相关基金

深度低秩的结构-纹理图像分割模型和算法研究

国家自然科学基金

0+阅读 · 2014年12月31日

高性能基准源架构及设计方法研究

国家自然科学基金

0+阅读 · 2013年12月31日

基于Wiki的垂直搜索语义技术研究

国家自然科学基金

0+阅读 · 2012年12月31日

移动对象数据库中海量时空轨迹数据压缩方法研究

国家自然科学基金

0+阅读 · 2012年12月31日

带有资源依赖学习效应的多模态项目调度交互式群智能方法

国家自然科学基金

0+阅读 · 2012年12月31日

基于二维随机映射和一范数优化的有监督图像分类研究

国家自然科学基金

3+阅读 · 2011年12月31日

基于非线性搜索的量子神经计算模型研究

国家自然科学基金

0+阅读 · 2010年12月31日

基于SoC的智能感知节点关键技术的研究

国家自然科学基金

0+阅读 · 2010年12月31日

网络的结构性质及拓扑参数研究

国家自然科学基金

1+阅读 · 2009年12月31日

线性分组码的构造及其译码算法

国家自然科学基金

0+阅读 · 2009年12月31日

相关论文

Analysis of Quantization on MLP-based Vision Models

Arxiv

0+阅读 · 2022年9月14日

UniNet: Unified Architecture Search with Convolution, Transformer, and MLP

Arxiv

0+阅读 · 2022年9月12日

TokenMix: Rethinking Image Mixing for Data Augmentation in Vision Transformers

Arxiv

0+阅读 · 2022年9月12日

MaxViT: Multi-Axis Vision Transformer

Arxiv

0+阅读 · 2022年9月9日

A Survey on Vision Transformer

Arxiv

17+阅读 · 2022年2月23日

A Battle of Network Structures: An Empirical Study of CNN, Transformer, and MLP

Arxiv

12+阅读 · 2021年8月30日

Pay Attention to MLPs

Arxiv

28+阅读 · 2021年5月17日

Transformer Tracking

Arxiv

17+阅读 · 2021年3月29日

Graph Transformer Networks

Arxiv

15+阅读 · 2020年2月5日

SlowFast Networks for Video Recognition

SlowFast Networks for Video Recognition

Arxiv

19+阅读 · 2018年12月10日

大家都在搜

CMU博士论文

无人机集群

软件无线电

再见，TD-SCDMA！

微信扫码咨询专知VIP会员