【ECCV2022】UniNet:具有卷积、Transformer和MLP的统一架构搜索 - 专知VIP

会员服务 ·

9

Transformer · ECCV 2022 · 多层感知器 · 计算机视觉 ·

2022 年 7 月 15 日

【ECCV2022】UniNet:具有卷积、Transformer和MLP的统一架构搜索

专知会员服务

专知，提供专业可信的知识分发服务，让认知协作更快更好！

近年来，transformer和多层感知器(MLP)架构在各种视觉任务中取得了令人印象深刻的成果。然而，如何有效地将这些运算符组合在一起，形成高性能的混合视觉架构仍然是一个挑战。在这项工作中，我们通过提出一种新的统一架构搜索方法来研究卷积、transformer和MLP的可学习组合。我们的方法包含两个关键设计来实现对高性能网络的搜索。首先，我们以统一的形式对不同的可搜索运算符进行建模，从而使这些运算符可以用相同的一组配置参数来表征。这样，整体搜索空间的大小大大降低，总搜索成本变得可以承受。其次，我们提出了上下文感知下采样模块(DSMs)，以减轻不同类型操作之间的差距。我们提出的DSM能够更好地适应不同类型运算符的特征，这对于识别高性能混合架构非常重要。最后，我们将可配置算子和DSM集成到一个统一的搜索空间中，并使用基于强化学习的搜索算法进行搜索，以充分探索这些算子的最优组合。为此，我们搜索了一个基线网络，并将其扩大，得到了一个名为UniNets的模型家族，它比以前的ConvNets和transformer取得了更好的精度和效率。特别地，我们的UniNet-B5在ImageNet上实现了84.9%的top-1准确率，比efficient - net - b7和BoTNet-T7分别减少了44%和55%的失败。通过在ImageNet-21K上进行预训练，我们的UniNet-B6达到87.4%，性能优于Swin-L，失败次数减少51%，参数减少41%。代码可以在https://github.com/Sense-X/UniNet上找到。

成为VIP会员查看完整内容

30

相关内容

Transformer

Transformer是谷歌发表的论文《Attention Is All You Need》提出一种完全基于Attention的翻译架构

知识荟萃

精品入门和进阶教程、论文和代码整理等

更多

查看相关VIP内容、论文、资讯等

【ICML2022】CtrlFormer: 通过Transformer学习视觉控制的可迁移状态表示

【ICML2022】CtrlFormer: 通过Transformer学习视觉控制的可迁移状态表示

专知会员服务

16+阅读 · 2022年6月21日

【CVPR 2022】NUS&字节跳动提出Shunted Transformer：多尺度Token叠加

【CVPR 2022】NUS&字节跳动提出Shunted Transformer：多尺度Token叠加

专知会员服务

16+阅读 · 2022年4月8日

13个经典CNN架构比较分析！从AlexNet到ResNet再到ConvNeXt

13个经典CNN架构比较分析！从AlexNet到ResNet再到ConvNeXt

专知会员服务

102+阅读 · 2022年3月14日

【ICLR2022】UniFormer：无缝集成 Transformer，更高效的时空表征学习框架

【ICLR2022】UniFormer：无缝集成 Transformer，更高效的时空表征学习框架

专知会员服务

50+阅读 · 2022年2月16日

【ICLR2022】通过传播网络编码学习通用的神经结构

【ICLR2022】通过传播网络编码学习通用的神经结构

专知会员服务

13+阅读 · 2022年2月13日

清华大学提出ACmix | 这才是Self-Attention与CNN正确的融合范式，性能速度全面提升

清华大学提出ACmix | 这才是Self-Attention与CNN正确的融合范式，性能速度全面提升

专知会员服务

27+阅读 · 2021年12月3日

【ICML2021】使用Transformers编码的计算感知神经架构

专知会员服务

18+阅读 · 2021年9月15日

【CVPR2021】动态区域注意卷积

专知会员服务

21+阅读 · 2021年4月2日

【AAAI2021】双级协作变换器Transformer图像描述生成

【AAAI2021】双级协作变换器Transformer图像描述生成

专知会员服务

27+阅读 · 2021年1月26日

无需额外数据、Tricks、架构调整，CMU开源首个将ResNet50精度提升至80%+新方法

无需额外数据、Tricks、架构调整，CMU开源首个将ResNet50精度提升至80%+新方法

专知会员服务

14+阅读 · 2020年9月20日

又快又强的轻量化主干来了！EfficientFormer：在iPhone上能实时推理的ViT模型

又快又强的轻量化主干来了！EfficientFormer：在iPhone上能实时推理的ViT模型

CVer

1+阅读 · 2022年6月5日

CVPR 2022 | 华中科大&腾讯开源TopFormer：用于移动语义分割的Transformer

CVPR 2022 | 华中科大&腾讯开源TopFormer：用于移动语义分割的Transformer

CVer

1+阅读 · 2022年4月17日

TopFormer：打造Arm端实时分割与检测模型，完美超越MobileNet!

TopFormer：打造Arm端实时分割与检测模型，完美超越MobileNet!

极市平台

2+阅读 · 2022年4月13日

CVPR 2022 | Mobile-Former来了！微软提出：MobileNet+Transformer轻量化并行网络

CVPR 2022 | Mobile-Former来了！微软提出：MobileNet+Transformer轻量化并行网络

极市平台

0+阅读 · 2022年4月4日

选哪一个？13个经典CNN架构比较分析！从AlexNet到ResNet再到ConvNeXt

选哪一个？13个经典CNN架构比较分析！从AlexNet到ResNet再到ConvNeXt

专知

4+阅读 · 2022年3月14日

CVPR 2022 | 超越Transformer！FAIR重新设计纯卷积架构：ConvNeXt

CVPR 2022 | 超越Transformer！FAIR重新设计纯卷积架构：ConvNeXt

CVer

1+阅读 · 2022年3月5日

超越Swin！MoA-Transformer：将全局特征聚合到视觉Transformer

超越Swin！MoA-Transformer：将全局特征聚合到视觉Transformer

CVer

2+阅读 · 2022年2月8日

全面超越Swin Transformer ！Facebook用ResNet思想升级多尺度视觉Transformer

全面超越Swin Transformer ！Facebook用ResNet思想升级多尺度视觉Transformer

极市平台

0+阅读 · 2021年12月6日

把Transformer结构剪成ResNet结构！新的MSA和卷积操作之间的权重共享方案

把Transformer结构剪成ResNet结构！新的MSA和卷积操作之间的权重共享方案

极市平台

3+阅读 · 2021年11月28日

神操作！RM让ResNet等价转换为Plain架构

神操作！RM让ResNet等价转换为Plain架构

极市平台

0+阅读 · 2021年11月6日

e-Learner认知效率建模及自适应调整方法研究

国家自然科学基金

0+阅读 · 2014年12月31日

异构多核体系结构的能效优化关键技术研究

国家自然科学基金

0+阅读 · 2014年12月31日

遥感图像融合方法的几何性能研究

国家自然科学基金

1+阅读 · 2013年12月31日

网络多媒体流QoS特征稀疏表示及柔性跨域映射方法研究

国家自然科学基金

0+阅读 · 2013年12月31日

跨语图像检索中融合视觉信息的多语翻译与集成方法研究

国家自然科学基金

2+阅读 · 2013年12月31日

异构通信网络中的空域非对称干扰对齐技术研究

国家自然科学基金

0+阅读 · 2012年12月31日

基于视觉显著性结构的特征提取和图像检索

国家自然科学基金

0+阅读 · 2012年12月31日

面向光网络灵活控制的软定制理论与实现机理研究

国家自然科学基金

0+阅读 · 2012年12月31日

高效能自适应处理器体系结构关键技术研究

国家自然科学基金

0+阅读 · 2011年12月31日

一种全新的动态网络行为认知模型及其在异构网络资源分配中的应用

国家自然科学基金

0+阅读 · 2009年12月31日

Q-learning Decision Transformer: Leveraging Dynamic Programming for Conditional Sequence Modelling in Offline RL

Arxiv

0+阅读 · 2022年9月8日

Frame-Subtitle Self-Supervision for Multi-Modal Video Question Answering

Arxiv

0+阅读 · 2022年9月8日

Spatial-Temporal Transformer for Video Snapshot Compressive Imaging

Arxiv

0+阅读 · 2022年9月8日

Global Context Vision Transformers

Arxiv

0+阅读 · 2022年9月7日

Transformers are Meta-Reinforcement Learners

Arxiv

15+阅读 · 2022年6月14日

EDTER: Edge Detection with Transformer

Arxiv

11+阅读 · 2022年3月16日

A Battle of Network Structures: An Empirical Study of CNN, Transformer, and MLP

Arxiv

12+阅读 · 2021年8月30日

SiT: Self-supervised vIsion Transformer

Arxiv

19+阅读 · 2021年4月8日

Transformer Tracking

Arxiv

17+阅读 · 2021年3月29日

End-to-End Dense Video Captioning with Masked Transformer

Arxiv

14+阅读 · 2018年4月3日

VIP会员

相关主题

多层感知器

计算机视觉

相关VIP内容

【ICML2022】CtrlFormer: 通过Transformer学习视觉控制的可迁移状态表示

【ICML2022】CtrlFormer: 通过Transformer学习视觉控制的可迁移状态表示

专知会员服务

16+阅读 · 2022年6月21日

【CVPR 2022】NUS&字节跳动提出Shunted Transformer：多尺度Token叠加

【CVPR 2022】NUS&字节跳动提出Shunted Transformer：多尺度Token叠加

专知会员服务

16+阅读 · 2022年4月8日

13个经典CNN架构比较分析！从AlexNet到ResNet再到ConvNeXt

13个经典CNN架构比较分析！从AlexNet到ResNet再到ConvNeXt

专知会员服务

102+阅读 · 2022年3月14日

【ICLR2022】UniFormer：无缝集成 Transformer，更高效的时空表征学习框架

【ICLR2022】UniFormer：无缝集成 Transformer，更高效的时空表征学习框架

专知会员服务

50+阅读 · 2022年2月16日

【ICLR2022】通过传播网络编码学习通用的神经结构

【ICLR2022】通过传播网络编码学习通用的神经结构

专知会员服务

13+阅读 · 2022年2月13日

清华大学提出ACmix | 这才是Self-Attention与CNN正确的融合范式，性能速度全面提升

清华大学提出ACmix | 这才是Self-Attention与CNN正确的融合范式，性能速度全面提升

专知会员服务

27+阅读 · 2021年12月3日

【ICML2021】使用Transformers编码的计算感知神经架构

专知会员服务

18+阅读 · 2021年9月15日

【CVPR2021】动态区域注意卷积

专知会员服务

21+阅读 · 2021年4月2日

【AAAI2021】双级协作变换器Transformer图像描述生成

【AAAI2021】双级协作变换器Transformer图像描述生成

专知会员服务

27+阅读 · 2021年1月26日

无需额外数据、Tricks、架构调整，CMU开源首个将ResNet50精度提升至80%+新方法

无需额外数据、Tricks、架构调整，CMU开源首个将ResNet50精度提升至80%+新方法

专知会员服务

14+阅读 · 2020年9月20日

热门VIP内容

开通专知VIP会员享更多权益服务

【伯克利博士论文】通过真实世界实践赋能机器人自主性

军用无人机集群技术尚未成熟——但潜力可期

人工智能安全治理白皮书（2025）

AgentOps综述：分类、挑战与未来方向

相关资讯

又快又强的轻量化主干来了！EfficientFormer：在iPhone上能实时推理的ViT模型

又快又强的轻量化主干来了！EfficientFormer：在iPhone上能实时推理的ViT模型

CVer

1+阅读 · 2022年6月5日

CVPR 2022 | 华中科大&腾讯开源TopFormer：用于移动语义分割的Transformer

CVPR 2022 | 华中科大&腾讯开源TopFormer：用于移动语义分割的Transformer

CVer

1+阅读 · 2022年4月17日

TopFormer：打造Arm端实时分割与检测模型，完美超越MobileNet!

TopFormer：打造Arm端实时分割与检测模型，完美超越MobileNet!

极市平台

2+阅读 · 2022年4月13日

CVPR 2022 | Mobile-Former来了！微软提出：MobileNet+Transformer轻量化并行网络

CVPR 2022 | Mobile-Former来了！微软提出：MobileNet+Transformer轻量化并行网络

极市平台

0+阅读 · 2022年4月4日

选哪一个？13个经典CNN架构比较分析！从AlexNet到ResNet再到ConvNeXt

选哪一个？13个经典CNN架构比较分析！从AlexNet到ResNet再到ConvNeXt

专知

4+阅读 · 2022年3月14日

CVPR 2022 | 超越Transformer！FAIR重新设计纯卷积架构：ConvNeXt

CVPR 2022 | 超越Transformer！FAIR重新设计纯卷积架构：ConvNeXt

CVer

1+阅读 · 2022年3月5日

超越Swin！MoA-Transformer：将全局特征聚合到视觉Transformer

超越Swin！MoA-Transformer：将全局特征聚合到视觉Transformer

CVer

2+阅读 · 2022年2月8日

全面超越Swin Transformer ！Facebook用ResNet思想升级多尺度视觉Transformer

全面超越Swin Transformer ！Facebook用ResNet思想升级多尺度视觉Transformer

极市平台

0+阅读 · 2021年12月6日

把Transformer结构剪成ResNet结构！新的MSA和卷积操作之间的权重共享方案

把Transformer结构剪成ResNet结构！新的MSA和卷积操作之间的权重共享方案

极市平台

3+阅读 · 2021年11月28日

神操作！RM让ResNet等价转换为Plain架构

神操作！RM让ResNet等价转换为Plain架构

极市平台

0+阅读 · 2021年11月6日

相关基金

e-Learner认知效率建模及自适应调整方法研究

国家自然科学基金

0+阅读 · 2014年12月31日

异构多核体系结构的能效优化关键技术研究

国家自然科学基金

0+阅读 · 2014年12月31日

遥感图像融合方法的几何性能研究

国家自然科学基金

1+阅读 · 2013年12月31日

网络多媒体流QoS特征稀疏表示及柔性跨域映射方法研究

国家自然科学基金

0+阅读 · 2013年12月31日

跨语图像检索中融合视觉信息的多语翻译与集成方法研究

国家自然科学基金

2+阅读 · 2013年12月31日

异构通信网络中的空域非对称干扰对齐技术研究

国家自然科学基金

0+阅读 · 2012年12月31日

基于视觉显著性结构的特征提取和图像检索

国家自然科学基金

0+阅读 · 2012年12月31日

面向光网络灵活控制的软定制理论与实现机理研究

国家自然科学基金

0+阅读 · 2012年12月31日

高效能自适应处理器体系结构关键技术研究

国家自然科学基金

0+阅读 · 2011年12月31日

一种全新的动态网络行为认知模型及其在异构网络资源分配中的应用

国家自然科学基金

0+阅读 · 2009年12月31日

相关论文

Q-learning Decision Transformer: Leveraging Dynamic Programming for Conditional Sequence Modelling in Offline RL

Arxiv

0+阅读 · 2022年9月8日

Frame-Subtitle Self-Supervision for Multi-Modal Video Question Answering

Arxiv

0+阅读 · 2022年9月8日

Spatial-Temporal Transformer for Video Snapshot Compressive Imaging

Arxiv

0+阅读 · 2022年9月8日

Global Context Vision Transformers

Arxiv

0+阅读 · 2022年9月7日

Transformers are Meta-Reinforcement Learners

Arxiv

15+阅读 · 2022年6月14日

EDTER: Edge Detection with Transformer

Arxiv

11+阅读 · 2022年3月16日

A Battle of Network Structures: An Empirical Study of CNN, Transformer, and MLP

Arxiv

12+阅读 · 2021年8月30日

SiT: Self-supervised vIsion Transformer

Arxiv

19+阅读 · 2021年4月8日

Transformer Tracking

Arxiv

17+阅读 · 2021年3月29日

End-to-End Dense Video Captioning with Masked Transformer

Arxiv

14+阅读 · 2018年4月3日

微信扫码咨询专知VIP会员