在识别和检测等实质性视觉任务中,Vision Transformer显示了强大的视觉表示能力,因此在手工设计更有效的架构方面吸引了快速增长的努力。在本文中,我们提出使用神经体系结构搜索来自动化这个过程,不仅搜索体系结构,而且搜索搜索空间。其核心思想是通过使用权重共享超级网络计算出的E-T误差,逐步演化出不同的搜索维度。根据空间搜索过程,给出了一般视觉变换器的设计指南,并进行了广泛的分析,促进了对视觉变换器的认识。值得注意的是,在ImageNet上进行评估时,来自搜索空间的搜索模型S3 (Search Space的简称)的性能优于最近提出的模型,如Swin、DeiT和ViT。S3在目标检测、语义分割和视觉问题回答方面的有效性也得到了说明,说明了它对下游视觉和视觉语言任务的通用性。代码和模型可以在https://github.com/microsoft/Cream上找到。

https://www.zhuanzhi.ai/paper/100e1a1db2c32b2d03263302d526f435

成为VIP会员查看完整内容
13

相关内容

【AAAI2022】基于双流更新的视觉Transformer动态加速方法
专知会员服务
23+阅读 · 2021年12月11日
【NeurIPS 2021】类比进化算法:设计统一的序列模型
专知会员服务
15+阅读 · 2021年10月30日
专知会员服务
21+阅读 · 2021年8月23日
专知会员服务
10+阅读 · 2021年3月21日
【NeurIPS 2020】图神经网络GNN架构设计
专知会员服务
82+阅读 · 2020年11月19日
【NeurIPS 2020 】神经网络结构生成优化
专知会员服务
20+阅读 · 2020年10月24日
李飞飞等人提出Auto-DeepLab:自动搜索图像语义分割架构
全球人工智能
5+阅读 · 2019年1月14日
CVPR 2018 |“寻找”极小人脸
极市平台
14+阅读 · 2018年7月11日
三种减少卷积神经网络复杂度同时不降低性能的新方法
统计学习与视觉计算组
3+阅读 · 2017年5月26日
Arxiv
0+阅读 · 2022年1月28日
Arxiv
4+阅读 · 2021年11月29日
Arxiv
3+阅读 · 2018年12月21日
CoQA: A Conversational Question Answering Challenge
Arxiv
7+阅读 · 2018年8月21日
VIP会员
相关VIP内容
【AAAI2022】基于双流更新的视觉Transformer动态加速方法
专知会员服务
23+阅读 · 2021年12月11日
【NeurIPS 2021】类比进化算法:设计统一的序列模型
专知会员服务
15+阅读 · 2021年10月30日
专知会员服务
21+阅读 · 2021年8月23日
专知会员服务
10+阅读 · 2021年3月21日
【NeurIPS 2020】图神经网络GNN架构设计
专知会员服务
82+阅读 · 2020年11月19日
【NeurIPS 2020 】神经网络结构生成优化
专知会员服务
20+阅读 · 2020年10月24日
微信扫码咨询专知VIP会员