批处理归一化是大多数图像分类模型的关键组成部分,但由于其对批处理大小的依赖和实例之间的交互,因此它有许多不必要的特性。尽管最近的工作已经成功地训练了没有归一化层的深度ResNets,但是这些模型与最好的归一化网络的测试精度不匹配,并且对于大的学习率或强的数据增强常常是不稳定的。在这项工作中,我们开发了一种自适应梯度裁剪技术来克服这些不稳定性,并设计了一种显著改进的类无归一化的重网。我们的较小的模型具有与EfficientNet-B7在ImageNet上的相匹配的测试精度,,而训练速度高达8.7倍,我们最大的模型达到了最新的最先进的最高精度86.5%。此外,在对3亿张标记图像数据集进行大规模预训练后,在ImageNet上进行微调时,无归一化模型获得了比批量归一化模型显著更好的性能,我们最好的模型获得了89.2%的精度。我们的代码可以在这个https URL deepmind-research/tree/master/nfnets上找到。

https://www.zhuanzhi.ai/paper/926b8f078a97f904719d3d70cc69d30f

成为VIP会员查看完整内容
9

相关内容

从图像中提取出有意义、有实用价值的信息。

知识荟萃

精品入门和进阶教程、论文和代码整理等

更多

查看相关VIP内容、论文、资讯等
Google-EfficientNet v2来了!更快,更小,更强!
专知会员服务
19+阅读 · 2021年4月4日
【NeurIPS 2020】大规模分布式鲁棒优化方法
专知会员服务
26+阅读 · 2020年10月13日
专知会员服务
65+阅读 · 2020年9月10日
【牛津大学&DeepMind】自监督学习教程,141页ppt
专知会员服务
180+阅读 · 2020年5月29日
专知会员服务
45+阅读 · 2020年3月6日
【Google】利用AUTOML实现加速感知神经网络设计
专知会员服务
30+阅读 · 2020年3月5日
【Google AI】开源NoisyStudent:自监督图像分类
专知会员服务
55+阅读 · 2020年2月18日
【泡泡点云时空】PointConv: 3D点云的深度卷积网络
泡泡机器人SLAM
23+阅读 · 2019年6月12日
7个实用的深度学习技巧
机器学习算法与Python学习
16+阅读 · 2019年3月6日
解读谷歌NASNet:一个大规模图像识别架构!(附论文)
全球人工智能
9+阅读 · 2018年1月20日
利用 AutoML 进行大规模图像分类和对象检测
谷歌开发者
6+阅读 · 2017年11月27日
别磨叽,学完这篇你也是图像识别专家了
Arxiv
1+阅读 · 2021年4月2日
TResNet: High Performance GPU-Dedicated Architecture
Arxiv
8+阅读 · 2020年3月30日
Arxiv
3+阅读 · 2019年10月31日
Arxiv
7+阅读 · 2018年4月24日
Arxiv
3+阅读 · 2017年10月1日
VIP会员
相关VIP内容
Google-EfficientNet v2来了!更快,更小,更强!
专知会员服务
19+阅读 · 2021年4月4日
【NeurIPS 2020】大规模分布式鲁棒优化方法
专知会员服务
26+阅读 · 2020年10月13日
专知会员服务
65+阅读 · 2020年9月10日
【牛津大学&DeepMind】自监督学习教程,141页ppt
专知会员服务
180+阅读 · 2020年5月29日
专知会员服务
45+阅读 · 2020年3月6日
【Google】利用AUTOML实现加速感知神经网络设计
专知会员服务
30+阅读 · 2020年3月5日
【Google AI】开源NoisyStudent:自监督图像分类
专知会员服务
55+阅读 · 2020年2月18日
相关资讯
【泡泡点云时空】PointConv: 3D点云的深度卷积网络
泡泡机器人SLAM
23+阅读 · 2019年6月12日
7个实用的深度学习技巧
机器学习算法与Python学习
16+阅读 · 2019年3月6日
解读谷歌NASNet:一个大规模图像识别架构!(附论文)
全球人工智能
9+阅读 · 2018年1月20日
利用 AutoML 进行大规模图像分类和对象检测
谷歌开发者
6+阅读 · 2017年11月27日
别磨叽,学完这篇你也是图像识别专家了
微信扫码咨询专知VIP会员