【DeepMind】无归一化的高性能大规模图像识别

2021 年 2 月 14 日 专知


批处理归一化是大多数图像分类模型的关键组成部分,但由于其对批处理大小的依赖和实例之间的交互,因此它有许多不必要的特性。尽管最近的工作已经成功地训练了没有归一化层的深度ResNets,但是这些模型与最好的归一化网络的测试精度不匹配,并且对于大的学习率或强的数据增强常常是不稳定的。在这项工作中,我们开发了一种自适应梯度裁剪技术来克服这些不稳定性,并设计了一种显著改进的类无归一化的重网。我们的较小的模型具有与EfficientNet-B7在ImageNet上的相匹配的测试精度,,而训练速度高达8.7倍,我们最大的模型达到了最新的最先进的最高精度86.5%。此外,在对3亿张标记图像数据集进行大规模预训练后,在ImageNet上进行微调时,无归一化模型获得了比批量归一化模型显著更好的性能,我们最好的模型获得了89.2%的精度。我们的代码可以在这个https URL deepmind-research/tree/master/nfnets上找到。


https://www.zhuanzhi.ai/paper/926b8f078a97f904719d3d70cc69d30f


专知便捷查看

便捷下载,请关注专知公众号(点击上方蓝色专知关注)

  • 后台回复“LSIR” 可以获取《【DeepMind】无归一化的高性能大规模图像识别》专知下载链接索引

专知,专业可信的人工智能知识分发,让认知协作更快更好!欢迎注册登录专知www.zhuanzhi.ai,获取5000+AI主题干货知识资料!
欢迎微信扫一扫加入专知人工智能知识星球群,获取最新AI专业干货知识教程资料和与专家交流咨询
点击“ 阅读原文 ”,了解使用 专知 ,查看获取5000+AI主题知识资源
登录查看更多
0

相关内容

Google-EfficientNet v2来了!更快,更小,更强!
专知会员服务
18+阅读 · 2021年4月4日
【NeurIPS 2020】大规模分布式鲁棒优化方法
专知会员服务
25+阅读 · 2020年10月13日
【DeepMind推荐】居家学习的人工智能干货资源大全集
专知会员服务
108+阅读 · 2020年6月27日
【干货书】高级应用深度学习,294页pdf
专知会员服务
151+阅读 · 2020年6月20日
【CVPR2020】视觉推理-可微自适应计算时间
专知会员服务
12+阅读 · 2020年4月28日
【Google】利用AUTOML实现加速感知神经网络设计
专知会员服务
29+阅读 · 2020年3月5日
【Google AI】开源NoisyStudent:自监督图像分类
专知会员服务
54+阅读 · 2020年2月18日
【课程】伯克利2019全栈深度学习课程(附下载)
专知会员服务
56+阅读 · 2019年10月29日
Pytorch视频分类教程
专知
6+阅读 · 2019年5月25日
TensorFlow 2.0如何在Colab中使用TensorBoard
专知
17+阅读 · 2019年3月15日
深度学习TensorFlow实现集合
专知
10+阅读 · 2018年9月8日
Arxiv
0+阅读 · 2021年5月3日
CSKG: The CommonSense Knowledge Graph
Arxiv
18+阅读 · 2020年12月21日
TResNet: High Performance GPU-Dedicated Architecture
Arxiv
8+阅读 · 2020年3月30日
Fast AutoAugment
Arxiv
5+阅读 · 2019年5月1日
Arxiv
8+阅读 · 2019年2月15日
Arxiv
8+阅读 · 2018年11月21日
Arxiv
8+阅读 · 2018年5月17日
VIP会员
相关VIP内容
Google-EfficientNet v2来了!更快,更小,更强!
专知会员服务
18+阅读 · 2021年4月4日
【NeurIPS 2020】大规模分布式鲁棒优化方法
专知会员服务
25+阅读 · 2020年10月13日
【DeepMind推荐】居家学习的人工智能干货资源大全集
专知会员服务
108+阅读 · 2020年6月27日
【干货书】高级应用深度学习,294页pdf
专知会员服务
151+阅读 · 2020年6月20日
【CVPR2020】视觉推理-可微自适应计算时间
专知会员服务
12+阅读 · 2020年4月28日
【Google】利用AUTOML实现加速感知神经网络设计
专知会员服务
29+阅读 · 2020年3月5日
【Google AI】开源NoisyStudent:自监督图像分类
专知会员服务
54+阅读 · 2020年2月18日
【课程】伯克利2019全栈深度学习课程(附下载)
专知会员服务
56+阅读 · 2019年10月29日
相关论文
Arxiv
0+阅读 · 2021年5月3日
CSKG: The CommonSense Knowledge Graph
Arxiv
18+阅读 · 2020年12月21日
TResNet: High Performance GPU-Dedicated Architecture
Arxiv
8+阅读 · 2020年3月30日
Fast AutoAugment
Arxiv
5+阅读 · 2019年5月1日
Arxiv
8+阅读 · 2019年2月15日
Arxiv
8+阅读 · 2018年11月21日
Arxiv
8+阅读 · 2018年5月17日
Top
微信扫码咨询专知VIP会员