【DeepMind】无归一化的高性能大规模图像识别 - 专知

会员服务 ·

0

【DeepMind】无归一化的高性能大规模图像识别

2021 年 2 月 14 日 专知

批处理归一化是大多数图像分类模型的关键组成部分，但由于其对批处理大小的依赖和实例之间的交互，因此它有许多不必要的特性。尽管最近的工作已经成功地训练了没有归一化层的深度ResNets，但是这些模型与最好的归一化网络的测试精度不匹配，并且对于大的学习率或强的数据增强常常是不稳定的。在这项工作中，我们开发了一种自适应梯度裁剪技术来克服这些不稳定性，并设计了一种显著改进的类无归一化的重网。我们的较小的模型具有与EfficientNet-B7在ImageNet上的相匹配的测试精度，，而训练速度高达8.7倍，我们最大的模型达到了最新的最先进的最高精度86.5%。此外，在对3亿张标记图像数据集进行大规模预训练后，在ImageNet上进行微调时，无归一化模型获得了比批量归一化模型显著更好的性能，我们最好的模型获得了89.2%的精度。我们的代码可以在这个https URL deepmind-research/tree/master/nfnets上找到。

https://www.zhuanzhi.ai/paper/926b8f078a97f904719d3d70cc69d30f

专知便捷查看

便捷下载，请关注专知公众号（点击上方蓝色专知关注）

后台回复“LSIR” 可以获取《【DeepMind】无归一化的高性能大规模图像识别》专知下载链接索引

专知，专业可信的人工智能知识分发，让认知协作更快更好！欢迎注册登录专知www.zhuanzhi.ai，获取5000+AI主题干货知识资料！

欢迎微信扫一扫加入专知人工智能知识星球群，获取最新AI专业干货知识教程资料和与专家交流咨询！

点击“ 阅读原文 ”，了解使用专知 ，查看获取5000+AI主题知识资源

登录查看更多

0

相关内容

归一化

【CVPR2021】基于有限计算资源的虚拟全连接层训练大规模人脸识别数据集

【CVPR2021】基于有限计算资源的虚拟全连接层训练大规模人脸识别数据集

专知会员服务

13+阅读 · 2021年4月23日

Google-EfficientNet v2来了！更快，更小，更强！

Google-EfficientNet v2来了！更快，更小，更强！

专知会员服务

19+阅读 · 2021年4月4日

【NeurIPS 2020】大规模分布式鲁棒优化方法

【NeurIPS 2020】大规模分布式鲁棒优化方法

专知会员服务

26+阅读 · 2020年10月13日

【ICML2020-伯克利】反直觉！大模型重压缩提升Transformer的训练和推理效率，47页ppt

【ICML2020-伯克利】反直觉！大模型重压缩提升Transformer的训练和推理效率，47页ppt

专知会员服务

70+阅读 · 2020年7月1日

【DeepMind推荐】居家学习的人工智能干货资源大全集

【DeepMind推荐】居家学习的人工智能干货资源大全集

专知会员服务

112+阅读 · 2020年6月27日

【干货书】高级应用深度学习，294页pdf

【干货书】高级应用深度学习，294页pdf

专知会员服务

154+阅读 · 2020年6月20日

【CVPR2020】视觉推理-可微自适应计算时间

【CVPR2020】视觉推理-可微自适应计算时间

专知会员服务

13+阅读 · 2020年4月28日

【Google】利用AUTOML实现加速感知神经网络设计

【Google】利用AUTOML实现加速感知神经网络设计

专知会员服务

30+阅读 · 2020年3月5日

【Google AI】开源NoisyStudent：自监督图像分类

【Google AI】开源NoisyStudent：自监督图像分类

专知会员服务

55+阅读 · 2020年2月18日

【课程】伯克利2019全栈深度学习课程（附下载）

【课程】伯克利2019全栈深度学习课程（附下载）

专知会员服务

57+阅读 · 2019年10月29日

【CVPR2020-北京大学】自适应间隔损失的提升小样本学习

【CVPR2020-北京大学】自适应间隔损失的提升小样本学习

专知

12+阅读 · 2020年6月9日

【牛津大学&DeepMind】自监督学习教程，141页ppt

【牛津大学&DeepMind】自监督学习教程，141页ppt

专知

16+阅读 · 2020年5月29日

【CVPR2020】L2 ^GCN：图卷积网络的分层学习高效训练

【CVPR2020】L2 ^GCN：图卷积网络的分层学习高效训练

专知

12+阅读 · 2020年3月31日

【CVPR2020-牛津-谷歌】语音到动作:动作识别的跨模态监督，Cross-modal Supervision

【CVPR2020-牛津-谷歌】语音到动作:动作识别的跨模态监督，Cross-modal Supervision

专知

10+阅读 · 2020年3月31日

【Google-CMU】元伪标签的元学习，Meta Pseudo Labels

【Google-CMU】元伪标签的元学习，Meta Pseudo Labels

专知

48+阅读 · 2020年3月30日

【Amazon】使用预训练Transformer模型进行数据增强

【Amazon】使用预训练Transformer模型进行数据增强

专知

12+阅读 · 2020年3月6日

Pytorch视频分类教程

Pytorch视频分类教程

专知

6+阅读 · 2019年5月25日

Google DeepMind最新报告—深度神经网络压缩进展（附PPT下载）

Google DeepMind最新报告—深度神经网络压缩进展（附PPT下载）

专知

28+阅读 · 2019年4月16日

TensorFlow 2.0如何在Colab中使用TensorBoard

TensorFlow 2.0如何在Colab中使用TensorBoard

专知

17+阅读 · 2019年3月15日

深度学习TensorFlow实现集合

深度学习TensorFlow实现集合

专知

10+阅读 · 2018年9月8日

AQD: Towards Accurate Quantized Object Detection

Arxiv

0+阅读 · 2021年5月3日

High-Performance Large-Scale Image Recognition Without Normalization

Arxiv

5+阅读 · 2021年2月11日

CSKG: The CommonSense Knowledge Graph

CSKG: The CommonSense Knowledge Graph

Arxiv

18+阅读 · 2020年12月21日

Go Wide, Then Narrow: Efficient Training of Deep Thin Networks

Arxiv

15+阅读 · 2020年7月1日

TResNet: High Performance GPU-Dedicated Architecture

TResNet: High Performance GPU-Dedicated Architecture

Arxiv

8+阅读 · 2020年3月30日

Fast AutoAugment

Fast AutoAugment

Arxiv

5+阅读 · 2019年5月1日

Lipschitz Generative Adversarial Nets

Arxiv

8+阅读 · 2019年2月15日

Rethinking ImageNet Pre-training

Arxiv

8+阅读 · 2018年11月21日

ESRGAN: Enhanced Super-Resolution Generative Adversarial Networks

ESRGAN: Enhanced Super-Resolution Generative Adversarial Networks

Arxiv

6+阅读 · 2018年9月17日

FSSD: Feature Fusion Single Shot Multibox Detector

Arxiv

8+阅读 · 2018年5月17日

VIP会员

相关主题

相关VIP内容

【CVPR2021】基于有限计算资源的虚拟全连接层训练大规模人脸识别数据集

【CVPR2021】基于有限计算资源的虚拟全连接层训练大规模人脸识别数据集

专知会员服务

13+阅读 · 2021年4月23日

Google-EfficientNet v2来了！更快，更小，更强！

Google-EfficientNet v2来了！更快，更小，更强！

专知会员服务

19+阅读 · 2021年4月4日

【NeurIPS 2020】大规模分布式鲁棒优化方法

【NeurIPS 2020】大规模分布式鲁棒优化方法

专知会员服务

26+阅读 · 2020年10月13日

【ICML2020-伯克利】反直觉！大模型重压缩提升Transformer的训练和推理效率，47页ppt

【ICML2020-伯克利】反直觉！大模型重压缩提升Transformer的训练和推理效率，47页ppt

专知会员服务

70+阅读 · 2020年7月1日

【DeepMind推荐】居家学习的人工智能干货资源大全集

【DeepMind推荐】居家学习的人工智能干货资源大全集

专知会员服务

112+阅读 · 2020年6月27日

【干货书】高级应用深度学习，294页pdf

【干货书】高级应用深度学习，294页pdf

专知会员服务

154+阅读 · 2020年6月20日

【CVPR2020】视觉推理-可微自适应计算时间

【CVPR2020】视觉推理-可微自适应计算时间

专知会员服务

13+阅读 · 2020年4月28日

【Google】利用AUTOML实现加速感知神经网络设计

【Google】利用AUTOML实现加速感知神经网络设计

专知会员服务

30+阅读 · 2020年3月5日

【Google AI】开源NoisyStudent：自监督图像分类

【Google AI】开源NoisyStudent：自监督图像分类

专知会员服务

55+阅读 · 2020年2月18日

【课程】伯克利2019全栈深度学习课程（附下载）

【课程】伯克利2019全栈深度学习课程（附下载）

专知会员服务

57+阅读 · 2019年10月29日

热门VIP内容

开通专知VIP会员享更多权益服务

数据智能体综述：新兴范式还是被高估的炒作？

海底战已至：美国构思海底安全战略 | 最新报告

【ICCV2025教程】视觉异常检测中的基础模型：进展、挑战与应用

美军将无人自主等新技术融入潜艇部队以更具杀伤力

相关资讯

【CVPR2020-北京大学】自适应间隔损失的提升小样本学习

【CVPR2020-北京大学】自适应间隔损失的提升小样本学习

专知

12+阅读 · 2020年6月9日

【牛津大学&DeepMind】自监督学习教程，141页ppt

【牛津大学&DeepMind】自监督学习教程，141页ppt

专知

16+阅读 · 2020年5月29日

【CVPR2020】L2 ^GCN：图卷积网络的分层学习高效训练

【CVPR2020】L2 ^GCN：图卷积网络的分层学习高效训练

专知

12+阅读 · 2020年3月31日

【CVPR2020-牛津-谷歌】语音到动作:动作识别的跨模态监督，Cross-modal Supervision

【CVPR2020-牛津-谷歌】语音到动作:动作识别的跨模态监督，Cross-modal Supervision

专知

10+阅读 · 2020年3月31日

【Google-CMU】元伪标签的元学习，Meta Pseudo Labels

【Google-CMU】元伪标签的元学习，Meta Pseudo Labels

专知

48+阅读 · 2020年3月30日

【Amazon】使用预训练Transformer模型进行数据增强

【Amazon】使用预训练Transformer模型进行数据增强

专知

12+阅读 · 2020年3月6日

Pytorch视频分类教程

Pytorch视频分类教程

专知

6+阅读 · 2019年5月25日

Google DeepMind最新报告—深度神经网络压缩进展（附PPT下载）

Google DeepMind最新报告—深度神经网络压缩进展（附PPT下载）

专知

28+阅读 · 2019年4月16日

TensorFlow 2.0如何在Colab中使用TensorBoard

TensorFlow 2.0如何在Colab中使用TensorBoard

专知

17+阅读 · 2019年3月15日

深度学习TensorFlow实现集合

深度学习TensorFlow实现集合

专知

10+阅读 · 2018年9月8日

相关论文

AQD: Towards Accurate Quantized Object Detection

Arxiv

0+阅读 · 2021年5月3日

High-Performance Large-Scale Image Recognition Without Normalization

Arxiv

5+阅读 · 2021年2月11日

CSKG: The CommonSense Knowledge Graph

CSKG: The CommonSense Knowledge Graph

Arxiv

18+阅读 · 2020年12月21日

Go Wide, Then Narrow: Efficient Training of Deep Thin Networks

Arxiv

15+阅读 · 2020年7月1日

TResNet: High Performance GPU-Dedicated Architecture

TResNet: High Performance GPU-Dedicated Architecture

Arxiv

8+阅读 · 2020年3月30日

Fast AutoAugment

Fast AutoAugment

Arxiv

5+阅读 · 2019年5月1日

Lipschitz Generative Adversarial Nets

Arxiv

8+阅读 · 2019年2月15日

Rethinking ImageNet Pre-training

Arxiv

8+阅读 · 2018年11月21日

ESRGAN: Enhanced Super-Resolution Generative Adversarial Networks

ESRGAN: Enhanced Super-Resolution Generative Adversarial Networks

Arxiv

6+阅读 · 2018年9月17日

FSSD: Feature Fusion Single Shot Multibox Detector

Arxiv

8+阅读 · 2018年5月17日

大家都在搜

2025最新文献

NTU博士论文

蓝牙安全攻防

国防科技创新

朱克爱德华兹家族

无人机测控通信自组网技术综述

微信扫码咨询专知VIP会员