会员服务 ·

0

让CNN有了平移不变性，同时提升ImageNet成绩：Adobe开源新方法，登上ICML

2019 年 8 月 5 日 极市平台

加入极市专业CV交流群，与6000+来自腾讯，华为，百度，北大，清华，中科院等名企名校视觉开发者互动交流！更有机会与李开复老师等大牛群内互动！

同时提供每月大咖直播分享、真实项目需求对接、干货资讯汇总，行业技术交流。关注 极市平台 公众号，回复 加群，立刻申请入群~

古往今来，大家都知道：只要图像一平移，CNN就认不出来了。

原因就在降采样身上。不管是最大池化，跨步卷积，还是平均池化，都对平移太敏感：

比如，0、0、1、1、0、0、1、1……这样的周期，最大池化是这样：

但如果平移一格，最大池化完全变了一个样子：

虽然，有著名的抗锯齿 (Anti-Aliasing，AA) 方法，致力解决这个问题。但把这种模块直接插进网络，会严重影响模型的表现。

现在，来自Adobe的Richard Zhang (简称“理查”) ，让抗锯齿和各种降采样和平共处了。

在保留平移不变性的情况下，还能提升ImageNet上的分类准确率。VGG、ResNet、DenseNet……各种架构都适用。

不止如此，面对其他干扰更稳定了，如旋转如缩放；面对输入图像的损坏，还更鲁棒了。

研究登上了ICML 2019，代码已经开源，还有演讲可以看。Reddit热度已经超过了250，观众纷纷表达了谢意：

论文很厉害，演讲也很好。

怎样和解的？

想知道怎样帮助CNN保留平移不变形，就要了解平移不变性是怎样打破的。

理查观察了VGG的第一个卷积层，发现它对平移毫无波澜，并不是在这里打破的。

但再观察第一个池化层，对平移有了反应：平移偶数个像素，表征还不改变，平移奇数个像素，表征就完全变了。

向网络深处走，经过的池化层越多，问题就越严重。

△抗锯齿

想解决这个问题，就要把抗锯齿和降采样友好地结合到一起。

于是，理查又仔细查看了降采样过程，把它 (按顺序) 分成了两个部分：

一是取最大值，用密集的方式。

二是在中间特征图 (Intermediate Feature Map) 上做子采样 (Sub-Sampling) 。

第一步没有问题，完全不会出现锯齿。

第二步就要改了。理查给中间特征图，加了个模糊滤波器 (Blur Filter) 来抗锯齿，然后再做子采样：

△(2)为滤波器

那么，“抗锯齿版最大池化”效果怎么样？

平移不变性与准确率兼得

理查用ImageNet分类任务测试了一下进化后的VGG，原以为会损失一些准确率，结果：

△右为抗锯齿

△空心为抗锯齿

在解锁平移不变性的同时，准确率还提升了。

如果降采样方法不是最大池化，又怎么样呢？

所以，理查还测试了ResNet和MobileNetv2，它们用的是跨步卷积；以及DenseNet，它用的是平均池化：

△空心为抗锯齿

这些架构也获得了类似的提升。全面成功。

上面只讲了分类这一项任务。而进化后的降采样，在图到图翻译任务上也同样有效。

不惧各种变换，以及图像损坏

不只是平移，像旋转、缩放这样的干扰，都可以应对自如；另外，面对输入图像损坏(Image Corruption) ，也变得更加鲁棒了。

ImageNet-P数据集里，有受到各类干扰的图像；而ImageNet-C数据集里，包含了系统性损坏的图像。

△mCE=Mean Corruption Rate, mFR=Mean Flip Rate

左边一栏 (除了Baseline) 之外，是不同的滤波器，从上到下依次变强。mCE和mFR，都是越小越好。

数据显示，各种滤波器都能有效增强，应对干扰的稳定性，和应对图像损坏的鲁棒性。其中，最强的过滤器Bin-5表现最佳。

One More Thing

如果小伙伴们没有看够，可以点开演讲视频：

然后，还有一大波传送门。

论文在此：
https://arxiv.org/abs/1904.11486

项目主页：
https://richzhang.github.io/antialiased-cnns/

开源代码：
https://github.com/adobe/antialiased-cnns#1-quickstart-load-an-antialiased-model

-完-

*延伸阅读

添加极市小助手微信（ID : cv-mart），备注：进群-姓名-研究方向，即可申请加入极市技术交流群，更有每月大咖直播分享、真实项目需求对接、干货资讯汇总，行业技术交流，一起来让思想之光照的更远吧~

△长按添加极市小助手

△长按关注极市平台

觉得有用麻烦给个在看啦~

登录查看更多

0

相关内容

平移不变性

平移不变性

【CVPR 2020-商汤】8比特数值也能训练卷积神经网络模型

【CVPR 2020-商汤】8比特数值也能训练卷积神经网络模型

专知会员服务

26+阅读 · 2020年5月7日

CVPR2020 | 商汤-港中文等提出PV-RCNN：3D目标检测新网络

CVPR2020 | 商汤-港中文等提出PV-RCNN：3D目标检测新网络

专知会员服务

45+阅读 · 2020年4月17日

基于深度网络的自监督视觉特征学习综述，附24页论文下载

基于深度网络的自监督视觉特征学习综述，附24页论文下载

专知会员服务

66+阅读 · 2020年1月15日

【论文】深度卷积神经网络的ImageNet分类（ImageNet Classification with Deep Convolutional Neural Networks）

【论文】深度卷积神经网络的ImageNet分类（ImageNet Classification with Deep Convolutional Neural Networks）

专知会员服务

14+阅读 · 2020年1月1日

【何恺明团队新论文】PointRend:将图像分割视作渲染问题，性能显著提升！

【何恺明团队新论文】PointRend:将图像分割视作渲染问题，性能显著提升！

专知会员服务

28+阅读 · 2019年12月19日

谷歌提出新型卷积网络EfficientNet：推理速度提升5.1倍，参数减少88%（附论文&代码）

谷歌提出新型卷积网络EfficientNet：推理速度提升5.1倍，参数减少88%（附论文&代码）

数据派THU

6+阅读 · 2019年6月8日

推理速度提升5.1倍，参数减少88%：谷歌提出新型卷积网络EfficientNet（附代码）

推理速度提升5.1倍，参数减少88%：谷歌提出新型卷积网络EfficientNet（附代码）

机器之心

6+阅读 · 2019年5月31日

CVPR 2019 | 中科大 & 微软开源：基于高清表示网络的人体姿态估计

CVPR 2019 | 中科大 & 微软开源：基于高清表示网络的人体姿态估计

PaperWeekly

5+阅读 · 2019年5月10日

CVPR2019 | 6D目标姿态估计，李飞飞夫妇等提出DenseFusion

CVPR2019 | 6D目标姿态估计，李飞飞夫妇等提出DenseFusion

极市平台

3+阅读 · 2019年3月1日

证伪：CNN中的图片平移不变性

证伪：CNN中的图片平移不变性

论智

5+阅读 · 2018年6月12日

Deep Learning for Image Denoising: A Survey

Arxiv

5+阅读 · 2018年10月11日

Automatically Designing CNN Architectures for Medical Image Segmentation

Automatically Designing CNN Architectures for Medical Image Segmentation

Arxiv

10+阅读 · 2018年7月19日

Deep Ordinal Hashing with Spatial Attention

Arxiv

9+阅读 · 2018年5月7日

Deep Semantic Hashing with Generative Adversarial Networks

Arxiv

5+阅读 · 2018年4月23日

Recurrent Residual Convolutional Neural Network based on U-Net (R2U-Net) for Medical Image Segmentation

Arxiv

13+阅读 · 2018年2月20日

VIP会员

相关主题

平移不变性

ImageNet (数据集)

卷积神经网络

相关VIP内容

【CVPR 2020-商汤】8比特数值也能训练卷积神经网络模型

【CVPR 2020-商汤】8比特数值也能训练卷积神经网络模型

专知会员服务

26+阅读 · 2020年5月7日

CVPR2020 | 商汤-港中文等提出PV-RCNN：3D目标检测新网络

CVPR2020 | 商汤-港中文等提出PV-RCNN：3D目标检测新网络

专知会员服务

45+阅读 · 2020年4月17日

基于深度网络的自监督视觉特征学习综述，附24页论文下载

基于深度网络的自监督视觉特征学习综述，附24页论文下载

专知会员服务

66+阅读 · 2020年1月15日

【论文】深度卷积神经网络的ImageNet分类（ImageNet Classification with Deep Convolutional Neural Networks）

【论文】深度卷积神经网络的ImageNet分类（ImageNet Classification with Deep Convolutional Neural Networks）

专知会员服务

14+阅读 · 2020年1月1日

【何恺明团队新论文】PointRend:将图像分割视作渲染问题，性能显著提升！

【何恺明团队新论文】PointRend:将图像分割视作渲染问题，性能显著提升！

专知会员服务

28+阅读 · 2019年12月19日

热门VIP内容

开通专知VIP会员享更多权益服务

生成式人工智能导论：可靠性、负责任开发及实际应用（第二版）

《2025财年美陆军转型倡议（ATI）部队结构与组织提案》

【CMU博士论文】分布偏移下的可信机器学习

智能体 EDA 的曙光：自主数字芯片设计综述

相关资讯

谷歌提出新型卷积网络EfficientNet：推理速度提升5.1倍，参数减少88%（附论文&代码）

谷歌提出新型卷积网络EfficientNet：推理速度提升5.1倍，参数减少88%（附论文&代码）

数据派THU

6+阅读 · 2019年6月8日

推理速度提升5.1倍，参数减少88%：谷歌提出新型卷积网络EfficientNet（附代码）

推理速度提升5.1倍，参数减少88%：谷歌提出新型卷积网络EfficientNet（附代码）

机器之心

6+阅读 · 2019年5月31日

CVPR 2019 | 中科大 & 微软开源：基于高清表示网络的人体姿态估计

CVPR 2019 | 中科大 & 微软开源：基于高清表示网络的人体姿态估计

PaperWeekly

5+阅读 · 2019年5月10日

CVPR2019 | 6D目标姿态估计，李飞飞夫妇等提出DenseFusion

CVPR2019 | 6D目标姿态估计，李飞飞夫妇等提出DenseFusion

极市平台

3+阅读 · 2019年3月1日

证伪：CNN中的图片平移不变性

证伪：CNN中的图片平移不变性

论智

5+阅读 · 2018年6月12日

相关论文

Deep Learning for Image Denoising: A Survey

Arxiv

5+阅读 · 2018年10月11日

Automatically Designing CNN Architectures for Medical Image Segmentation

Automatically Designing CNN Architectures for Medical Image Segmentation

Arxiv

10+阅读 · 2018年7月19日

Deep Ordinal Hashing with Spatial Attention

Arxiv

9+阅读 · 2018年5月7日

Deep Semantic Hashing with Generative Adversarial Networks

Arxiv

5+阅读 · 2018年4月23日

Recurrent Residual Convolutional Neural Network based on U-Net (R2U-Net) for Medical Image Segmentation

Arxiv

13+阅读 · 2018年2月20日

大家都在搜

分布式事务

MIT博士论文

蓝牙安全攻防

香港科技大学冯雁

GitHub上已超过

微信扫码咨询专知VIP会员