点击上方“CVer”,选择加"星标"置顶
重磅干货,第一时间送达
本文转载自:AIWalker
该文是百度研究员针对ResNet提出的一种改进,它提出一种新颖的Hierarchical-Split Block,一种“即插即用”的模块。它可以提供更充分的感受野,进而提升其他下游任务(如语义分割、目标检测等等)的性能。在同等推理速度下,所提HS-ResNet50取得了81.28%的Top1精度,超过了之前亚马逊提出的ResNeSt。
Paper: https://arxiv.org/abs/2010.07621
Code: https://github.com/PaddlePaddle/PaddleClas
多尺度特征对于大量视觉任务均非常重要,现有诸多网络结构的改进均考虑了多尺度信息的构件。该文提出了一种“即插即用”型Hierarchical-Split Block(HSB)用于提升现有CNN的性能。HSB包含多个Split与Concat操作,它们共同构成该Block的多尺度特征提取;与此同时,HSB具有更好的灵活性与高效性。基于HSB构件的ResNet在多个任务上取得了极大的性能提升,比如在ImageNet数据集上,HS-ResNet50取得了81.28%的Top1精度,超过了之前亚马逊提出的ResNeSt。下图给出了不同ResNet的精度、推理耗时对比。
该文贡献主要包含以下几点:
上图给出了本文所设计的HSB的网络结构示意图,经过 卷积后,特征被Split成s组 ,每组具有同等的通道通道数。每组特征 将被送入到 卷积 ,输出特征表示为 。该文创造性的将 继续拆分并将 与下一组的 一起送入 。最终的输出特征中小感受野可以聚焦于细节部分,这对于小目标识别很重要,而大感受野特征有助于捕获大目标。
在该文中,作者通过控制组数与通道数约束参数量和计算量。更大的组数意味着更强的多尺度提取性
能,而更多的通道数则意味着更丰富的特征。上述HSB可以描述成如下形式:
HSB 包含两个关键操作Split和Concatenate:
接下来,我们就要来证明一下:相比标准卷积,HSB不会导致参数量的提升。相比标准 卷积,HSB具有更少的参数复杂度。标准卷积的参数复杂度(注:s表示组数,w表示每组的通道数)可以描述如下:
而HSB的参数复杂度则表示如下:
两者之间的大小关小可以通过下面的对比得到:
训练细节:作者毫无疑问的选择了PaddlePaddle框架进行模型训练,在ImageNet数据集上,每个图像随机裁剪 ,然后进行随机水平镜像,测试环境硬件环境为T4和TensorRT。在训练过程中,作者采用了LabelSmoothing, Mixup两种技术,采用了SGD(weight_decay=1e-4,momentum=0.9)优化器,Batch=256,学习率调整机制为consine,合计训练200epoch。
为更近一步提升模型精度,作者采用Cutmix替换Mixup,并添加RandAug与RandomErasing两种增广方式,同时调整weight_decay=4e-5训练了300epoch。
下表给出了不同ResNet改进方案的精度、参数量以及推理耗时对比。相比ResNet50-D,HS-ResNet50取得了1.2%的精度提升,此外采用更多训练trick的模型取得了81.28%的Top1精度。相比ResNeSt50,HS-ResNet50不仅具有更高的精度(0.26%higher),同时推理速度更快,参数量更少。
下表给出了所提方法在目标检测任务上的性能对比,它以FasterRCNN+RPN作为核心,采用不同的Backbone。可以看到:HS-ResNet将基准模型的精度由37.2%提升到了41.6%,同时具有比ResNet101-D更高的指标和推理速度。
下表给出了所提方法在实例分割任务上的性能对比,它以MaskRCNN+FPN作为核心方法,采用不同的ResNet作为骨干网络。可以看到:相比基准方法,所提方法将其性能由34.7%提升到38%,同时比ResNet101-D高1.2%。
下表给出了所提方法在语义分割任务上的性能对比,它以DeepLabV3+作为核心,采用了不同骨干网路,可以看到:相比ResNet50-D,所提方法取得了1.8%的性能提升。
最后,我们再来看一下消融实验分析。可以看到:更多的组数可以得到更高的Top1精度,但同时会降低推理速度;而更少的组数更多的通道数则会降低精度提升推理速度。
该文提出了一种新颖的HSB模块,它可以高效的提取多尺度特征,与此同时,作者基于HSB构建了ResNet改进HS-ResNet,它在多个视觉任务(如图像分类、目标检测、实例分割、语义分割等)上取得了SOTA性能。所提HSB具有“即插即用”特性,它可以轻易嵌入到现有网络中并提升性能,值得各位同学尝试把玩一番。
HS-ResNet论文PDF下载:
上述论文已打包好,在CVer公众号后台回复:HS-ResNet,即可下载论文PDF,推荐阅读学习!
下载2:CVPR / ECCV 2020开源代码
在CVer公众号后台回复:CVPR2020,即可下载CVPR 2020代码开源的论文合集
在CVer公众号后台回复:ECCV2020,即可下载ECCV 2020代码开源的论文合集
重磅!CVer-论文写作与投稿交流群成立
扫码添加CVer助手,可申请加入CVer-论文写作与投稿 微信交流群,目前已满2400+人,旨在交流顶会(CVPR/ICCV/ECCV/NIPS/ICML/ICLR/AAAI等)、顶刊(IJCV/TPAMI/TIP等)、SCI、EI、中文核心等写作与投稿事宜。
同时也可申请加入CVer大群和细分方向技术群,细分方向已涵盖:目标检测、图像分割、目标跟踪、人脸检测&识别、OCR、姿态估计、超分辨率、SLAM、医疗影像、Re-ID、GAN、NAS、深度估计、自动驾驶、强化学习、车道线检测、模型剪枝&压缩、去噪、去雾、去雨、风格迁移、遥感图像、行为识别、视频理解、图像融合、图像检索、论文投稿&交流、PyTorch和TensorFlow等群。
一定要备注:研究方向+地点+学校/公司+昵称(如论文写作+上海+上交+卡卡),根据格式备注,可更快被通过且邀请进群
▲长按加微信群
▲长按关注CVer公众号
整理不易,请给CVer点赞和在看!