深度神经网络在计算机视觉任务中取得了显著的成功。现有的神经网络主要在固定输入尺寸的空间域内运行。在实际应用中,图像通常很大,必须向下采样到预定的神经网络输入大小。尽管下行采样操作减少了计算量和所需的通信带宽,但它同时在不影响冗余和显著信息的前提下消除了冗余和显著信息,从而导致精度下降。受数字信号处理理论的启发,我们从频率的角度分析了频谱偏差,提出了一种基于学习的频率选择方法来识别可以在不损失精度的情况下去除的琐碎频率分量。提出的频域学习方法利用众所周知的神经网络的相同结构,如ResNet-50、MobileNetV2和Mask R-CNN,同时接受频域信息作为输入。实验结果表明,与传统的空间降采样方法相比,基于静态信道选择的频域学习方法可以获得更高的精度,同时进一步减小了输入数据的大小。针对相同输入大小的ImageNet分类,分别在ResNet-50和MobileNetV2上实现了1.41%和0.66%的top-1精度改进。即使只有一半的输入大小,该方法仍然可以将ResNet-50的前1位精度提高1%。此外,我们还观察到,在COCO数据集的实例分割方面,Mask R-CNN的平均精度提高了0.8%。

成为VIP会员查看完整内容
29

相关内容

【Google】监督对比学习,Supervised Contrastive Learning
专知会员服务
75+阅读 · 2020年4月24日
神经网络的拓扑结构,TOPOLOGY OF DEEP NEURAL NETWORKS
专知会员服务
33+阅读 · 2020年4月15日
CVPR 2019 | PointConv:在点云上高效实现卷积操作
机器之心
10+阅读 · 2019年4月21日
Unsupervised Learning via Meta-Learning
CreateAMind
42+阅读 · 2019年1月3日
一文概览用于图像分割的CNN
论智
14+阅读 · 2018年10月30日
深度剖析卷积神经网络
云栖社区
7+阅读 · 2018年5月27日
Learning in the Frequency Domain
Arxiv
11+阅读 · 2020年3月12日
Meta-Transfer Learning for Few-Shot Learning
Arxiv
8+阅读 · 2018年12月6日
VIP会员
微信扫码咨询专知VIP会员