Tasks that involve high-resolution dense prediction require a modeling of both local and global patterns in a large input field. Although the local and global structures often depend on each other and their simultaneous modeling is important, many convolutional neural network (CNN)-based approaches interchange representations in different resolutions only a few times. In this paper, we claim the importance of a dense simultaneous modeling of multiresolution representation and propose a novel CNN architecture called densely connected multidilated DenseNet (D3Net). D3Net involves a novel multidilated convolution that has different dilation factors in a single layer to model different resolutions simultaneously. By combining the multidilated convolution with the DenseNet architecture, D3Net incorporates multiresolution learning with an exponentially growing receptive field in almost all layers, while avoiding the aliasing problem that occurs when we naively incorporate the dilated convolution in DenseNet. Experiments on the image semantic segmentation task using Cityscapes and the audio source separation task using MUSDB18 show that the proposed method has superior performance over state-of-the-art methods.


翻译:涉及高分辨率密集预测的任务要求在一个大型输入领域对本地和全球模式进行建模。虽然本地和全球结构往往互相依赖,同时建模也很重要,但许多基于进化神经网络(CNN)的方法在不同分辨率中只是几次互换。在本文中,我们声称密集同时建模多分辨率代表器的重要性,并提议一个叫作密集连通的多光线网(D3Net)的新颖CNN结构。D3Net涉及一个新颖的多层演进,在同一个层次上具有不同的变异因素,可以同时建模不同的分辨率。D3Net结合多光化的演进与DenseNet结构,结合了多分辨率学习,几乎在所有层次上都有一个迅速增长的可容纳场,同时避免了当我们天性地将DenseNet的变异变法纳入时出现的别喻问题。利用城市景和MUDB18的音源分离任务,对图像拼图断任务进行了实验,显示拟议方法的性优于状态方法。

0
下载
关闭预览

相关内容

作为CVPR2017年的Best Paper, DenseNet脱离了加深网络层数(ResNet)和加宽网络结构(Inception)来提升网络性能的定式思维,从特征的角度考虑,通过特征重用和旁路(Bypass)设置,既大幅度减少了网络的参数量,又在一定程度上缓解了gradient vanishing问题的产生.结合信息流和特征复用的假设,DenseNet当之无愧成为2017年计算机视觉顶会的年度最佳论文.
专知会员服务
32+阅读 · 2021年6月12日
机器翻译深度学习最新综述
专知会员服务
99+阅读 · 2020年2月20日
Stabilizing Transformers for Reinforcement Learning
专知会员服务
60+阅读 · 2019年10月17日
[综述]深度学习下的场景文本检测与识别
专知会员服务
78+阅读 · 2019年10月10日
【SIGGRAPH2019】TensorFlow 2.0深度学习计算机图形学应用
专知会员服务
41+阅读 · 2019年10月9日
Hierarchically Structured Meta-learning
CreateAMind
26+阅读 · 2019年5月22日
计算机视觉领域顶会CVPR 2018 接受论文列表
深度学习DenseNet算法详解
数据挖掘入门与实战
7+阅读 · 2018年4月17日
Hierarchical Disentangled Representations
CreateAMind
4+阅读 · 2018年4月15日
Capsule Networks解析
机器学习研究会
11+阅读 · 2017年11月12日
【推荐】RNN/LSTM时序预测
机器学习研究会
25+阅读 · 2017年9月8日
【推荐】全卷积语义分割综述
机器学习研究会
19+阅读 · 2017年8月31日
Arxiv
5+阅读 · 2021年2月8日
VIP会员
Top
微信扫码咨询专知VIP会员