The objective of this work is to segment high-resolution images without overloading GPU memory usage or losing the fine details in the output segmentation map. The memory constraint means that we must either downsample the big image or divide the image into local patches for separate processing. However, the former approach would lose the fine details, while the latter can be ambiguous due to the lack of a global picture. In this work, we present MagNet, a multi-scale framework that resolves local ambiguity by looking at the image at multiple magnification levels. MagNet has multiple processing stages, where each stage corresponds to a magnification level, and the output of one stage is fed into the next stage for coarse-to-fine information propagation. Each stage analyzes the image at a higher resolution than the previous stage, recovering the previously lost details due to the lossy downsampling step, and the segmentation output is progressively refined through the processing stages. Experiments on three high-resolution datasets of urban views, aerial scenes, and medical images show that MagNet consistently outperforms the state-of-the-art methods by a significant margin.


翻译:这项工作的目标是在不给 GPU 内存使用量超载的情况下将高分辨率图像进行分解,或在输出区块图中丢失精细细节。 内存限制意味着我们必须将大图像降格或将图像分成局部部分, 以便分开处理。 但是, 前一种方法会丢失精细细节, 而后一种方法则会由于缺乏全局图像而变得模糊不清。 在这项工作中, 我们展示了MagNet, 这个多尺度框架通过在多个放大度水平上查看图像来解决本地的模糊问题。 MagNet有多个处理阶段, 每个阶段都与放大水平相对应, 一个阶段的输出被输入到下一个阶段, 用于粗度至精度信息传播。 每个阶段分析图像的分辨率高于前一个阶段, 恢复先前因损失的下游步骤而丢失的细节, 分解输出通过处理阶段逐渐精细化。 在三个高分辨率的城市视图、 航空场景和医疗图象数据集上进行的实验显示, MagNet 始终在显著的边缘超越了状态方法。

0
下载
关闭预览

相关内容

Processing 是一门开源编程语言和与之配套的集成开发环境(IDE)的名称。Processing 在电子艺术和视觉设计社区被用来教授编程基础,并运用于大量的新媒体和互动艺术作品中。
【CVPR2021】动态度量学习
专知会员服务
39+阅读 · 2021年3月30日
专知会员服务
83+阅读 · 2021年1月7日
图像分割方法综述
专知会员服务
52+阅读 · 2020年11月22日
[综述]深度学习下的场景文本检测与识别
专知会员服务
77+阅读 · 2019年10月10日
TorchSeg:基于pytorch的语义分割算法开源了
极市平台
20+阅读 · 2019年1月28日
Hierarchical Disentangled Representations
CreateAMind
4+阅读 · 2018年4月15日
DeepLab V3
计算机视觉战队
9+阅读 · 2018年4月2日
gan生成图像at 1024² 的 代码 论文
CreateAMind
4+阅读 · 2017年10月31日
【推荐】视频目标分割基础
机器学习研究会
9+阅读 · 2017年9月19日
【推荐】全卷积语义分割综述
机器学习研究会
19+阅读 · 2017年8月31日
Arxiv
8+阅读 · 2018年5月15日
Arxiv
5+阅读 · 2016年10月24日
VIP会员
相关VIP内容
【CVPR2021】动态度量学习
专知会员服务
39+阅读 · 2021年3月30日
专知会员服务
83+阅读 · 2021年1月7日
图像分割方法综述
专知会员服务
52+阅读 · 2020年11月22日
[综述]深度学习下的场景文本检测与识别
专知会员服务
77+阅读 · 2019年10月10日
Top
微信扫码咨询专知VIP会员