Recent advancements in deep neural networks have made remarkable leap-forwards in dense image prediction. However, the issue of feature alignment remains as neglected by most existing approaches for simplicity. Direct pixel addition between upsampled and local features leads to feature maps with misaligned contexts that, in turn, translate to mis-classifications in prediction, especially on object boundaries. In this paper, we propose a feature alignment module that learns transformation offsets of pixels to contextually align upsampled higher-level features; and another feature selection module to emphasize the lower-level features with rich spatial details. We then integrate these two modules in a top-down pyramidal architecture and present the Feature-aligned Pyramid Network (FaPN). Extensive experimental evaluations on four dense prediction tasks and four datasets have demonstrated the efficacy of FaPN, yielding an overall improvement of 1.2 - 2.6 points in AP / mIoU over FPN when paired with Faster / Mask R-CNN. In particular, our FaPN achieves the state-of-the-art of 56.7% mIoU on ADE20K when integrated within Mask-Former. The code is available from https://github.com/EMI-Group/FaPN.


翻译:深度神经网络最近的进步在密集图像预测中取得了显著的飞跃。然而,特征调整问题仍然被大多数现有的简单化方法所忽视。 直接标本和本地特征之间的直接像素添加导致地图与不匹配的背景,反过来又在预测中导致错误分类,特别是在物体边界上。 在本文件中,我们建议了一个特征调整模块,学习将像素转换为与上层特征相匹配的相容;另一个特征选择模块,以强调低层特征,并具有丰富的空间细节。然后,我们将这两个模块纳入一个上下层金字塔结构,并介绍符合地貌的金字塔网络(FAPN)。对四个密集的预测任务和四个数据集的广泛实验评价显示了FAPN的功效,使AP/ mIoU与FPN相比整体上1.2至2.6点得到全面改进,同时配对上快速/make R-CNN。特别是,我们的FAPN实现了56.7% mIO/FAMEM20K在MASP-FADE/FAMAR 20K内可使用的MAS-MIS-MASP-MAMS-MAMAMA-MAMEM20/FAMAMAMAR20K内可使用的数据代码。

0
下载
关闭预览

相关内容

Pyramid is a small, fast, down-to-earth Python web application development framework.
专知会员服务
31+阅读 · 2021年6月12日
CVPR2020 | 商汤-港中文等提出PV-RCNN:3D目标检测新网络
专知会员服务
43+阅读 · 2020年4月17日
【ICLR-2020】网络反卷积,NETWORK DECONVOLUTION
专知会员服务
38+阅读 · 2020年2月21日
LibRec 精选:AutoML for Contextual Bandits
LibRec智能推荐
7+阅读 · 2019年9月19日
深度卷积神经网络中的降采样
极市平台
12+阅读 · 2019年5月24日
Unsupervised Learning via Meta-Learning
CreateAMind
42+阅读 · 2019年1月3日
《pyramid Attention Network for Semantic Segmentation》
统计学习与视觉计算组
44+阅读 · 2018年8月30日
论文笔记之Feature Selective Networks for Object Detection
统计学习与视觉计算组
21+阅读 · 2018年7月26日
语义分割+视频分割开源代码集合
极市平台
35+阅读 · 2018年3月5日
Learning Discriminative Model Prediction for Tracking
Panoptic Feature Pyramid Networks
Arxiv
3+阅读 · 2019年1月8日
Scale-Aware Trident Networks for Object Detection
Arxiv
4+阅读 · 2019年1月7日
Arxiv
5+阅读 · 2018年4月17日
Arxiv
3+阅读 · 2017年10月1日
VIP会员
相关VIP内容
专知会员服务
31+阅读 · 2021年6月12日
CVPR2020 | 商汤-港中文等提出PV-RCNN:3D目标检测新网络
专知会员服务
43+阅读 · 2020年4月17日
【ICLR-2020】网络反卷积,NETWORK DECONVOLUTION
专知会员服务
38+阅读 · 2020年2月21日
Top
微信扫码咨询专知VIP会员