Learning pyramidal feature representations is crucial for recognizing object instances at different scales. Feature Pyramid Network (FPN) is the classic architecture to build a feature pyramid with high-level semantics throughout. However, intrinsic defects in feature extraction and fusion inhibit FPN from further aggregating more discriminative features. In this work, we propose Attention Aggregation based Feature Pyramid Network (A^2-FPN), to improve multi-scale feature learning through attention-guided feature aggregation. In feature extraction, it extracts discriminative features by collecting-distributing multi-level global context features, and mitigates the semantic information loss due to drastically reduced channels. In feature fusion, it aggregates complementary information from adjacent features to generate location-wise reassembly kernels for content-aware sampling, and employs channel-wise reweighting to enhance the semantic consistency before element-wise addition. A^2-FPN shows consistent gains on different instance segmentation frameworks. By replacing FPN with A^2-FPN in Mask R-CNN, our model boosts the performance by 2.1% and 1.6% mask AP when using ResNet-50 and ResNet-101 as backbone, respectively. Moreover, A^2-FPN achieves an improvement of 2.0% and 1.4% mask AP when integrated into the strong baselines such as Cascade Mask R-CNN and Hybrid Task Cascade.


翻译:学习金字塔特征的表示方式对于在不同尺度上识别物体实例至关重要。 地貌金字塔网络( FPN) 是建立具有高层次语义学的特征金字塔的经典建筑结构。 但是,地貌提取和聚合的内在缺陷使得FPN无法进一步集聚更具歧视性的特征。 在这项工作中,我们建议关注聚合基于地貌金字网(A2-FPN),通过关注引导特征聚合,通过关注引导特征聚合,改进多规模特征学习。 在特征提取中,它通过收集分布的多级全球背景特征来提取歧视性特征特征,并减轻由于频道大幅缩小而导致的语义信息损失。 在特性聚合中,它汇集了来自邻近特征的互补信息,以产生基于位置的重新组合内脏内容取样的内脏信息。 在使用 ResNet-N-N101和AS-MFAS 分别以2.1% 和1.6% AS-MIS-maismail 分别以2.1% 和1.6% AS- mas-max AS- mex- mass- AS- ASemplas- mass- mass- mass- mass- mass- mass- mass- mass- mass- mess- mass- mass- mass- mass- mass- mass- mass- mass- mass- mass- mass- mass- mass- mass- mass- mass- mass- mass- mass- mass- mass- mass- mass- mass- mass- mass- mass- mass- mass- mass- mass- mass- mass- mass- mass- mass- mass- mass- mass- mass- mass- mass- mass- mass- mass- mass- mass- mass- mass- mass- mass- mass-mal- mass- mass- mass-mal-le-le-l-l 和/

1
下载
关闭预览

相关内容

Pyramid is a small, fast, down-to-earth Python web application development framework.
专知会员服务
32+阅读 · 2020年12月25日
抢鲜看!13篇CVPR2020论文链接/开源代码/解读
专知会员服务
49+阅读 · 2020年2月26日
【ICLR-2020】网络反卷积,NETWORK DECONVOLUTION
专知会员服务
38+阅读 · 2020年2月21日
CVPR 2019 | 34篇 CVPR 2019 论文实现代码
AI科技评论
21+阅读 · 2019年6月23日
Spatial Group-wise Enhance算法详解
人工智能前沿讲习班
9+阅读 · 2019年6月13日
Transferring Knowledge across Learning Processes
CreateAMind
27+阅读 · 2019年5月18日
GCNet:当Non-local遇见SENet
极市平台
11+阅读 · 2019年5月9日
CVPR2019 | 全景分割:Attention-guided Unified Network
极市平台
9+阅读 · 2019年3月3日
《pyramid Attention Network for Semantic Segmentation》
统计学习与视觉计算组
44+阅读 · 2018年8月30日
论文笔记之attention mechanism专题1:SA-Net(CVPR 2018)
统计学习与视觉计算组
16+阅读 · 2018年4月5日
【推荐】全卷积语义分割综述
机器学习研究会
19+阅读 · 2017年8月31日
Panoptic Feature Pyramid Networks
Arxiv
3+阅读 · 2019年1月8日
Arxiv
3+阅读 · 2018年3月5日
VIP会员
相关资讯
CVPR 2019 | 34篇 CVPR 2019 论文实现代码
AI科技评论
21+阅读 · 2019年6月23日
Spatial Group-wise Enhance算法详解
人工智能前沿讲习班
9+阅读 · 2019年6月13日
Transferring Knowledge across Learning Processes
CreateAMind
27+阅读 · 2019年5月18日
GCNet:当Non-local遇见SENet
极市平台
11+阅读 · 2019年5月9日
CVPR2019 | 全景分割:Attention-guided Unified Network
极市平台
9+阅读 · 2019年3月3日
《pyramid Attention Network for Semantic Segmentation》
统计学习与视觉计算组
44+阅读 · 2018年8月30日
论文笔记之attention mechanism专题1:SA-Net(CVPR 2018)
统计学习与视觉计算组
16+阅读 · 2018年4月5日
【推荐】全卷积语义分割综述
机器学习研究会
19+阅读 · 2017年8月31日
Top
微信扫码咨询专知VIP会员