南邮提出实时语义分割的轻量级网络：LEDNET，可达 71 FPS！70.6% class mIoU！即将开源 - 专知

会员服务 ·

0

南邮提出实时语义分割的轻量级网络：LEDNET，可达 71 FPS！70.6% class mIoU！即将开源

2019 年 5 月 10 日 CVer

点击上方“CVer”，选择加"星标"或“置顶”

重磅干货，第一时间送达

前戏

之前 CVer 推了几篇关于语义分割的论文，大多在于提高 mIoU，但追求实时性的比较少。本文要介绍的 LEDNet（Light Encoder-Decoder Network）是由南京邮电大学和天普大学联合提出的用于实时语义分割的轻量级网络。

LEDNet 能够在单个GTX 1080Ti GPU中以超过71 FPS的速度运行。实验表明，该算法在 CityScapes 数据集的速度和准确性权衡方面取得了SOTA。

目前 LEDNet 论文已被 ICIP 2019 录用，官方已经提供该算法的 github 链接，但并没有上传测试/训练源码，估计还在准备中。

LEDNet

《LEDNet: A Lightweight Encoder-Decoder Network for Real-Time Semantic Segmentation》

arXiv: https://arxiv.org/abs/1905.02423

github: https://github.com/xiaoyufenfei/LEDNet

作者团队：南京邮电大学和天普大学

注：2019年05月08日刚出炉的paper

Abstract：算力负担限制了移动设备中CNN在密集估计任务中的使用。在本文中，我们提出了一个轻量级网络来解决这个问题，即 LEDNet，它采用非对称（asymmetric）编码器 - 解码器架构来进行实时语义分割。更具体地说，编码器采用 ResNet 作为骨干网络，其中有两个新操作：channel split and shuffle，被应用在每个残余块中，以大大降低计算成本，同时保持更高的分割精度。另一方面，在解码器中采用注意力金字塔网络（APN，attention pyramid network）以进一步减轻整个网络的复杂性。我们的模型参数不到1M，并且能够在单个GTX 1080Ti GPU中以超过71 FPS的速度运行。全面的实验表明，我们的方法在 CityScapes 数据集的速度和准确性权衡方面取得了SOTA。

本文算法（LEDNet）流程图：不对称结构

本文三个创新点：

（1）LEDNet的不对称结构（asymmetrical architecture），如上图所示，使得网络参数大大减少，加速了推理过程；

（2）残差网络中的 Channel split and shuffle 有强大的特征表示。此外， Channel shuffle 是differentiable，可以嵌入网络结构中进行端到端训练。

（3）在 decoder 端，采用特征金字塔的注意力机制来设计APN，进一步降低了整个网络的复杂性。

带有 Split and Shuffle Operations的残差模块

由下图可知，LEDNet引入：split-shuffle-bottleneck(SS-bt)，其中可以看到整体结构还是ResNet，但额外引入 Channel Split、Concat层和 Channel Shuffle。

Channle Split 将输入分离成两个 lower-dimensional 分支（即各自一半channel），通过设计的3x1 和 1x3卷积，在将两个分支 Concat一起，并最后利用 ShuffleNet中的 Channel Shuffle操作。

APN Decoder

来直观看看 LEDNet 的参数设计：

实验结果

表 2 和表 3 直观的说明了对比结果，LEDNet 在准确性和效率方面实现了最佳可行的 trade-off，如 LEDNet 达到 70.6% class mIoU 和 87.1% category mIoU，并且 71 FPS，不到 1M参数。（测试GPU：单个GTX 1080ti）

官方已经给出LEDNet的github链接，期待早点将源码放出来~

arXiv: https://arxiv.org/abs/1905.02423

github: https://github.com/xiaoyufenfei/LEDNet

CVer-图像分割交流群

扫码添加CVer助手，可申请加入CVer-图像分割交流群。一定要备注：图像分割+地点+学校/公司+昵称（如图像分割+上海+上交+卡卡）

▲长按加群

这么硬的论文分享，麻烦给我一个在在看

▲长按关注我们

麻烦给我一个在看！

登录查看更多

3

相关内容

LEDNET

CVPR2020 | 商汤-港中文等提出PV-RCNN：3D目标检测新网络

CVPR2020 | 商汤-港中文等提出PV-RCNN：3D目标检测新网络

专知会员服务

45+阅读 · 2020年4月17日

【华为-诺亚实验室】动态BERT, Dynamic BERT with Adaptive Width and Depth

【华为-诺亚实验室】动态BERT, Dynamic BERT with Adaptive Width and Depth

专知会员服务

24+阅读 · 2020年4月13日

CVPR 2020 | MetaFuse：用于人体姿态估计的预训练信息融合模型

CVPR 2020 | MetaFuse：用于人体姿态估计的预训练信息融合模型

专知会员服务

25+阅读 · 2020年4月2日

【阿里巴巴达摩院】TResNet: 高性能的GPU专用架构，GPU-Dedicated Architecture

【阿里巴巴达摩院】TResNet: 高性能的GPU专用架构，GPU-Dedicated Architecture

专知会员服务

33+阅读 · 2020年4月1日

【CVPR2020-Oral-计算所-旷视】学习用于语义分割的动态路由，Learning Dynamic Routing

【CVPR2020-Oral-计算所-旷视】学习用于语义分割的动态路由，Learning Dynamic Routing

专知会员服务

27+阅读 · 2020年3月24日

50+篇《神经架构搜索NAS》2020论文合集

专知会员服务

61+阅读 · 2020年3月19日

[CVPR 2020 Oral-牛津] RandLA-Net:大场景三维点云语义分割新框架

[CVPR 2020 Oral-牛津] RandLA-Net:大场景三维点云语义分割新框架

专知会员服务

26+阅读 · 2020年3月15日

【Google】利用AUTOML实现加速感知神经网络设计

【Google】利用AUTOML实现加速感知神经网络设计

专知会员服务

30+阅读 · 2020年3月5日

阿里巴巴达摩院发布「2020十大科技趋势」

阿里巴巴达摩院发布「2020十大科技趋势」

专知会员服务

108+阅读 · 2020年1月2日

深度神经网络模型压缩与加速综述

深度神经网络模型压缩与加速综述

专知会员服务

129+阅读 · 2019年10月12日

47.4mAP！最强Anchor-free目标检测网络：SAPD

47.4mAP！最强Anchor-free目标检测网络：SAPD

极市平台

13+阅读 · 2019年12月16日

语义分割中的Attention和低秩重建

语义分割中的Attention和低秩重建

极市平台

37+阅读 · 2019年9月1日

综述 | 语义分割经典网络及轻量化模型盘点

综述 | 语义分割经典网络及轻量化模型盘点

计算机视觉life

51+阅读 · 2019年7月23日

PyTorch语义分割开源库semseg

PyTorch语义分割开源库semseg

极市平台

25+阅读 · 2019年6月6日

精度高、模型小、速度快！梯形DenseNets结构实现语义分割新高度！

精度高、模型小、速度快！梯形DenseNets结构实现语义分割新高度！

计算机视觉life

5+阅读 · 2019年5月18日

加州大学提出：实时实例分割算法YOLACT，可达33 FPS/30mAP！现已开源！

加州大学提出：实时实例分割算法YOLACT，可达33 FPS/30mAP！现已开源！

极市平台

9+阅读 · 2019年4月16日

【泡泡一分钟】CReaM: 使用卷积网络估计深度的浓缩实时模型

【泡泡一分钟】CReaM: 使用卷积网络估计深度的浓缩实时模型

泡泡机器人SLAM

5+阅读 · 2019年3月24日

ECCV2018|ShuffleNetV2：轻量级CNN网络中的桂冠

ECCV2018|ShuffleNetV2：轻量级CNN网络中的桂冠

极市平台

7+阅读 · 2018年11月5日

语义分割研究党福利来袭，谷歌宣布开源 DeepLabv3+

语义分割研究党福利来袭，谷歌宣布开源 DeepLabv3+

AI研习社

7+阅读 · 2018年3月13日

【泡泡一分钟】用于图像配准的级联Lucas-Kanade网络（CVPR-10）

【泡泡一分钟】用于图像配准的级联Lucas-Kanade网络（CVPR-10）

泡泡机器人SLAM

55+阅读 · 2017年10月31日

EfficientDet: Scalable and Efficient Object Detection

EfficientDet: Scalable and Efficient Object Detection

Arxiv

6+阅读 · 2019年11月20日

LadderNet: Multi-path networks based on U-Net for medical image segmentation

LadderNet: Multi-path networks based on U-Net for medical image segmentation

Arxiv

7+阅读 · 2019年8月28日

TensorMask: A Foundation for Dense Object Segmentation

TensorMask: A Foundation for Dense Object Segmentation

Arxiv

10+阅读 · 2019年3月28日

Auto-DeepLab: Hierarchical Neural Architecture Search for Semantic Image Segmentation

Auto-DeepLab: Hierarchical Neural Architecture Search for Semantic Image Segmentation

Arxiv

5+阅读 · 2019年1月10日

ShelfNet for Real-time Semantic Segmentation

Arxiv

7+阅读 · 2018年12月10日

Efficient Dense Modules of Asymmetric Convolution for Real-Time Semantic Segmentation

Efficient Dense Modules of Asymmetric Convolution for Real-Time Semantic Segmentation

Arxiv

9+阅读 · 2018年9月17日

MnasNet: Platform-Aware Neural Architecture Search for Mobile

Arxiv

4+阅读 · 2018年7月31日

Piecewise Flat Embedding for Image Segmentation

Arxiv

3+阅读 · 2018年5月20日

DetNet: A Backbone network for Object Detection

Arxiv

5+阅读 · 2018年4月17日

Path Aggregation Network for Instance Segmentation

Arxiv

3+阅读 · 2018年3月5日

VIP会员

相关主题

编码器-解码器（模型）

相关VIP内容

CVPR2020 | 商汤-港中文等提出PV-RCNN：3D目标检测新网络

CVPR2020 | 商汤-港中文等提出PV-RCNN：3D目标检测新网络

专知会员服务

45+阅读 · 2020年4月17日

【华为-诺亚实验室】动态BERT, Dynamic BERT with Adaptive Width and Depth

【华为-诺亚实验室】动态BERT, Dynamic BERT with Adaptive Width and Depth

专知会员服务

24+阅读 · 2020年4月13日

CVPR 2020 | MetaFuse：用于人体姿态估计的预训练信息融合模型

CVPR 2020 | MetaFuse：用于人体姿态估计的预训练信息融合模型

专知会员服务

25+阅读 · 2020年4月2日

【阿里巴巴达摩院】TResNet: 高性能的GPU专用架构，GPU-Dedicated Architecture

【阿里巴巴达摩院】TResNet: 高性能的GPU专用架构，GPU-Dedicated Architecture

专知会员服务

33+阅读 · 2020年4月1日

【CVPR2020-Oral-计算所-旷视】学习用于语义分割的动态路由，Learning Dynamic Routing

【CVPR2020-Oral-计算所-旷视】学习用于语义分割的动态路由，Learning Dynamic Routing

专知会员服务

27+阅读 · 2020年3月24日

50+篇《神经架构搜索NAS》2020论文合集

专知会员服务

61+阅读 · 2020年3月19日

[CVPR 2020 Oral-牛津] RandLA-Net:大场景三维点云语义分割新框架

[CVPR 2020 Oral-牛津] RandLA-Net:大场景三维点云语义分割新框架

专知会员服务

26+阅读 · 2020年3月15日

【Google】利用AUTOML实现加速感知神经网络设计

【Google】利用AUTOML实现加速感知神经网络设计

专知会员服务

30+阅读 · 2020年3月5日

阿里巴巴达摩院发布「2020十大科技趋势」

阿里巴巴达摩院发布「2020十大科技趋势」

专知会员服务

108+阅读 · 2020年1月2日

深度神经网络模型压缩与加速综述

深度神经网络模型压缩与加速综述

专知会员服务

129+阅读 · 2019年10月12日

热门VIP内容

开通专知VIP会员享更多权益服务

新质生成式AI赋能产业变革的实践与路径

用于多模态大模型的离散标记化：全面综述

Nature综述：金融网络中的物理学

【CMU博士论文】通信高效且差分隐私的优化方法

相关资讯

47.4mAP！最强Anchor-free目标检测网络：SAPD

47.4mAP！最强Anchor-free目标检测网络：SAPD

极市平台

13+阅读 · 2019年12月16日

语义分割中的Attention和低秩重建

语义分割中的Attention和低秩重建

极市平台

37+阅读 · 2019年9月1日

综述 | 语义分割经典网络及轻量化模型盘点

综述 | 语义分割经典网络及轻量化模型盘点

计算机视觉life

51+阅读 · 2019年7月23日

PyTorch语义分割开源库semseg

PyTorch语义分割开源库semseg

极市平台

25+阅读 · 2019年6月6日

精度高、模型小、速度快！梯形DenseNets结构实现语义分割新高度！

精度高、模型小、速度快！梯形DenseNets结构实现语义分割新高度！

计算机视觉life

5+阅读 · 2019年5月18日

加州大学提出：实时实例分割算法YOLACT，可达33 FPS/30mAP！现已开源！

加州大学提出：实时实例分割算法YOLACT，可达33 FPS/30mAP！现已开源！

极市平台

9+阅读 · 2019年4月16日

【泡泡一分钟】CReaM: 使用卷积网络估计深度的浓缩实时模型

【泡泡一分钟】CReaM: 使用卷积网络估计深度的浓缩实时模型

泡泡机器人SLAM

5+阅读 · 2019年3月24日

ECCV2018|ShuffleNetV2：轻量级CNN网络中的桂冠

ECCV2018|ShuffleNetV2：轻量级CNN网络中的桂冠

极市平台

7+阅读 · 2018年11月5日

语义分割研究党福利来袭，谷歌宣布开源 DeepLabv3+

语义分割研究党福利来袭，谷歌宣布开源 DeepLabv3+

AI研习社

7+阅读 · 2018年3月13日

【泡泡一分钟】用于图像配准的级联Lucas-Kanade网络（CVPR-10）

【泡泡一分钟】用于图像配准的级联Lucas-Kanade网络（CVPR-10）

泡泡机器人SLAM

55+阅读 · 2017年10月31日

相关论文

EfficientDet: Scalable and Efficient Object Detection

EfficientDet: Scalable and Efficient Object Detection

Arxiv

6+阅读 · 2019年11月20日

LadderNet: Multi-path networks based on U-Net for medical image segmentation

LadderNet: Multi-path networks based on U-Net for medical image segmentation

Arxiv

7+阅读 · 2019年8月28日

TensorMask: A Foundation for Dense Object Segmentation

TensorMask: A Foundation for Dense Object Segmentation

Arxiv

10+阅读 · 2019年3月28日

Auto-DeepLab: Hierarchical Neural Architecture Search for Semantic Image Segmentation

Auto-DeepLab: Hierarchical Neural Architecture Search for Semantic Image Segmentation

Arxiv

5+阅读 · 2019年1月10日

ShelfNet for Real-time Semantic Segmentation

Arxiv

7+阅读 · 2018年12月10日

Efficient Dense Modules of Asymmetric Convolution for Real-Time Semantic Segmentation

Efficient Dense Modules of Asymmetric Convolution for Real-Time Semantic Segmentation

Arxiv

9+阅读 · 2018年9月17日

MnasNet: Platform-Aware Neural Architecture Search for Mobile

Arxiv

4+阅读 · 2018年7月31日

Piecewise Flat Embedding for Image Segmentation

Arxiv

3+阅读 · 2018年5月20日

DetNet: A Backbone network for Object Detection

Arxiv

5+阅读 · 2018年4月17日

Path Aggregation Network for Instance Segmentation

Arxiv

3+阅读 · 2018年3月5日

大家都在搜

软件无线电

大型语言模型

CMU博士论文

论文浅尝 - ICLR2020 | 通过神经逻辑归纳学习有效地解释

微信扫码咨询专知VIP会员