用于RGB-D室内场景语义分割的门式融合局部感知反卷积网络 - 专知

会员服务 ·

0

用于RGB-D室内场景语义分割的门式融合局部感知反卷积网络

2017 年 10 月 30 日 机器学习研究会 泡泡机器人SLAM

摘要

大家好，今天为大家带来的文章是"Locality-Sensitive Deconvolution Networks with Gated Fusion for RGB-D Indoor Semantic Segmentation"——用于RGB-D室内场景语义分割的门式融合局部感知反卷积网络，该文章选自CVPR2017。

从左至右依次是彩色图，HHA图，Ground Truth和网络的预测结果

这篇文章使用RGB-D数据进行室内场景的语义分割。尽管常用的反卷积网络在这一问题上实现了令人印象深刻的效果，但我们发现这一问题在以下两方面还有继续提升的空间。

其中之一是边缘分割。反卷积网络使用更多的像素来预测每个像素的类别。这一行为隐含的限制了物体边缘的分割精度。另一方面是彩色图像和深度图像数据融合的问题。近些年来最好的方法一般都使用相等的权值来融合两者。但是这一做法并没有考虑到这两者对于不同场景下不同类别的表达能力的差异。

为了解决这两个问题，我们第一个提出了局部感知的反卷积神经网络(LS-DeconvNet)。LS-DeconvNet使用RGB-D数据，在每一个反卷积层结合了局部视觉信息和几何信息。我们的做法使网络不仅能够有更大的感受域，同时也可以恢复出更加精细的物体边缘。对于RGB-D数据的融合，我们引入了一个门式融合的层来有效的结合两个LS-DeconvNets。这一层可以学习RGB和Depth数据在每一个像素上的融合权值。

我们的算法在 SUN RGB-D和NYU-Depthv2取得了最好的效果。

转自：泡泡机器人SLAM

登录查看更多

7

相关内容

反卷积网络

反卷积网络

【CVPR2020】时序分组注意力视频超分

【CVPR2020】时序分组注意力视频超分

专知会员服务

31+阅读 · 2020年7月1日

【CVPR2020-Oral】用于深度网络的任务感知超参数

【CVPR2020-Oral】用于深度网络的任务感知超参数

专知会员服务

28+阅读 · 2020年5月25日

CVPR2020 | 商汤-港中文等提出PV-RCNN：3D目标检测新网络

CVPR2020 | 商汤-港中文等提出PV-RCNN：3D目标检测新网络

专知会员服务

45+阅读 · 2020年4月17日

【CVPR2020-Oral】用于任务感知的持续学习的条件信道门控网络

专知会员服务

21+阅读 · 2020年4月2日

【CVPR2020-百度】用于视觉识别的门控信道变换

【CVPR2020-百度】用于视觉识别的门控信道变换

专知会员服务

13+阅读 · 2020年3月30日

【CVPR2020-Oral-清华大学】MaskFlownet:使用可学习遮挡掩模的非对称特征匹配

【CVPR2020-Oral-清华大学】MaskFlownet:使用可学习遮挡掩模的非对称特征匹配

专知会员服务

29+阅读 · 2020年3月25日

【CVPR2020-上海交大】自组织记忆模块来解决网络图片中的标签噪声和背景噪声

【CVPR2020-上海交大】自组织记忆模块来解决网络图片中的标签噪声和背景噪声

专知会员服务

28+阅读 · 2020年3月18日

[CVPR 2020 Oral-牛津] RandLA-Net:大场景三维点云语义分割新框架

[CVPR 2020 Oral-牛津] RandLA-Net:大场景三维点云语义分割新框架

专知会员服务

26+阅读 · 2020年3月15日

【清华-百度】面向季节性时空数据的预测式循环网络及其在城市计算中的应用，计算机学报

【清华-百度】面向季节性时空数据的预测式循环网络及其在城市计算中的应用，计算机学报

专知会员服务

42+阅读 · 2020年3月10日

【IJCV2020】通过迭代亲密学习实现弱监督语义分割

专知会员服务

42+阅读 · 2020年2月20日

【泡泡图灵智库】工业环境中用于表面缺陷检测的全卷积网络

【泡泡图灵智库】工业环境中用于表面缺陷检测的全卷积网络

泡泡机器人SLAM

12+阅读 · 2019年9月21日

【泡泡图灵智库】体积实例感知语义建图与3D对象发现

【泡泡图灵智库】体积实例感知语义建图与3D对象发现

泡泡机器人SLAM

22+阅读 · 2019年9月7日

【泡泡图灵智库】协同视觉-惯性SLAM

【泡泡图灵智库】协同视觉-惯性SLAM

泡泡机器人SLAM

29+阅读 · 2019年9月6日

【泡泡图灵智库】基于语义分割图像的长期视觉定位（ICRA）

【泡泡图灵智库】基于语义分割图像的长期视觉定位（ICRA）

泡泡机器人SLAM

8+阅读 · 2019年5月30日

【泡泡点云时空】基于选择性传感器融合的神经网络视觉里程计

【泡泡点云时空】基于选择性传感器融合的神经网络视觉里程计

泡泡机器人SLAM

18+阅读 · 2019年4月21日

【泡泡图灵智库】基于点和体融合的实时三维重建（IROS）

【泡泡图灵智库】基于点和体融合的实时三维重建（IROS）

泡泡机器人SLAM

9+阅读 · 2019年3月20日

【泡泡图灵智库】SqueezeSeg：从3D LiDAR点云中实时分割路面物体的循环CRF卷积神经网络（ICRA）

【泡泡图灵智库】SqueezeSeg：从3D LiDAR点云中实时分割路面物体的循环CRF卷积神经网络（ICRA）

泡泡机器人SLAM

6+阅读 · 2019年1月25日

【泡泡一分钟】RNFNet: 用于室内语义分割的RGB-D多层级残差特征融合（ICCV2017-523）

【泡泡一分钟】RNFNet: 用于室内语义分割的RGB-D多层级残差特征融合（ICCV2017-523）

泡泡机器人SLAM

10+阅读 · 2018年12月21日

【泡泡一分钟】基于场景流传播的动态街道场景的语义建图和目标检测

【泡泡一分钟】基于场景流传播的动态街道场景的语义建图和目标检测

泡泡机器人SLAM

9+阅读 · 2018年4月29日

【泡泡一分钟】用于街景语义分割的全分辨率残差网络（CVPR-12）

【泡泡一分钟】用于街景语义分割的全分辨率残差网络（CVPR-12）

泡泡机器人SLAM

5+阅读 · 2017年11月2日

Hierarchy Parsing for Image Captioning

Hierarchy Parsing for Image Captioning

Arxiv

6+阅读 · 2019年9月10日

LadderNet: Multi-path networks based on U-Net for medical image segmentation

LadderNet: Multi-path networks based on U-Net for medical image segmentation

Arxiv

7+阅读 · 2019年8月28日

Sparse2Dense: From direct sparse odometry to dense 3D reconstruction

Sparse2Dense: From direct sparse odometry to dense 3D reconstruction

Arxiv

9+阅读 · 2019年3月21日

3D Backbone Network for 3D Object Detection

Arxiv

12+阅读 · 2019年1月24日

Attentive Relational Networks for Mapping Images to Scene Graphs

Arxiv

3+阅读 · 2018年11月26日

Efficient Dense Modules of Asymmetric Convolution for Real-Time Semantic Segmentation

Efficient Dense Modules of Asymmetric Convolution for Real-Time Semantic Segmentation

Arxiv

9+阅读 · 2018年9月17日

Simultaneous Localization and Mapping (SLAM) using RTAB-MAP

Simultaneous Localization and Mapping (SLAM) using RTAB-MAP

Arxiv

7+阅读 · 2018年9月9日

Acquisition of Localization Confidence for Accurate Object Detection

Acquisition of Localization Confidence for Accurate Object Detection

Arxiv

4+阅读 · 2018年7月30日

Long-term Visual Localization using Semantically Segmented Images

Arxiv

7+阅读 · 2018年1月16日

Learning Deep Structured Multi-Scale Features using Attention-Gated CRFs for Contour Prediction

Arxiv

4+阅读 · 2018年1月1日

VIP会员

相关主题

反卷积网络

相关VIP内容

【CVPR2020】时序分组注意力视频超分

【CVPR2020】时序分组注意力视频超分

专知会员服务

31+阅读 · 2020年7月1日

【CVPR2020-Oral】用于深度网络的任务感知超参数

【CVPR2020-Oral】用于深度网络的任务感知超参数

专知会员服务

28+阅读 · 2020年5月25日

CVPR2020 | 商汤-港中文等提出PV-RCNN：3D目标检测新网络

CVPR2020 | 商汤-港中文等提出PV-RCNN：3D目标检测新网络

专知会员服务

45+阅读 · 2020年4月17日

【CVPR2020-Oral】用于任务感知的持续学习的条件信道门控网络

专知会员服务

21+阅读 · 2020年4月2日

【CVPR2020-百度】用于视觉识别的门控信道变换

【CVPR2020-百度】用于视觉识别的门控信道变换

专知会员服务

13+阅读 · 2020年3月30日

【CVPR2020-Oral-清华大学】MaskFlownet:使用可学习遮挡掩模的非对称特征匹配

【CVPR2020-Oral-清华大学】MaskFlownet:使用可学习遮挡掩模的非对称特征匹配

专知会员服务

29+阅读 · 2020年3月25日

【CVPR2020-上海交大】自组织记忆模块来解决网络图片中的标签噪声和背景噪声

【CVPR2020-上海交大】自组织记忆模块来解决网络图片中的标签噪声和背景噪声

专知会员服务

28+阅读 · 2020年3月18日

[CVPR 2020 Oral-牛津] RandLA-Net:大场景三维点云语义分割新框架

[CVPR 2020 Oral-牛津] RandLA-Net:大场景三维点云语义分割新框架

专知会员服务

26+阅读 · 2020年3月15日

【清华-百度】面向季节性时空数据的预测式循环网络及其在城市计算中的应用，计算机学报

【清华-百度】面向季节性时空数据的预测式循环网络及其在城市计算中的应用，计算机学报

专知会员服务

42+阅读 · 2020年3月10日

【IJCV2020】通过迭代亲密学习实现弱监督语义分割

专知会员服务

42+阅读 · 2020年2月20日

热门VIP内容

开通专知VIP会员享更多权益服务

《乌克兰无人机产业：志愿者与政策在构建新兴无人机产业中的协同作用》最新报告

《人工智能辅助决策中的数据可视化：系统性综述》

人工智能驱动弹药制造现代化：美国陆军转型之路

《敏捷作战部署中枢纽-辐条基地选址优化研究》80页

相关资讯

【泡泡图灵智库】工业环境中用于表面缺陷检测的全卷积网络

【泡泡图灵智库】工业环境中用于表面缺陷检测的全卷积网络

泡泡机器人SLAM

12+阅读 · 2019年9月21日

【泡泡图灵智库】体积实例感知语义建图与3D对象发现

【泡泡图灵智库】体积实例感知语义建图与3D对象发现

泡泡机器人SLAM

22+阅读 · 2019年9月7日

【泡泡图灵智库】协同视觉-惯性SLAM

【泡泡图灵智库】协同视觉-惯性SLAM

泡泡机器人SLAM

29+阅读 · 2019年9月6日

【泡泡图灵智库】基于语义分割图像的长期视觉定位（ICRA）

【泡泡图灵智库】基于语义分割图像的长期视觉定位（ICRA）

泡泡机器人SLAM

8+阅读 · 2019年5月30日

【泡泡点云时空】基于选择性传感器融合的神经网络视觉里程计

【泡泡点云时空】基于选择性传感器融合的神经网络视觉里程计

泡泡机器人SLAM

18+阅读 · 2019年4月21日

【泡泡图灵智库】基于点和体融合的实时三维重建（IROS）

【泡泡图灵智库】基于点和体融合的实时三维重建（IROS）

泡泡机器人SLAM

9+阅读 · 2019年3月20日

【泡泡图灵智库】SqueezeSeg：从3D LiDAR点云中实时分割路面物体的循环CRF卷积神经网络（ICRA）

【泡泡图灵智库】SqueezeSeg：从3D LiDAR点云中实时分割路面物体的循环CRF卷积神经网络（ICRA）

泡泡机器人SLAM

6+阅读 · 2019年1月25日

【泡泡一分钟】RNFNet: 用于室内语义分割的RGB-D多层级残差特征融合（ICCV2017-523）

【泡泡一分钟】RNFNet: 用于室内语义分割的RGB-D多层级残差特征融合（ICCV2017-523）

泡泡机器人SLAM

10+阅读 · 2018年12月21日

【泡泡一分钟】基于场景流传播的动态街道场景的语义建图和目标检测

【泡泡一分钟】基于场景流传播的动态街道场景的语义建图和目标检测

泡泡机器人SLAM

9+阅读 · 2018年4月29日

【泡泡一分钟】用于街景语义分割的全分辨率残差网络（CVPR-12）

【泡泡一分钟】用于街景语义分割的全分辨率残差网络（CVPR-12）

泡泡机器人SLAM

5+阅读 · 2017年11月2日

相关论文

Hierarchy Parsing for Image Captioning

Hierarchy Parsing for Image Captioning

Arxiv

6+阅读 · 2019年9月10日

LadderNet: Multi-path networks based on U-Net for medical image segmentation

LadderNet: Multi-path networks based on U-Net for medical image segmentation

Arxiv

7+阅读 · 2019年8月28日

Sparse2Dense: From direct sparse odometry to dense 3D reconstruction

Sparse2Dense: From direct sparse odometry to dense 3D reconstruction

Arxiv

9+阅读 · 2019年3月21日

3D Backbone Network for 3D Object Detection

Arxiv

12+阅读 · 2019年1月24日

Attentive Relational Networks for Mapping Images to Scene Graphs

Arxiv

3+阅读 · 2018年11月26日

Efficient Dense Modules of Asymmetric Convolution for Real-Time Semantic Segmentation

Efficient Dense Modules of Asymmetric Convolution for Real-Time Semantic Segmentation

Arxiv

9+阅读 · 2018年9月17日

Simultaneous Localization and Mapping (SLAM) using RTAB-MAP

Simultaneous Localization and Mapping (SLAM) using RTAB-MAP

Arxiv

7+阅读 · 2018年9月9日

Acquisition of Localization Confidence for Accurate Object Detection

Acquisition of Localization Confidence for Accurate Object Detection

Arxiv

4+阅读 · 2018年7月30日

Long-term Visual Localization using Semantically Segmented Images

Arxiv

7+阅读 · 2018年1月16日

Learning Deep Structured Multi-Scale Features using Attention-Gated CRFs for Contour Prediction

Arxiv

4+阅读 · 2018年1月1日

大家都在搜

软件无线电

CMU博士论文

无人机集群

久别重逢话双塔

再见，TD-SCDMA！

微信扫码咨询专知VIP会员