语义分割研究党福利来袭,谷歌宣布开源 DeepLabv3+

2018 年 3 月 13 日 AI研习社 思颖

DeepLab 是一种用于图像语义分割的顶尖深度学习模型,其目标是将语义标签(如人、狗、猫等)分配给输入图像的每个像素。

经过三年左右的发展,目前 DeepLab 具有如下功能:

  • DeepLabv1:结合深度卷积神经网络,使用空洞卷积(atrous convolution)进行语义分割

  • DeepLabv2:基于 DeepLabv1 的优化,使用空洞空间金字塔池化(atrous spatial pyramid pooling,ASPP)对物体进行有效的分割

  • DeepLabv3:采用多比例的带孔卷积级联或并行来捕获多尺度背景,基于图像特征优化 ASPP

  • DeepLabv3+ :对 DeepLabv3 的扩展,包括一个简单而高效的改善分割结果的解码器模块

目前来说,在图像语义分割上,DeepLabv3+ 已是业内顶尖水准。就在近日,谷歌宣布开源 DeepLabv3+,语义分割研究党的福利来啦。

AI 研习社将相关信息编译整理如下:

语义图像分割(Semantic Image Segmentation)是为图像中的每个像素分配一个语义标签(如「路」、「天」、「人」、「狗」)的任务,能应用于新的应用程序中,例如基于 Pixel 2 和 Pixel 2 XL 智能手机肖像模式产生的浅景深效果(http://suo.im/4op1Xn ),手机实时视频分割(http://suo.im/22rO7M )。分配这些语义标签需要精确定位物体的轮廓,因此比其他视觉实体识别任务(例如图像分类,http://suo.im/28gUWX ,或边框检测,http://suo.im/1A2Zu8 )有着更严格的定位精度要求。

今天,我们很高兴地宣布将谷歌目前最新的、性能最好的语义图像分割模型——DeepLab-v3 + 开源(在 TensorFlow 中实现)。这一次的发布包含建造在一个强大的卷积神经网络(CNN)主干架构之上的 DeepLab-v3+ 模型,用于服务器端部署。

此外,我们还公开了 Tensorflow 模型训练和评估代码,还有已经在 Pascal VOC 2012 和 Cityscapes 语义分割任务上预训练过的模型。

自从 3 年前研究出 DeepLab 模型,我们不断改进 CNN 的特征提取器,实现更好的对象尺度建模,对上下文信息的进行更好的吸收,改进训练程序,应用越来越强大的硬件和软件,这些使 DeepLab-v2 和 DeepLab-v3 得到不断改进。

在使用 DeepLab-v3 + 时,我们可以通过添加一个简单但有效的解码器模块来扩展 Deeplabv3,从而改善分割结果,特别是用于对象边界检测时。我们进一步将深度可分离的卷积应用于空洞空间金字塔池化(atrous spatial pyramid pooling)和解码器模块,从而形成了一个用于语义分割的更快速、更强大的编——解码器网络。

基于卷积神经网络(CNNs)的现代语义图像分割系统已经达到了精确的水平,这在五年前是难以想象的,这要归功于方法、硬件和数据集的发展。

我们希望与广大的研究社群分享我们的系统,这样一来,学术界和工业界的团体能够更容易地复制和改进现有系统,在新的数据集上训练模型,并为这项技术设想新的应用。

via:Google Research Blog(http://suo.im/4q9HE

GitHub 地址:

https://github.com/tensorflow/models/tree/master/research/deeplab 

相关论文:

Encoder-Decoder with Atrous Separable Convolution for Semantic Image Segmentation(https://arxiv.org/abs/1802.02611

Xception: Deep Learning with Depthwise Separable Convolutions(https://arxiv.org/abs/1610.02357

Deformable Convolutional Networks — COCO Detection and Segmentation Challenge 2017 Entry(http://suo.im/2wU6Y4

Semantic Image Segmentation with Deep Convolutional Nets and Fully Connected CRFs(https://arxiv.org/abs/1412.7062

Deeplab: Semantic Image Segmentation with Deep Convolutional Nets, Atrous Convolution, and Fully Connected CRFs(https://arxiv.org/abs/1606.00915

Rethinking Atrous Convolution for Semantic Image Segmentation(https://arxiv.org/abs/1706.05587

AI 研习社编译整理。

NLP 工程师入门实践班:基于深度学习的自然语言处理

三大模块,五大应用,手把手快速入门 NLP

海外博士讲师,丰富项目经验

算法 + 实践,搭配典型行业应用

随到随学,专业社群,讲师在线答疑

▼▼▼





新人福利



关注 AI 研习社(okweiwu),回复  1  领取

【超过 1000G 神经网络 / AI / 大数据,教程,论文】



Mask R-CNN 实例分割通用框架,检测,分割和特征点定位一次搞定

登录查看更多
7

相关内容

语义分割,在机器学习上,多指对一段文本或者一张图片,提取其中有意义的部分,我们将这些有意义的部分称为语义单元,将这些语义单元提取出来的过程,称为语义分割。
【Google】利用AUTOML实现加速感知神经网络设计
专知会员服务
29+阅读 · 2020年3月5日
专知会员服务
41+阅读 · 2020年2月20日
【Google AI】开源NoisyStudent:自监督图像分类
专知会员服务
54+阅读 · 2020年2月18日
谷歌机器学习速成课程中文版pdf
专知会员服务
145+阅读 · 2019年12月4日
PSPNet ——语义分割及场景分析
AI科技评论
20+阅读 · 2019年8月20日
语义分割和转置卷积
AI研习社
10+阅读 · 2018年6月22日
DeepLab V3
计算机视觉战队
9+阅读 · 2018年4月2日
利用DeepLab在Tensorflow中进行语义图像分割
机器学习研究会
9+阅读 · 2018年3月22日
谷歌开源语义图像分割模型DeepLab-v3+ | 附代码
DeepLabv3+:语义分割领域的新高峰
PaperWeekly
6+阅读 · 2018年2月27日
Revisiting CycleGAN for semi-supervised segmentation
Arxiv
3+阅读 · 2019年8月30日
S4Net: Single Stage Salient-Instance Segmentation
Arxiv
10+阅读 · 2019年4月10日
TensorMask: A Foundation for Dense Object Segmentation
Arxiv
10+阅读 · 2019年3月28日
Arxiv
8+阅读 · 2018年5月15日
Arxiv
7+阅读 · 2018年1月24日
VIP会员
相关资讯
PSPNet ——语义分割及场景分析
AI科技评论
20+阅读 · 2019年8月20日
语义分割和转置卷积
AI研习社
10+阅读 · 2018年6月22日
DeepLab V3
计算机视觉战队
9+阅读 · 2018年4月2日
利用DeepLab在Tensorflow中进行语义图像分割
机器学习研究会
9+阅读 · 2018年3月22日
谷歌开源语义图像分割模型DeepLab-v3+ | 附代码
DeepLabv3+:语义分割领域的新高峰
PaperWeekly
6+阅读 · 2018年2月27日
Top
微信扫码咨询专知VIP会员