会员服务 ·

0

利用边缘监督信息加速Mask R-CNN实例分割训练

2018 年 9 月 29 日 极市平台

极市平台是专业的视觉算法开发和分发平台，加入极市专业CV交流群，与6000+来自腾讯，华为，百度，北大，清华，中科院等名企名校视觉开发者互动交流！更有机会与李开复老师等大牛群内互动！

同时提供每月大咖直播分享、真实项目需求对接、干货资讯汇总，行业技术交流。点击文末“阅读原文”立刻申请入群~

来源：我爱计算机视觉

转载自：我爱计算机视觉，未经允许不得二次转载

今天跟大家分享一篇有意思的arXiv上新出的论文，作者来自德国宝马汽车公司（BMW Car IT GmbH，Germany）的两位实习生。

Mask R-CNN是实例分割的经典模型，作者通过在Mask R-CNN框架上附加一个新任务，达到更快的网络收敛速度。该文对MaskR-CNN添加了一个新的预测任务，称为Edge Agreement Head（也许可以翻译为“边缘协定预测端”？），它的灵感来自人工实例标注的方式。当人们对实例进行像素级标注的时候，仅仅会关注实例的边缘部分，而实例内部则只需要简单的复制边缘的标注信息就可以了。所以实例的mask边缘非常有用，它们很好地表征了实例。Edge Agreement Head的作用即鼓励深度网络训练时预测的实例mask边缘与groundtruth的边缘相似。

算法思想

作者通过观察Mask R-CNN训练前期输出的预测图像，发现很多时候边缘都不在点上，很显然，神经网络在走弯路。请看下面的例子：

这是Mask R-CNN深度网络训练前期的一些预测的Mask，发现它并没有像人类一样先把边缘找出来，甚至缺失的很离谱。为了避免神经网络走弯路，作者把实例的边缘信息作为一种监督的指引，即将groundtruth进行边缘滤波，让神经网络同时去预测实例的边缘。指了条明路。

Mask R-CNN的多任务损失函数：

具体的做法是，增加一个新分支，预测边缘并与groundtruth的边缘相比较，请看下图

作者仅是对每个实例28*28大小区域内（所以增加的计算量有限）进行上述操作，通过添加简单的3*3边缘检测计算预测和groundtruth的边缘，因为边缘检测往往和图像平滑一起用，所以右边的图增加了平滑的步骤。

上图中Lp代表计算两者差异的方式，如下：

p代表像素差值的幂次方参数。

作者尝试了普通的Sobel滤波和Laplacian滤波检测边缘。

作者通过Edge Agreement Head方式增加了一个损失函数，模型复杂度略微增加，没添加任何额外的需要训练的模型变量，训练的计算成本增加很小，而网络推断时不增加计算量。

实验结果

作者在MS COCO 2017数据集上做了实验，比较训练达到160k steps时基准模型和提出的模型的COCO AP metrics精度。

Table 1说明当训练达到160k steps时，使用Edge Agreement Head的模型训练达到了更高的精度，尤其是使用Soble边缘算子的模型。

Table 2表明不使用图像平滑加速更加明显，达到更高的精度。

预测结果比较图示：

Table 4表明，拉长训练时间，使用Edge Agreement Head仍然获得了更高的精度。

该文没有开源代码。

总结

这篇论文很简单，但给出的结论很有意思，Edge Agreement Head相当于提供了更多的监督信息，为深度网络指了一个方向，少走一些弯路。尤其在训练早期，网络更容易迷茫的时候就更需要指条明路。

尤其值得一提的是，很显然边缘信息可以有助于所有图像像素级理解的应用，比如深度估计、光流计算等，大家不妨一试。

论文地址：
https://arxiv.org/abs/1809.07069v1

-END-

每月大咖直播分享、真实项目需求对接、干货资讯汇总，行业技术交流。点击左下角“阅读原文”立刻申请入群~

登录查看更多

2

相关内容

Mask R-CNN

【CVPR2020】通过获取高质量的关键点对来提升目标检测性能

【CVPR2020】通过获取高质量的关键点对来提升目标检测性能

专知会员服务

44+阅读 · 2020年6月30日

【文献综述】深度学习目标检测方法及其主流框架综述

【文献综述】深度学习目标检测方法及其主流框架综述

专知会员服务

119+阅读 · 2020年6月26日

新杀器来了！Facebook AI提出DETR：用Transformers来进行端到端的目标检测

新杀器来了！Facebook AI提出DETR：用Transformers来进行端到端的目标检测

专知会员服务

51+阅读 · 2020年5月28日

【CVPR2020 旷视研究院】探索类别正则化的领域自适应对象检测

【CVPR2020 旷视研究院】探索类别正则化的领域自适应对象检测

专知会员服务

24+阅读 · 2020年4月22日

【CVPR2020-Facebook AI】前置不变表示的自监督学习

【CVPR2020-Facebook AI】前置不变表示的自监督学习

专知会员服务

47+阅读 · 2020年4月19日

CVPR 2020 | MetaFuse：用于人体姿态估计的预训练信息融合模型

CVPR 2020 | MetaFuse：用于人体姿态估计的预训练信息融合模型

专知会员服务

25+阅读 · 2020年4月2日

【IJCV2020】通过迭代亲密学习实现弱监督语义分割

专知会员服务

42+阅读 · 2020年2月20日

新时期我国信息技术产业的发展

新时期我国信息技术产业的发展

专知会员服务

71+阅读 · 2020年1月18日

基于深度网络的自监督视觉特征学习综述，附24页论文下载

基于深度网络的自监督视觉特征学习综述，附24页论文下载

专知会员服务

66+阅读 · 2020年1月15日

无监督深度学习——这《元监督视觉学习》132页伯克利博士论文带你回顾无监督视觉应用最新发展脉络

无监督深度学习——这《元监督视觉学习》132页伯克利博士论文带你回顾无监督视觉应用最新发展脉络

专知会员服务

30+阅读 · 2019年10月26日

【干货】实例分割的进阶三级跳：从 Mask R-CNN 到 Hybrid Task Cascade

【干货】实例分割的进阶三级跳：从 Mask R-CNN 到 Hybrid Task Cascade

GAN生成式对抗网络

8+阅读 · 2019年3月14日

【学界】CVPR2019 | 开源分割新算法MS R-CNN，性能超越何恺明Mask R-CNN

【学界】CVPR2019 | 开源分割新算法MS R-CNN，性能超越何恺明Mask R-CNN

GAN生成式对抗网络

12+阅读 · 2019年3月5日

CVPR2019 | 开源分割新算法MS R-CNN，性能超越何恺明Mask R-CNN

CVPR2019 | 开源分割新算法MS R-CNN，性能超越何恺明Mask R-CNN

极市平台

9+阅读 · 2019年3月5日

CVPR2019 | 实例分割的进阶三级跳：从 Mask R-CNN 到 Hybrid Task Cascade

CVPR2019 | 实例分割的进阶三级跳：从 Mask R-CNN 到 Hybrid Task Cascade

极市平台

16+阅读 · 2019年3月5日

鱼与熊掌可以兼得：何恺明等人一统语义分割与实例分割

鱼与熊掌可以兼得：何恺明等人一统语义分割与实例分割

机器之心

8+阅读 · 2019年1月11日

Grid R-CNN解读：商汤最新目标检测算法，定位精度超越Faster R-CNN

Grid R-CNN解读：商汤最新目标检测算法，定位精度超越Faster R-CNN

AI100

5+阅读 · 2018年12月22日

FAIR最新视觉论文集锦：FPN，RetinaNet，Mask和Mask-X RCNN（含代码实现）

FAIR最新视觉论文集锦：FPN，RetinaNet，Mask和Mask-X RCNN（含代码实现）

AI科技评论

16+阅读 · 2018年4月7日

从FPN到Mask R-CNN，一文告诉你Facebook的计算机视觉有多强

从FPN到Mask R-CNN，一文告诉你Facebook的计算机视觉有多强

人工智能头条

6+阅读 · 2018年3月20日

CVPR 2018 | 优于Mask R-CNN，港中文&腾讯优图提出PANet实例分割框架

CVPR 2018 | 优于Mask R-CNN，港中文&腾讯优图提出PANet实例分割框架

机器之心

16+阅读 · 2018年3月12日

学界 | 何恺明等人提出新型半监督实例分割方法：学习分割Every Thing

学界 | 何恺明等人提出新型半监督实例分割方法：学习分割Every Thing

机器之心

6+阅读 · 2017年12月2日

S4Net: Single Stage Salient-Instance Segmentation

S4Net: Single Stage Salient-Instance Segmentation

Arxiv

10+阅读 · 2019年4月10日

TensorMask: A Foundation for Dense Object Segmentation

TensorMask: A Foundation for Dense Object Segmentation

Arxiv

10+阅读 · 2019年3月28日

Few-shot Adaptive Faster R-CNN

Few-shot Adaptive Faster R-CNN

Arxiv

3+阅读 · 2019年3月22日

Panoptic Feature Pyramid Networks

Panoptic Feature Pyramid Networks

Arxiv

3+阅读 · 2019年1月8日

Rethinking ImageNet Pre-training

Arxiv

8+阅读 · 2018年11月21日

Deep Adaptive Proposal Network for Object Detection in Optical Remote Sensing Images

Deep Adaptive Proposal Network for Object Detection in Optical Remote Sensing Images

Arxiv

6+阅读 · 2018年7月19日

Auto-Context R-CNN

Auto-Context R-CNN

Arxiv

4+阅读 · 2018年7月8日

Learning Semantic Sentence Embeddings using Pair-wise Discriminator

Arxiv

6+阅读 · 2018年6月15日

Self Paced Deep Learning for Weakly Supervised Object Detection

Arxiv

8+阅读 · 2018年2月21日

Arxiv

7+阅读 · 2018年1月24日

VIP会员

相关主题

卷积神经网络

相关VIP内容

【CVPR2020】通过获取高质量的关键点对来提升目标检测性能

【CVPR2020】通过获取高质量的关键点对来提升目标检测性能

专知会员服务

44+阅读 · 2020年6月30日

【文献综述】深度学习目标检测方法及其主流框架综述

【文献综述】深度学习目标检测方法及其主流框架综述

专知会员服务

119+阅读 · 2020年6月26日

新杀器来了！Facebook AI提出DETR：用Transformers来进行端到端的目标检测

新杀器来了！Facebook AI提出DETR：用Transformers来进行端到端的目标检测

专知会员服务

51+阅读 · 2020年5月28日

【CVPR2020 旷视研究院】探索类别正则化的领域自适应对象检测

【CVPR2020 旷视研究院】探索类别正则化的领域自适应对象检测

专知会员服务

24+阅读 · 2020年4月22日

【CVPR2020-Facebook AI】前置不变表示的自监督学习

【CVPR2020-Facebook AI】前置不变表示的自监督学习

专知会员服务

47+阅读 · 2020年4月19日

CVPR 2020 | MetaFuse：用于人体姿态估计的预训练信息融合模型

CVPR 2020 | MetaFuse：用于人体姿态估计的预训练信息融合模型

专知会员服务

25+阅读 · 2020年4月2日

【IJCV2020】通过迭代亲密学习实现弱监督语义分割

专知会员服务

42+阅读 · 2020年2月20日

新时期我国信息技术产业的发展

新时期我国信息技术产业的发展

专知会员服务

71+阅读 · 2020年1月18日

基于深度网络的自监督视觉特征学习综述，附24页论文下载

基于深度网络的自监督视觉特征学习综述，附24页论文下载

专知会员服务

66+阅读 · 2020年1月15日

无监督深度学习——这《元监督视觉学习》132页伯克利博士论文带你回顾无监督视觉应用最新发展脉络

无监督深度学习——这《元监督视觉学习》132页伯克利博士论文带你回顾无监督视觉应用最新发展脉络

专知会员服务

30+阅读 · 2019年10月26日

热门VIP内容

开通专知VIP会员享更多权益服务

【CMU博士论文】迈向具有高维结果的可靠且稳健的因果推断

《美海军分布式海上作战（DMO）概念：最新情况》

Gemini 2.5：推动前沿，具备先进推理、多模态、长上下文及下一代智能体能力

【ICML2025教程】联想记忆的现代方法

相关资讯

【干货】实例分割的进阶三级跳：从 Mask R-CNN 到 Hybrid Task Cascade

【干货】实例分割的进阶三级跳：从 Mask R-CNN 到 Hybrid Task Cascade

GAN生成式对抗网络

8+阅读 · 2019年3月14日

【学界】CVPR2019 | 开源分割新算法MS R-CNN，性能超越何恺明Mask R-CNN

【学界】CVPR2019 | 开源分割新算法MS R-CNN，性能超越何恺明Mask R-CNN

GAN生成式对抗网络

12+阅读 · 2019年3月5日

CVPR2019 | 开源分割新算法MS R-CNN，性能超越何恺明Mask R-CNN

CVPR2019 | 开源分割新算法MS R-CNN，性能超越何恺明Mask R-CNN

极市平台

9+阅读 · 2019年3月5日

CVPR2019 | 实例分割的进阶三级跳：从 Mask R-CNN 到 Hybrid Task Cascade

CVPR2019 | 实例分割的进阶三级跳：从 Mask R-CNN 到 Hybrid Task Cascade

极市平台

16+阅读 · 2019年3月5日

鱼与熊掌可以兼得：何恺明等人一统语义分割与实例分割

鱼与熊掌可以兼得：何恺明等人一统语义分割与实例分割

机器之心

8+阅读 · 2019年1月11日

Grid R-CNN解读：商汤最新目标检测算法，定位精度超越Faster R-CNN

Grid R-CNN解读：商汤最新目标检测算法，定位精度超越Faster R-CNN

AI100

5+阅读 · 2018年12月22日

FAIR最新视觉论文集锦：FPN，RetinaNet，Mask和Mask-X RCNN（含代码实现）

FAIR最新视觉论文集锦：FPN，RetinaNet，Mask和Mask-X RCNN（含代码实现）

AI科技评论

16+阅读 · 2018年4月7日

从FPN到Mask R-CNN，一文告诉你Facebook的计算机视觉有多强

从FPN到Mask R-CNN，一文告诉你Facebook的计算机视觉有多强

人工智能头条

6+阅读 · 2018年3月20日

CVPR 2018 | 优于Mask R-CNN，港中文&腾讯优图提出PANet实例分割框架

CVPR 2018 | 优于Mask R-CNN，港中文&腾讯优图提出PANet实例分割框架

机器之心

16+阅读 · 2018年3月12日

学界 | 何恺明等人提出新型半监督实例分割方法：学习分割Every Thing

学界 | 何恺明等人提出新型半监督实例分割方法：学习分割Every Thing

机器之心

6+阅读 · 2017年12月2日

相关论文

S4Net: Single Stage Salient-Instance Segmentation

S4Net: Single Stage Salient-Instance Segmentation

Arxiv

10+阅读 · 2019年4月10日

TensorMask: A Foundation for Dense Object Segmentation

TensorMask: A Foundation for Dense Object Segmentation

Arxiv

10+阅读 · 2019年3月28日

Few-shot Adaptive Faster R-CNN

Few-shot Adaptive Faster R-CNN

Arxiv

3+阅读 · 2019年3月22日

Panoptic Feature Pyramid Networks

Panoptic Feature Pyramid Networks

Arxiv

3+阅读 · 2019年1月8日

Rethinking ImageNet Pre-training

Arxiv

8+阅读 · 2018年11月21日

Deep Adaptive Proposal Network for Object Detection in Optical Remote Sensing Images

Deep Adaptive Proposal Network for Object Detection in Optical Remote Sensing Images

Arxiv

6+阅读 · 2018年7月19日

Auto-Context R-CNN

Auto-Context R-CNN

Arxiv

4+阅读 · 2018年7月8日

Learning Semantic Sentence Embeddings using Pair-wise Discriminator

Arxiv

6+阅读 · 2018年6月15日

Self Paced Deep Learning for Weakly Supervised Object Detection

Arxiv

8+阅读 · 2018年2月21日

Arxiv

7+阅读 · 2018年1月24日

大家都在搜

软件无线电

生成式人工智能

斯坦福博士论文

国防科技创新

OpenKG开源系列 | 海洋鱼类百科知识图谱（浙江大学）

微信扫码咨询专知VIP会员