首篇弱监督显著性实例检测!获得BMVC 2020 最佳学生论文提名奖

2020 年 9 月 22 日 CVer

点击上方“CVer”,选择加"星标"置顶

重磅干货,第一时间送达

本文者:Uno Whoiam  |  公众号:林木蔚然读书会

https://zhuanlan.zhihu.com/p/248422583

本文已由原作者授权,不得擅自二次转载

论文:Weakly-supervised Salient Instance Detection


https://www.bmvc2020-conference.com/assets/papers/0430.pdf


图像分割领域近年来竞争激烈,该论文则是在红海之中寻找蓝海的一篇文章。整体的算法框架基本上是扎根于ICCV2019的 IRNet,针对的任务是尚未有人涉足的弱监督显著性实例检测,并且取得了较好的结果。建议阅读本文之前先了解:

IRNet:弱监督实例分割 | 步步为营,隔山打牛

一、要解决的问题(Why)

显著性实例检测和图像实例分割有着很高的相似性,可以将显著性实例检测看做只有一类物体的实例分割任务。该论文要解决的问题是显著性实例检测依赖大量像素级标注数据,从而导致标注成本较高的问题。

二、解决的办法(What)

该论文的解决方法是使用成本较低的 image-level + object counts (论文中称 subitizing information) 替代 instance-level pixel-wise label 训练网络。

三、如何实现(How)

和 IRNet 一样,该网络也有三个分支,一个预测物体边缘,一个输出CAM,一个预测物体中心偏移,关于三个分支分别是怎么预测、训练的,基本上可以参考 IRNet:

IRNet:弱监督实例分割 | 步步为营,隔山打牛


这里主要讲讲其改进之处:

其一是引入了新的 loss:

其中  指中心偏移预测分支中提取的物体数量,  表示真实物体数量。该 loss 利用了训练数据中带有的物体数量标签进行训练,带来的提升如下:

其二是在物体边缘预测上,融合了Canny的结果:

带来的提升如下:

其三是提出了Double Attention Module,相比 DANet 的 Dual Attention 显然计算量更小,但同样可以达到各通道各位置进行链接的作用,基本是基于 CBAM 改动一下得到:

DANet 中的 Dual Attention:

参考论文:
[CVPR2019] Dual Attention Network for Scene Segmentation
[ECCV2018] CBAM: Convolutional Block Attention Module

double attention 带来的提升:

最后还有一个不起眼的地方,就是它还用了条件随机场 CRF 对 CAM 的结果进行了优化。

参考论文:
Efficient inference in fully connected crfs with gaussian edge potentials

四、效果如何?(How much)

相较于以往的弱监督方法的确具有显著的优势。


在性能贡献上,Boundary Enhancement module 对性能影像最大,其次是引入的新Loss。


五、启示(What Then)

本论文最让我印象深刻的应该是 Boundary Enhancement module,将传统边缘检测算子的结果嵌入网络模型,以提高最终的结果。一方面能将传统方法与深度学习融合的确会让人眼前一亮,促使 Reviewer 给出更好的评价;另一方面在深度学习竞争激烈的现在,向传统方法借力是一个很好的选择。

论文PDF下载


本文论文PDF已打包好,公众号后台回复WSID-Net,即可下载访问


下载1


在CVer公众号后台回复PRML,即可下载758页《模式识别和机器学习》PRML电子书和源码该书是机器学习领域中的第一本教科书,全面涵盖了该领域重要的知识点。本书适用于机器学习、计算机视觉、自然语言处理、统计学、计算机科学、信号处理等方向。


PRML


下载2


在CVer公众号后台回复:CVPR2020,即可下载CVPR2020 2020代码开源的论文合集

在CVer公众号后台回复:ECCV2020,即可下载ECCV 2020代码开源的论文合集


重磅!CVer-图像分割 微信交流群已成立


扫码添加CVer助手,可申请加入CVer-图像分割 微信交流群,目前已汇集1500人!涵盖语义分割、实例分割、全景分割、医学图像分割等。互相交流,一起进步!


同时也可申请加入CVer大群和细分方向技术群,细分方向已涵盖:目标检测、图像分割、目标跟踪、人脸检测&识别、OCR、姿态估计、超分辨率、SLAM、医疗影像、Re-ID、GAN、NAS、深度估计、自动驾驶、强化学习、车道线检测、模型剪枝&压缩、去噪、去雾、去雨、风格迁移、遥感图像、行为识别、视频理解、图像融合、图像检索、论文投稿&交流、PyTorch和TensorFlow等群。


一定要备注:研究方向+地点+学校/公司+昵称(如图像分割+上海+上交+卡卡),根据格式备注,可更快被通过且邀请进群

▲长按加群


▲长按关注我们

整理不易,请给CVer点赞和在看

登录查看更多
0

相关内容

British Machine Vision Conference为在英国从事机器视觉、图像处理和模式识别的个人和组织提供了一个国家论坛。其主要目的是:提高机器视觉和模式识别知识、鼓励技术的实际应用、促进研究成果迅速向产业转移、在国内外代表英国机器视觉界官网链接:https://britishmachinevisionassociation.github.io/
图像分割方法综述
专知会员服务
54+阅读 · 2020年11月22日
专知会员服务
45+阅读 · 2020年10月5日
【ACM MM2020】对偶注意力GAN语义图像合成
专知会员服务
35+阅读 · 2020年9月2日
CVPR 2020 最佳论文与最佳学生论文!
专知会员服务
35+阅读 · 2020年6月17日
AAAI2020接受论文列表,1591篇论文目录全集
专知会员服务
98+阅读 · 2020年1月12日
CVPR2019通用目标检测
极市平台
8+阅读 · 2019年8月6日
BASNet,一种能关注边缘的显著性检测算法
极市平台
15+阅读 · 2019年7月19日
CVPR 2019开源论文 | BASNet:关注边界的显著性检测
CVPR 2018 最酷的十篇论文
AI研习社
6+阅读 · 2019年2月13日
CVPR 2018 | 无监督语义分割之全卷积域适应网络
极市平台
8+阅读 · 2018年6月28日
论文 | YOLO(You Only Look Once)目标检测
七月在线实验室
14+阅读 · 2017年12月12日
见微知著:语义分割中的弱监督学习
深度学习大讲堂
11+阅读 · 2017年12月6日
Arxiv
0+阅读 · 2020年12月3日
UPSNet: A Unified Panoptic Segmentation Network
Arxiv
4+阅读 · 2019年1月12日
Arxiv
7+阅读 · 2018年12月5日
Arxiv
5+阅读 · 2018年4月17日
Arxiv
11+阅读 · 2018年4月8日
VIP会员
相关VIP内容
图像分割方法综述
专知会员服务
54+阅读 · 2020年11月22日
专知会员服务
45+阅读 · 2020年10月5日
【ACM MM2020】对偶注意力GAN语义图像合成
专知会员服务
35+阅读 · 2020年9月2日
CVPR 2020 最佳论文与最佳学生论文!
专知会员服务
35+阅读 · 2020年6月17日
AAAI2020接受论文列表,1591篇论文目录全集
专知会员服务
98+阅读 · 2020年1月12日
相关资讯
CVPR2019通用目标检测
极市平台
8+阅读 · 2019年8月6日
BASNet,一种能关注边缘的显著性检测算法
极市平台
15+阅读 · 2019年7月19日
CVPR 2019开源论文 | BASNet:关注边界的显著性检测
CVPR 2018 最酷的十篇论文
AI研习社
6+阅读 · 2019年2月13日
CVPR 2018 | 无监督语义分割之全卷积域适应网络
极市平台
8+阅读 · 2018年6月28日
论文 | YOLO(You Only Look Once)目标检测
七月在线实验室
14+阅读 · 2017年12月12日
见微知著:语义分割中的弱监督学习
深度学习大讲堂
11+阅读 · 2017年12月6日
Top
微信扫码咨询专知VIP会员