点击上方“CVer”,选择加"星标"置顶
重磅干货,第一时间送达
本文作者:Uno Whoiam | 公众号:林木蔚然读书会
https://zhuanlan.zhihu.com/p/248422583
本文已由原作者授权,不得擅自二次转载
论文:Weakly-supervised Salient Instance Detection
https://www.bmvc2020-conference.com/assets/papers/0430.pdf
图像分割领域近年来竞争激烈,该论文则是在红海之中寻找蓝海的一篇文章。整体的算法框架基本上是扎根于ICCV2019的 IRNet,针对的任务是尚未有人涉足的弱监督显著性实例检测,并且取得了较好的结果。建议阅读本文之前先了解:
显著性实例检测和图像实例分割有着很高的相似性,可以将显著性实例检测看做只有一类物体的实例分割任务。该论文要解决的问题是显著性实例检测依赖大量像素级标注数据,从而导致标注成本较高的问题。
该论文的解决方法是使用成本较低的 image-level + object counts (论文中称 subitizing information) 替代 instance-level pixel-wise label 训练网络。
和 IRNet 一样,该网络也有三个分支,一个预测物体边缘,一个输出CAM,一个预测物体中心偏移,关于三个分支分别是怎么预测、训练的,基本上可以参考 IRNet:
这里主要讲讲其改进之处:
其一是引入了新的 loss:
其中 指中心偏移预测分支中提取的物体数量, 表示真实物体数量。该 loss 利用了训练数据中带有的物体数量标签进行训练,带来的提升如下:
其二是在物体边缘预测上,融合了Canny的结果:
带来的提升如下:
其三是提出了Double Attention Module,相比 DANet 的 Dual Attention 显然计算量更小,但同样可以达到各通道各位置进行链接的作用,基本是基于 CBAM 改动一下得到:
DANet 中的 Dual Attention:
参考论文:
[CVPR2019] Dual Attention Network for Scene Segmentation
[ECCV2018] CBAM: Convolutional Block Attention Module
double attention 带来的提升:
最后还有一个不起眼的地方,就是它还用了条件随机场 CRF 对 CAM 的结果进行了优化。
参考论文:
Efficient inference in fully connected crfs with gaussian edge potentials
相较于以往的弱监督方法的确具有显著的优势。
在性能贡献上,Boundary Enhancement module 对性能影像最大,其次是引入的新Loss。
本论文最让我印象深刻的应该是 Boundary Enhancement module,将传统边缘检测算子的结果嵌入网络模型,以提高最终的结果。一方面能将传统方法与深度学习融合的确会让人眼前一亮,促使 Reviewer 给出更好的评价;另一方面在深度学习竞争激烈的现在,向传统方法借力是一个很好的选择。
论文PDF下载
本文论文PDF已打包好,公众号后台回复:WSID-Net,即可下载访问
下载1
在CVer公众号后台回复:PRML,即可下载758页《模式识别和机器学习》PRML电子书和源码。该书是机器学习领域中的第一本教科书,全面涵盖了该领域重要的知识点。本书适用于机器学习、计算机视觉、自然语言处理、统计学、计算机科学、信号处理等方向。
PRML
下载2
在CVer公众号后台回复:CVPR2020,即可下载CVPR2020 2020代码开源的论文合集
在CVer公众号后台回复:ECCV2020,即可下载ECCV 2020代码开源的论文合集
重磅!CVer-图像分割 微信交流群已成立
扫码添加CVer助手,可申请加入CVer-图像分割 微信交流群,目前已汇集1500人!涵盖语义分割、实例分割、全景分割、医学图像分割等。互相交流,一起进步!
同时也可申请加入CVer大群和细分方向技术群,细分方向已涵盖:目标检测、图像分割、目标跟踪、人脸检测&识别、OCR、姿态估计、超分辨率、SLAM、医疗影像、Re-ID、GAN、NAS、深度估计、自动驾驶、强化学习、车道线检测、模型剪枝&压缩、去噪、去雾、去雨、风格迁移、遥感图像、行为识别、视频理解、图像融合、图像检索、论文投稿&交流、PyTorch和TensorFlow等群。
一定要备注:研究方向+地点+学校/公司+昵称(如图像分割+上海+上交+卡卡),根据格式备注,可更快被通过且邀请进群
▲长按加群
▲长按关注我们
整理不易,请给CVer点赞和在看!