作者:Jakub Czakon
机器之心编译
参与:小舟、Racoon、张倩
作为计算机视觉的一个热门方向,每年都会有很多同学入坑图像分割。这一领域已经有了哪些研究成果、资源?目前面临什么困境?还有哪些问题值得研究?本文将重点讨论这些问题。
TopK 损失:用来确保网络在训练过程中专注于复杂样例;
距离惩罚 CE 损失:用在那些难以分割的区域为网络提供指引;
灵敏度-特异性(SS)损失:计算特异性和灵敏度均方差的加权和;
Hausdorff 距离(HD)损失:通过卷积神经网络估计 Hausdorff 距离。
Common Objects in COntext—Coco Dataset
PASCAL Visual Object Classes (PASCAL VOC)
The Cityscapes Dataset
The Cambridge-driving Labeled Video Database—CamVid
FastAI 库:给出一张图像,该库能为图像中的物体创建蒙版;
Sefexa 图像分割工具:Sefexa 是一个用于图像分割、图像分析、创造基本事实的免费的半自动工具;
Deepmask:Facebook 研究中心的 Deepmask 是 DeepMask 和 SharpMask 的 Torch 实现;
MultiPath:它是一个来自「用于对象检测的多路径网络」的目标检测网络的 Torch 实现;
OpenCV:一个有超过 2500 种的优化算法的开源计算机视觉库;
MIScnn:一个医学图像分割的开源库。它仅需数行代码就能用 SOTA 卷积神经网络和深度学习模型建立路径;
Fritz:Fritz 提供了包括移动设备中的图像分割工具在内的几种计算机视觉工具。
研究进展趋缓,甚至已进入瓶颈期,提升 0.5 mIoU 都非常困难;
数据集受限,少有的几个数据集已经刷到接近天花板;
算力消耗大,学界和一些小型业界团队往往被算力掣肘;
领域内卷,研究同质化严重,很容易被审稿人 diss,不容易中顶会