南开大学开源新图像分割算法,刷新精度记录 | 资源

2018 年 10 月 29 日 量子位
铜灵 编译整理
量子位 出品 | 公众号 QbitAI

最近,南开大学提出一种边缘检测和图像分割算法,被称为首个在图像分割数据集BSDS500上F值(F-Feature)超越数据集本身人工标注平均值的实时算法。

作者之一程明明在微博介绍说,算法中每一步(stage)里的所有卷积层都是有用的,而非过去只要每步最后一个卷积层。

“这是很通用的技巧,基本上干什么任务都用得着,改几行代码就能实现。”程明明说。

目前算法已经开源,一起看一下。

方法介绍

简单来说,研究人员提出一种利用RCF(richer convolutional features)的精准边缘检测器,还能通过反向传播进行训练。

在广泛使用的图像分割数据集BSDS500上进行基准测试时,这个算法在ODS(固定轮廓阈值)情况下,F值达到0.811;在评估速度为30FPS(每秒帧率)情况下,RCF OSD F值达到0.806,达到了比较好的结果。

这是怎么做到的?

研究人员先基于VGG16框架,构建了一个简单的神经网络。可以看出,从conv3_1层到conv4_3层,生成的图像在不断变粗糙,且中间层中包含的很多细节并没有被其它层利用。

这可不行。在研究人员提出这种RCF架构,输入任意大小的图像,就能输出相同大小的边缘映射图。

研究人员将所有来自卷积层的层次特征组合成一个整体框架,其中所有参数均可自动学习多尺度和多水平的特征,检测边缘信息。

这个多尺度算法的pipeline如下:

先改变原始图像的大小构建一组图像金字塔(image pyramid),将这些图像输入到RCF网络进行前向传递。随后,用双线性插值法将边缘检测图恢复为原始大小,这些边缘图的平均值将输出成高质量边缘检测图。

在BSDS500数据集上评估时,这种方法超过了数据集原始的人类标注平均值。

当被问到这个算法是否超越人类时,程明明表示,算法目前只能获得比BSDS500基准测试的普通人类注释更好的F值,还不能说是“超越”人类。

“如果给人类标注员更多的时间和训练,人类会做得更好。”程明明说。

来自南开大学

目前,这项研究的论文Richer Convolutional Features for Edge Detection已被IEEE TPAMI(IEEE Transactions on Pattern Analysis and Machine Intelligence)期刊收录。

论文由Yun Liu(刘云)、Ming-Ming Cheng(程明明)、Xiaowei Hu(胡晓伟)、Jia-Wang Bia、 Le Zhang、Xiang Bai和Jinhui Tang 7人完成,其中前四位研究人员均来自南开大学媒体计算实验室。

媒体计算实验室主要研究针对可视媒体信息的智能计算方法,在实验室主页上我们看到,实验室“2019级入学的博士生和硕士生已经招满”。

一作刘云本科也毕业于南开大学,现为程明明的博士生,参与的论文经常在CVPR、ACCV和PRCV等顶会现身。

论文二作程明明本科毕业于西电  ,在牛津大学深造完成后回国,虽然只有34岁,已经是南开大学教授、国家“万人计划”青年拔尖人才,首批天津市杰出青年基金获得者了。

 程明明

传送门

博客地址:
https://mmcheng.net/zh/rcfedge/

论文全文:
http://mftp.mmcheng.net/Papers/19PamiEdge.pdf

代码地址:
https://github.com/yun-liu/rcf

加入社群

量子位AI社群开始招募啦,欢迎对AI感兴趣的同学,在量子位公众号(QbitAI)对话界面回复关键字“交流群”,获取入群方式;


此外,量子位专业细分群(自动驾驶、CV、NLP、机器学习等)正在招募,面向正在从事相关领域的工程师及研究人员。


进专业群请在量子位公众号(QbitAI)对话界面回复关键字“专业群”,获取入群方式。(专业群审核较严,敬请谅解)

活动策划招聘

量子位正在招聘活动策划,将负责不同领域维度的线上线下相关活动策划、执行。欢迎聪明靠谱的小伙伴加入,并希望你能有一些活动策划或运营的相关经验。相关细节,请在量子位公众号(QbitAI)对话界面,回复“招聘”两个字。

量子位 QbitAI · 头条号签约作者

վ'ᴗ' ի 追踪AI技术和产品新动态

登录查看更多
2

相关内容

图像分割就是把图像分成若干个特定的、具有独特性质的区域并提出感兴趣目标的技术和过程。它是由图像处理到图像分析的关键步骤。 所谓图像分割指的是根据灰度、颜色、纹理和形状等特征把图像划分成若干互不交迭的区域,并使这些特征在同一区域内呈现出相似性,而在不同区域间呈现出明显的差异性。

知识荟萃

精品入门和进阶教程、论文和代码整理等

更多

查看相关VIP内容、论文、资讯等
CVPR2020 | 商汤-港中文等提出PV-RCNN:3D目标检测新网络
专知会员服务
43+阅读 · 2020年4月17日
专知会员服务
109+阅读 · 2020年3月12日
专知会员服务
41+阅读 · 2020年2月20日
深度神经网络模型压缩与加速综述
专知会员服务
128+阅读 · 2019年10月12日
BASNet,一种能关注边缘的显著性检测算法
极市平台
15+阅读 · 2019年7月19日
中国团以98%精度夺得MegaFace人脸识别冠军(开源)
全球人工智能
5+阅读 · 2018年3月12日
An Analysis of Object Embeddings for Image Retrieval
Arxiv
4+阅读 · 2019年5月28日
Arxiv
26+阅读 · 2019年3月5日
W-net: Bridged U-net for 2D Medical Image Segmentation
Arxiv
19+阅读 · 2018年7月12日
Arxiv
8+阅读 · 2018年5月15日
VIP会员
相关VIP内容
CVPR2020 | 商汤-港中文等提出PV-RCNN:3D目标检测新网络
专知会员服务
43+阅读 · 2020年4月17日
专知会员服务
109+阅读 · 2020年3月12日
专知会员服务
41+阅读 · 2020年2月20日
深度神经网络模型压缩与加速综述
专知会员服务
128+阅读 · 2019年10月12日
Top
微信扫码咨询专知VIP会员