会员服务 ·

南开大学开源新图像分割算法，刷新精度记录 | 资源

2018 年 10 月 29 日 量子位

铜灵编译整理
量子位出品 | 公众号 QbitAI

最近，南开大学提出一种边缘检测和图像分割算法，被称为首个在图像分割数据集BSDS500上F值（F-Feature）超越数据集本身人工标注平均值的实时算法。

作者之一程明明在微博介绍说，算法中每一步（stage）里的所有卷积层都是有用的，而非过去只要每步最后一个卷积层。

“这是很通用的技巧，基本上干什么任务都用得着，改几行代码就能实现。”程明明说。

目前算法已经开源，一起看一下。

方法介绍

简单来说，研究人员提出一种利用RCF（richer convolutional features）的精准边缘检测器，还能通过反向传播进行训练。

在广泛使用的图像分割数据集BSDS500上进行基准测试时，这个算法在ODS（固定轮廓阈值）情况下，F值达到0.811；在评估速度为30FPS（每秒帧率）情况下，RCF OSD F值达到0.806，达到了比较好的结果。

这是怎么做到的？

研究人员先基于VGG16框架，构建了一个简单的神经网络。可以看出，从conv3_1层到conv4_3层，生成的图像在不断变粗糙，且中间层中包含的很多细节并没有被其它层利用。

这可不行。在研究人员提出这种RCF架构，输入任意大小的图像，就能输出相同大小的边缘映射图。

研究人员将所有来自卷积层的层次特征组合成一个整体框架，其中所有参数均可自动学习多尺度和多水平的特征，检测边缘信息。

这个多尺度算法的pipeline如下：

先改变原始图像的大小构建一组图像金字塔（image pyramid），将这些图像输入到RCF网络进行前向传递。随后，用双线性插值法将边缘检测图恢复为原始大小，这些边缘图的平均值将输出成高质量边缘检测图。

在BSDS500数据集上评估时，这种方法超过了数据集原始的人类标注平均值。

当被问到这个算法是否超越人类时，程明明表示，算法目前只能获得比BSDS500基准测试的普通人类注释更好的F值，还不能说是“超越”人类。

“如果给人类标注员更多的时间和训练，人类会做得更好。”程明明说。

来自南开大学

目前，这项研究的论文Richer Convolutional Features for Edge Detection已被IEEE TPAMI（IEEE Transactions on Pattern Analysis and Machine Intelligence）期刊收录。

论文由Yun Liu（刘云）、Ming-Ming Cheng（程明明）、Xiaowei Hu（胡晓伟）、Jia-Wang Bia、 Le Zhang、Xiang Bai和Jinhui Tang 7人完成，其中前四位研究人员均来自南开大学媒体计算实验室。

媒体计算实验室主要研究针对可视媒体信息的智能计算方法，在实验室主页上我们看到，实验室“2019级入学的博士生和硕士生已经招满”。

一作刘云本科也毕业于南开大学，现为程明明的博士生，参与的论文经常在CVPR、ACCV和PRCV等顶会现身。

论文二作程明明本科毕业于西电，在牛津大学深造完成后回国，虽然只有34岁，已经是南开大学教授、国家“万人计划”青年拔尖人才，首批天津市杰出青年基金获得者了。

△ 程明明

传送门

博客地址：
https://mmcheng.net/zh/rcfedge/

论文全文：
http://mftp.mmcheng.net/Papers/19PamiEdge.pdf

代码地址：
https://github.com/yun-liu/rcf

— 完 —

加入社群

量子位AI社群开始招募啦，欢迎对AI感兴趣的同学，在量子位公众号（QbitAI）对话界面回复关键字“交流群”，获取入群方式；

此外，量子位专业细分群(自动驾驶、CV、NLP、机器学习等)正在招募，面向正在从事相关领域的工程师及研究人员。

进专业群请在量子位公众号（QbitAI）对话界面回复关键字“专业群”，获取入群方式。（专业群审核较严，敬请谅解）

活动策划招聘

量子位正在招聘活动策划，将负责不同领域维度的线上线下相关活动策划、执行。欢迎聪明靠谱的小伙伴加入，并希望你能有一些活动策划或运营的相关经验。相关细节，请在量子位公众号(QbitAI)对话界面，回复“招聘”两个字。

量子位 QbitAI · 头条号签约作者

վ'ᴗ' ի 追踪AI技术和产品新动态

登录查看更多

知识荟萃

精品入门和进阶教程、论文和代码整理等

查看相关VIP内容、论文、资讯等

CVPR2020 | 商汤-港中文等提出PV-RCNN：3D目标检测新网络

专知会员服务

45+阅读 · 2020年4月17日

【CVPR 2020 Oral-北大华为】只用加法的神经网络，重磅开源

专知会员服务

31+阅读 · 2020年4月6日

【WF-IoT-普渡大学】低功耗深度学习和计算机视觉方法综述

专知会员服务

46+阅读 · 2020年3月26日

CVPR 2020 论文开源项目合集

专知会员服务

110+阅读 · 2020年3月12日

【IJCV2020】通过迭代亲密学习实现弱监督语义分割

专知会员服务

42+阅读 · 2020年2月20日

纽约大学发布「深度学习图像分割」最新进展综述论文，带你全面了解10类方法100个深度图像分割算法

专知会员服务

106+阅读 · 2020年1月19日

基于深度网络的自监督视觉特征学习综述，附24页论文下载

专知会员服务

66+阅读 · 2020年1月15日

【何恺明团队新论文】PointRend:将图像分割视作渲染问题，性能显著提升！

专知会员服务

28+阅读 · 2019年12月19日

斯坦福李飞飞高徒Johnson博士论文: 组成式计算机视觉智能,195页PDF

专知会员服务

71+阅读 · 2019年10月27日

深度神经网络模型压缩与加速综述

专知会员服务

130+阅读 · 2019年10月12日

BASNet，一种能关注边缘的显著性检测算法

极市平台

15+阅读 · 2019年7月19日

谷歌开源新模型EfficientNet：图像识别效率提升10倍，参数减少88%

AI前线

15+阅读 · 2019年6月9日

CVPR 2019 | 中科大 & 微软开源：基于高清表示网络的人体姿态估计

PaperWeekly

5+阅读 · 2019年5月10日

CVPR 2019 | 行人检测新思路：高级语义特征检测取得精度新突破

计算机视觉life

32+阅读 · 2019年4月23日

CVPR2019 | 行人检测新思路：高级语义特征检测取得精度新突破

极市平台

7+阅读 · 2019年4月10日

性能超越何恺明Mask R-CNN！华科硕士生开源图像分割新方法 | CVPR19 Oral

量子位

4+阅读 · 2019年3月5日

南开大学提出最新边缘检测与图像分割算法，精度刷新记录（附开源地址）

AI100

5+阅读 · 2018年10月31日

资源 | GitHub新项目：轻松使用多种预训练卷积网络抽取图像特征

机器之心

12+阅读 · 2018年4月16日

业界 | 谷歌最新语义图像分割模型DeepLab-v3+今日开源

机器之心

7+阅读 · 2018年3月13日

中国团以98%精度夺得MegaFace人脸识别冠军（开源）

全球人工智能

5+阅读 · 2018年3月12日

An Analysis of Object Embeddings for Image Retrieval

Arxiv

4+阅读 · 2019年5月28日

LadderNet: Multi-path networks based on U-Net for medical image segmentation

Arxiv

11+阅读 · 2019年4月1日

How to train your MAML

Arxiv

26+阅读 · 2019年3月5日

FocusNet: An attention-based Fully Convolutional Network for Medical Image Segmentation

Arxiv

8+阅读 · 2019年2月8日

InverseRenderNet: Learning single image inverse rendering

Arxiv

3+阅读 · 2018年11月29日

RAM: Residual Attention Module for Single Image Super-Resolution

Arxiv

9+阅读 · 2018年11月29日

Automatically Designing CNN Architectures for Medical Image Segmentation

Arxiv

10+阅读 · 2018年7月19日

W-net: Bridged U-net for 2D Medical Image Segmentation

Arxiv

20+阅读 · 2018年7月12日

Convolutional CRFs for Semantic Segmentation

Arxiv

8+阅读 · 2018年5月15日

TernausNet: U-Net with VGG11 Encoder Pre-Trained on ImageNet for Image Segmentation

Arxiv

5+阅读 · 2018年1月17日

VIP会员

南开大学开源新图像分割算法，刷新精度记录 | 资源

铜灵 编译整理量子位 出品 | 公众号 QbitAI

方法介绍

来自南开大学

△ 程明明

传送门

相关内容

知识荟萃

更多

铜灵编译整理
量子位出品 | 公众号 QbitAI