用 TensorFlow 实现物体检测的像素级分类 - 专知

会员服务 ·

0

用 TensorFlow 实现物体检测的像素级分类

2018 年 4 月 15 日 AI研习社 图普科技

雷锋网 AI 科技评论按：本文作者 Priyanka Kochhar 从事数据科学十多年，现在在运营一家深度学习咨询公司，她曾帮助多家创业公司完成人工智能解决方案的计划和部署，如果有兴趣与她合作，请联系 priya.toronto3@gmail.com。

最近，TensorFlow 的「物体检测 API」有了一个新功能，它能根据目标对象的像素位置来确定该对象的像素。换句话来说，TensorFlow 的物体检测从原来的图像级别成功上升到了像素级别。

使用 TensorFlow 的「物体检测 API」图片中的物体进行识别，最后的结果是图片中一个个将不同物体框起来的方框。最近，这个「物体检测 API」有了一个新功能，它能根据目标对象的像素位置确定该对象的像素，实现物体的像素分类。

TensorFlow 的物体检测 API 模型——Mask-RCNN

实例分割

「实例分割」是物体检测的延伸，它能让我们在普通的物体检测的基础上获取关于该对象更加精确、全面的信息。

在什么情况下我们才需要这样精确的信息呢？

无人驾驶汽车
为了确保安全，无人驾驶汽车需要精确定位道路上其他车辆和行人。
机器人系统
机器人在连接两个部件时，如果知道这两个部件的确切位置，那么机器人的操作就会更加高效、准确。

「实例分割」的方法有很多，TensorFlow 进行「实例分割」使用的是 Mask RCNN 算法。

Mask R-CNN 算法概述

Mask RCNN 算法架构

在介绍 Mask RCNN 之前，我们先来认识一下 Faster R-CNN。

Faster-RCNN 是一个用于物体检测的算法，它被分为两个阶段：第一阶段被称为「候选区域生成网络」（RPN），即生成候选物体的边框；第二阶段本质上是 Fast R-CNN 算法，即利用 RolPool 从每个候选边框获取对象特征，并执行分类和边框回归。这两个阶段所使用的特征可以共享，以更快地获得图像推算结果。

Faster R-CNN 对每个候选对象都有两个输出，一个是分类标签，另一个是对象边框。而 Mask-RCNN 就是在 Faster R-CNN 的两个输出的基础上，添加一个掩码的输出，该掩码是一个表示对象在边框中像素的二元掩码。但是这个新添加的掩码输出与原来的分类和边框输出不同，它需要物体更加精细的空间布局和位置信息。因此，Mask R-CNN 需要使用「全卷积神经网络」（FCN）。

全卷积神经网络（FCN）的算法架构

「全卷积神经网络」是「语义分割」中十分常见的算法，它利用了不同区块的卷积和池化层，首先将一张图片解压至它原本大小的三十二分之一，然后在这种粒度水平下进行预测分类，最后使用向上采样和反卷积层将图片还原到原来的尺寸。

因此，Mask RCNN 可以说是将 Faster RCNN 和「全卷积神经网络」这两个网络合并起来，形成的一个庞大的网络架构。

实操 Mask-RCNN

图片测试

你可以利用 TensorFlow 网站上的共享代码来对 Mask RCNN 进行图片测试。以下是我的测试结果：

Mask RCNN on Kites Image

视频测试

对我来说，最有意思的是用 YouTube 视频来测试这个模型。我从 YouTube 上下载了好几条视频，开始了视频测试。

视频测试的主要步骤：

1. 使用 VideoFileClip 功能从视频中提取出每个帧；

2. 使用 fl_image 功能对视频中截取的每张图片进行物体检测，然后用修改后的视频图片替换原本的视频图片；

3. 最后，将修改后的视频图像合并成一个新的视频。

GitHub地址为：https://github.com/priya-dwivedi/Deep-Learning/blob/master/Mask_RCNN/Mask_RCNN_Videos.ipynb

Mask RCNN 的深入研究

下一步的探索包括：

测试一个精确度更高的模型，观察两次测试结果的区别；
使用 TensorFlow 的物体检测 API 在定制的数据集上对 Mask RCNN 进行测试。

本文由雷锋网专栏作者编译，转载需经雷锋网(公众号：雷锋网)许可。

via kdnuggets

4 月 AI 求职季

8 大明星企业

10 场分享盛宴

20 小时独门秘籍

4.10-4.19，我们准时相约！

新人福利

关注 AI 研习社（okweiwu），回复 1 领取

【超过 1000G 神经网络 / AI / 大数据资料】

视频、书籍、源码、项目，Tensorflow 纯干货学习资源汇总

▼▼▼

登录查看更多

2

相关内容

物体检测

【CVPR2020-Facebook】从检测到3D目标，FroDO: From Detections to 3D Objects

【CVPR2020-Facebook】从检测到3D目标，FroDO: From Detections to 3D Objects

专知会员服务

33+阅读 · 2020年5月12日

CVPR2020 | 商汤-港中文等提出PV-RCNN：3D目标检测新网络

CVPR2020 | 商汤-港中文等提出PV-RCNN：3D目标检测新网络

专知会员服务

45+阅读 · 2020年4月17日

【CVPR2020-港科大-腾讯】基于注意力机制及多关系检测器的小样本物体检测

【CVPR2020-港科大-腾讯】基于注意力机制及多关系检测器的小样本物体检测

专知会员服务

39+阅读 · 2020年4月6日

【IJCV2020】通过迭代亲密学习实现弱监督语义分割

专知会员服务

42+阅读 · 2020年2月20日

【CIKM2019 Tutorial】Realtime object detection via deep learning-based pipelines(通过基于深度学习的管道实现实时对象检测)，附教程PDF免费下载

【CIKM2019 Tutorial】Realtime object detection via deep learning-based pipelines(通过基于深度学习的管道实现实时对象检测)，附教程PDF免费下载

专知会员服务

19+阅读 · 2019年11月3日

自动驾驶之基于兴趣区域投票的多任务车辆检测｜厚势汽车

自动驾驶之基于兴趣区域投票的多任务车辆检测｜厚势汽车

厚势

6+阅读 · 2019年7月17日

教程 | 单级式目标检测方法概述：YOLO与SSD

教程 | 单级式目标检测方法概述：YOLO与SSD

机器之心

4+阅读 · 2018年8月6日

从零开始PyTorch项目：YOLO v3目标检测实现

从零开始PyTorch项目：YOLO v3目标检测实现

机器之心

14+阅读 · 2018年4月23日

CapsNet入门系列番外：基于TensorFlow实现胶囊网络

CapsNet入门系列番外：基于TensorFlow实现胶囊网络

论智

10+阅读 · 2018年2月27日

TensorFlow深度学习目标检测模型及源码架构解析

TensorFlow深度学习目标检测模型及源码架构解析

AI前线

5+阅读 · 2017年11月27日

InteractE: Improving Convolution-based Knowledge Graph Embeddings by Increasing Feature Interactions

InteractE: Improving Convolution-based Knowledge Graph Embeddings by Increasing Feature Interactions

Arxiv

13+阅读 · 2019年11月1日

Stereo R-CNN based 3D Object Detection for Autonomous Driving

Stereo R-CNN based 3D Object Detection for Autonomous Driving

Arxiv

5+阅读 · 2019年2月26日

3D Backbone Network for 3D Object Detection

Arxiv

12+阅读 · 2019年1月24日

PointRCNN: 3D Object Proposal Generation and Detection from Point Cloud

Arxiv

7+阅读 · 2018年12月11日

SSD: Single Shot MultiBox Detector

Arxiv

5+阅读 · 2016年12月29日

VIP会员

相关主题

卷积神经网络

相关VIP内容

【CVPR2020-Facebook】从检测到3D目标，FroDO: From Detections to 3D Objects

【CVPR2020-Facebook】从检测到3D目标，FroDO: From Detections to 3D Objects

专知会员服务

33+阅读 · 2020年5月12日

CVPR2020 | 商汤-港中文等提出PV-RCNN：3D目标检测新网络

CVPR2020 | 商汤-港中文等提出PV-RCNN：3D目标检测新网络

专知会员服务

45+阅读 · 2020年4月17日

【CVPR2020-港科大-腾讯】基于注意力机制及多关系检测器的小样本物体检测

【CVPR2020-港科大-腾讯】基于注意力机制及多关系检测器的小样本物体检测

专知会员服务

39+阅读 · 2020年4月6日

【IJCV2020】通过迭代亲密学习实现弱监督语义分割

专知会员服务

42+阅读 · 2020年2月20日

【CIKM2019 Tutorial】Realtime object detection via deep learning-based pipelines(通过基于深度学习的管道实现实时对象检测)，附教程PDF免费下载

【CIKM2019 Tutorial】Realtime object detection via deep learning-based pipelines(通过基于深度学习的管道实现实时对象检测)，附教程PDF免费下载

专知会员服务

19+阅读 · 2019年11月3日

热门VIP内容

开通专知VIP会员享更多权益服务

从代码基础模型到智能体与应用：代码智能的全面综述与实践指南

《北约认知战概念报告》

【MIT博士论文】高效的视觉合成生成模型

美海军放弃星座级转而采用国家安全巡逻舰设计

相关资讯

自动驾驶之基于兴趣区域投票的多任务车辆检测｜厚势汽车

自动驾驶之基于兴趣区域投票的多任务车辆检测｜厚势汽车

厚势

6+阅读 · 2019年7月17日

教程 | 单级式目标检测方法概述：YOLO与SSD

教程 | 单级式目标检测方法概述：YOLO与SSD

机器之心

4+阅读 · 2018年8月6日

从零开始PyTorch项目：YOLO v3目标检测实现

从零开始PyTorch项目：YOLO v3目标检测实现

机器之心

14+阅读 · 2018年4月23日

CapsNet入门系列番外：基于TensorFlow实现胶囊网络

CapsNet入门系列番外：基于TensorFlow实现胶囊网络

论智

10+阅读 · 2018年2月27日

TensorFlow深度学习目标检测模型及源码架构解析

TensorFlow深度学习目标检测模型及源码架构解析

AI前线

5+阅读 · 2017年11月27日

相关论文

InteractE: Improving Convolution-based Knowledge Graph Embeddings by Increasing Feature Interactions

InteractE: Improving Convolution-based Knowledge Graph Embeddings by Increasing Feature Interactions

Arxiv

13+阅读 · 2019年11月1日

Stereo R-CNN based 3D Object Detection for Autonomous Driving

Stereo R-CNN based 3D Object Detection for Autonomous Driving

Arxiv

5+阅读 · 2019年2月26日

3D Backbone Network for 3D Object Detection

Arxiv

12+阅读 · 2019年1月24日

PointRCNN: 3D Object Proposal Generation and Detection from Point Cloud

Arxiv

7+阅读 · 2018年12月11日

SSD: Single Shot MultiBox Detector

Arxiv

5+阅读 · 2016年12月29日

大家都在搜

朱克爱德华兹家族

大型语言模型

蓝牙安全攻防

模型压缩 | 知识蒸馏经典解读

微信扫码咨询专知VIP会员