GitHub趋势榜第一：超强PyTorch目标检测库Detectron2，训练更快，支持更多任务

会员服务 ·

GitHub趋势榜第一：超强PyTorch目标检测库Detectron2，训练更快，支持更多任务

2019 年 10 月 17 日 量子位

栗子发自凹非寺
量子位报道 | 公众号 QbitAI

PyTorch目标检测库Detectron2诞生了，Facebook出品。

站在初代的肩膀上，它训练比从前更快，功能比从前更全，支持的模型也比从前更丰盛。

开源5天，已在GitHub收获3100星，还成了趋势榜第一：

除此之外，团队把大规模姿态估计算法DensePose，做出了基于Detectron2的新版本。

Facebook说，像DensePose一样，今后会有更多研究项目，在Detectron2上搭建起来。

这样，就可以把它当成一个广泛支持各种研究工作的库了。

那么，现在就来仔细观察一下，Detectron2都发生了哪些进化：

全方位升级

首先，Detectron2比起初代，最明显的变化是：

基于PyTorch了，初代还是在Caffe2里实现的。

团队说，PyTorch有直观的指令式编程，这样就能更快地迭代模型设计和实验。

Detectron2是在PyTorch里从零开始写成的，团队希望这种做法，能让用户享受PyTorch做深度学习的思路。社区更活跃的话，PyTorch也会变得更好。

第二个变化，是模块化了。

所谓模块化，就是用户可以把自己定制的模块实现，加到一个目标检测系统的任何部分里去。

这意味着许多的新研究，都能用几百行代码写成，并且可以把新实现的部分，跟核心Detectron2库完全分开。

除此之外，还有许多新支持的模型、功能和任务：

新模型&新功能

首先，Detectron2包含了一代可用的所有模型：

比如Faster R-CNN，Mask R-CNN，RetinaNet，DensePose等等。

然后，加入了一些新模型：

比如Cascade R-NN，Panoptic FPN，以及TensorMask。

今后，陆续会有新的算法支持。

功能方面，二代新支持了同步批量归一化 (synchronous Batch Norm) ，也支持了LVIS等等许多新的数据集。

新任务

和目标检测有关的任务，初代已经支持了一部分，二代也都支持：

有边界框的目标检测，实例分割mask，以及人类姿态预测。

在这基础之上，二代又增加了新任务：

语义分割和全景分割 (Panoptic Segmentation) ，这是一个把语义分割和实例分割结合到一起的任务。速度快

博客提到，由于把整个训练pipeline移到了GPU上，二代比初代更快了，在许多模型上都是如此。分布式训练，让几台GPU一起跑的话，还可以把训练规模扩张到更大的数据集上。

速度的对比，是用第100-500次迭代之间的平均吞吐量 (Average Throughput) 作为指标。这样就跳过了GPU预热时间。结果如下：

肉眼可见的加速。

注意，对于R-CNN这类模型，一个模型的吞吐量会随着训练的进行而变化，这取决于模型的预测。

因此，这个指标也不能和model zoo里的“训练速度”相提并论。model zoo用的是整个训练过程运行的平均速度。

部署一下

最后，Facebook的计算机视觉攻城狮们，实现了一个额外的软件层，叫Detectron2go。

有了它，就可以更快地把新实现的模型，部署到生产环节。

这一层的功能包括了标准训练工作流，带有内部数据集，网络量化，以及模型转化 (为了给云端和移动端部署，选择各自最优的格式) 。

传送门

总之，训练起来更顺滑了，支持的任务也广泛了，快点用起来吧：

GitHub项目：
https://github.com/facebookresearch/detectron2
Facebook博客传送门：
https://ai.facebook.com/blog/-detectron2-a-pytorch-based-modular-object-detection-library-/

— 完 —

活动推荐 | 科大讯飞1024开发者节

10月24日-26日，一场开发者的盛会。

120+国内外专家学者，20+场高峰论坛；10000平米AI黑科技互动展区，更有AI公益音乐节、AI公益健康跑助力！

扫码可获取量子位专属福利，进入原价1024元的【免费票】通道。

喜欢就点「好看」吧 !

登录查看更多

相关内容

DensePose

关注 0

新杀器来了！Facebook AI提出DETR：用Transformers来进行端到端的目标检测

专知会员服务

51+阅读 · 2020年5月28日

【CVPR2020-Facebook】从检测到3D目标，FroDO: From Detections to 3D Objects

专知会员服务

33+阅读 · 2020年5月12日

CVPR 2020 论文开源项目合集

专知会员服务

110+阅读 · 2020年3月12日

谷歌提出“T5” 新NLP模型，突破迁移学习局限，多基准测试达SOTA！

专知会员服务

41+阅读 · 2020年2月26日

【CVPR2020-加州理工大学Devi Parikh】多任务视觉和语言表示学习

专知会员服务

38+阅读 · 2020年2月25日

GitHub榜首：最强目标检测平台Detectron2 ，基于PyTorch完全重构

新智元

9+阅读 · 2019年10月15日

如何评价FAIR最新开源的Detectron2目标检测框架？

极市平台

18+阅读 · 2019年10月14日

Mask R-CNN官方实现“又”来了！基于PyTorch，训练速度是原来2倍

机器学习算法与Python学习

5+阅读 · 2018年10月26日

整合全部顶尖目标检测算法：FAIR开源Detectron

炼数成金订阅号

6+阅读 · 2018年1月25日

Mask R-CNN 源代码终上线，Facebook 开源目标检测平台—Detectron

AI100

7+阅读 · 2018年1月24日

SFA: Small Faces Attention Face Detector

Arxiv

4+阅读 · 2018年12月20日

Detection and Segmentation of Manufacturing Defects with Convolutional Neural Networks and Transfer Learning

Arxiv

3+阅读 · 2018年8月7日

FSSD: Feature Fusion Single Shot Multibox Detector

Arxiv

8+阅读 · 2018年5月17日

Mask R-CNN

Arxiv

7+阅读 · 2018年1月24日

SSD: Single Shot MultiBox Detector

Arxiv

5+阅读 · 2016年12月29日

VIP会员