动态 | 商汤科技正式开源 mmdetection 和 mmcv

2018 年 10 月 16 日 AI研习社

AI 科技评论消息,10 月 12 日,商汤科技正式开源 mmdetection (https://github.com/open-mmlab/mmdetection)和 mmcv (https://github.com/open-mmlab/mmcv)两个项目。

据悉,mmdetection 检测库是基于商汤在 COCO 比赛(Detection 2018 winner)时的 codebase 重构,这个开源库提供了已公开发表的多种视觉检测核心模块,通过这些模块的组合,可以迅速搭建出各种著名的检测框架。据该开源库作者之一、香港中文大学陈恺介绍,这一版本中实现了 RPN,Fast R-CNN,Faster R-CNN,Mask R-CNN,近期还计划释放 RetinaNet 和 Cascade R-CNN。

mmcv 是一个基础库,主要分为两个部分,一部分是和 deep learning framework 无关的一些工具函数,比如 IO/Image/Video 相关的一些操作,另一部分是为 PyTorch 写的一套训练工具,可以大大减少用户需要写的代码量,同时让整个流程的定制变得容易。

在该库开源之后,知乎上有人提出问题:

如何评价商汤开源的 mm-detection 检测库?mm-detection 相比 FAIR 的 Detectron 如何?

陈恺也第一时间进行解答,他表示,mmdetection 和 Detectron 主要有如下三点差异:

  1. performance 稍高

  2. 训练速度稍快

  3. 所需显存稍小

他进一步解释道,在 performance 上 ,由于 PyTorch 官方 model zoo 里的 ResNet 结构和 Detectron 所用的 ResNet 有细微差别(mmdetection 中可以通过 backbone 的 style 参数指定),导致模型收敛速度不一样。他们用两种结构都进行了实验,和 Detectron 使用相同的 pretrain model 的情况下,performance 比 Detectron 稍高,在使用 PyTorch 官方的 model 进行训练时, 1x 的 lr schedule 下比 Detectron 的 performance 略低,但 2x 的情况下更高。

速度方面 Mask R-CNN 的差异比较大,其余框架的差异很小。采用相同的 setting,Detectron 每个 iteration 需要 0.89s,而 mmdetection 只需要 0.69s。Fast R-CNN 比较例外,比 Detectron 的速度稍慢。另外,他们在服务器上跑 Detectron 会比官方 report 的速度慢 20% 左右,他提出猜测,可能是 FB 的 Big Basin 服务器性能比他们好。

在显存方面这一检测库的优势比较明显,会小 30% 左右。但他表示,这和框架有关,不完全是 codebase 优化的功劳。一个让他们比较意外的结果是,现在的 codebase 版本跑 ResNet-50 的 Mask R-CNN,每张卡(12 G)可以放 4 张图,显存消耗比他们在 COCO 比赛时小了不少。

登录查看更多
0

相关内容

CVPR2020 | 商汤-港中文等提出PV-RCNN:3D目标检测新网络
专知会员服务
43+阅读 · 2020年4月17日
专知会员服务
109+阅读 · 2020年3月12日
如何评价FAIR最新开源的Detectron2目标检测框架?
极市平台
18+阅读 · 2019年10月14日
人脸检测库:libfacedetection
Python程序员
15+阅读 · 2019年3月22日
1500+ FPS!目前最快的CNN人脸检测算法开源
极市平台
25+阅读 · 2019年3月15日
Mask R-CNN官方实现“又”来了!基于PyTorch,训练速度是原来2倍
机器学习算法与Python学习
5+阅读 · 2018年10月26日
Arxiv
5+阅读 · 2018年5月16日
Arxiv
11+阅读 · 2018年4月8日
Arxiv
7+阅读 · 2018年3月19日
VIP会员
相关VIP内容
CVPR2020 | 商汤-港中文等提出PV-RCNN:3D目标检测新网络
专知会员服务
43+阅读 · 2020年4月17日
专知会员服务
109+阅读 · 2020年3月12日
Top
微信扫码咨询专知VIP会员