基于PyTorch的CV模型框架，北大学生出品TorchCV

会员服务 ·

基于PyTorch的CV模型框架，北大学生出品TorchCV

2019 年 10 月 15 日 机器之心

机器之心整理

参与：张倩、泽南

在机器学习带来的所有颠覆性技术中，计算机视觉领域吸引了业内人士和学术界最大的关注。

刚刚推出 1.3 正式版的 PyTorch 风头正劲，人们已经围绕这一深度学习框架开发出了越来越多的工具。最近，一个名为 TorchCV 的计算机视觉模型框架站上了 GitHub 趋势榜。

项目链接：https://github.com/donnyyou/torchcv

该库提供了基于深度学习的大部分 CV 问题研究的源代码，对于使用者来说，调用最常用、最为先进的计算机模型从此可以变得更加容易。TorchCV 的作者 Donny You 来自北京大学，是机器感知与智能教育部重点实验室的一名研三学生。

TorchCV 支持的模型

TorchCV 支持图像分类、语义分割、目标检测、姿态检测、实例分割、生成对抗网络等任务中的多个常见模型，列表如下：

图像分类

VGG: Very Deep Convolutional Networks for Large-Scale Image Recognition
ResNet: Deep Residual Learning for Image Recognition
DenseNet: Densely Connected Convolutional Networks
ShuffleNet: An Extremely Efficient Convolutional Neural Network for Mobile Devices
ShuffleNet V2: Practical Guidelines for Ecient CNN Architecture Design
Partial Order Pruning: for Best Speed/Accuracy Trade-off in Neural Architecture Search

语义分割

DeepLabV3: Rethinking Atrous Convolution for Semantic Image Segmentation
PSPNet: Pyramid Scene Parsing Network
DenseASPP: DenseASPP for Semantic Segmentation in Street Scenes
Asymmetric Non-local Neural Networks for Semantic Segmentation

目标检测

SSD: Single Shot MultiBox Detector
Faster R-CNN: Towards Real-Time Object Detection with Region Proposal Networks
YOLOv3: An Incremental Improvement
FPN: Feature Pyramid Networks for Object Detection

姿态检测

CPM: Convolutional Pose Machines
OpenPose: Realtime Multi-Person 2D Pose Estimation using Part Affinity Fields

实例分割

Mask R-CNN

生成对抗网络

Pix2pix: Image-to-Image Translation with Conditional Adversarial Nets
CycleGAN: Unpaired Image-to-Image Translation using Cycle-Consistent

快速启动 TorchCV

TorchCV 目前仅支持 Python3.x 和 pytorch 1.0。

pip3 install -r requirements.txtcd extensions
sh make.sh

利用 TorchCV 得到的模型性能数据

以下所示的性能数据完全复现了论文的结果。

图像分类

语义分割

目标检测

姿态估计

OpenPose: Realtime Multi-Person 2D Pose Estimation using Part Affinity Fields

实例分割

Mask R-CNN

生成对抗网络

Pix2pix
CycleGAN

TorchCV 的数据集

TorchCV 定义了你能在数据集子目录中查到的所有任务的数据格式。下面是一个用于训练语义分割的数据集目录树示例。你可以使用 datasets/seg/preprocess文件夹中的脚本对开源数据集进行预处理。

文件夹地址：https://github.com/donnyyou/torchcv/tree/master/datasets/seg/preprocess

TorchCV 的命令

项目作者提供了命令行工具，供用户使用模型，代码如下：

训练

cd scripts/seg/cityscapes/
bash run_fs_pspnet_cityscapes_seg.sh train tag

恢复训练

cd scripts/seg/cityscapes/
bash run_fs_pspnet_cityscapes_seg.sh train tag

验证

cd scripts/seg/cityscapes/
bash run_fs_pspnet_cityscapes_seg.sh val tag

测试

cd scripts/seg/cityscapes/
bash run_fs_pspnet_cityscapes_seg.sh test tag

2019 年，PyTorch 正在逐渐赶超 TensorFlow，在研究领域成为最为流行的深度学习框架。随着后者使用人数的增多，我们未来还会看到更多高效工具。

10月16日晚，NVIDIA GPU 计算专家团队高级工程师季光博士将带来线上主题分享：利用 TensorRT 自由搭建高性能推理模型。点击阅读原文立即免费报名。

登录查看更多

相关内容

模型框架

关注 0

深度学习目标检测方法及其主流框架综述

专知会员服务

148+阅读 · 2020年6月26日

专知会员服务

106+阅读 · 2020年4月9日

50+篇《神经架构搜索NAS》2020论文合集

专知会员服务

61+阅读 · 2020年3月19日

CVPR 2020 论文开源项目合集

专知会员服务

110+阅读 · 2020年3月12日

近期必读的7篇 CVPR 2019【视觉问答】相关论文和代码

专知会员服务

37+阅读 · 2020年1月10日

八篇 ICCV 2019 【图神经网络（GNN）+CV】相关论文

专知会员服务

30+阅读 · 2020年1月10日

五篇 ICCV 2019 的【图神经网络（GNN）+CV】相关论文

专知会员服务

15+阅读 · 2020年1月9日

一网打尽！100+深度学习模型TensorFlow与Pytorch代码实现集合

专知会员服务

142+阅读 · 2020年1月3日

开源书：PyTorch深度学习起步

专知会员服务

51+阅读 · 2019年10月11日

[综述]深度学习下的场景文本检测与识别

专知会员服务

78+阅读 · 2019年10月10日

ICCV 2019 行为识别/视频理解论文汇总

极市平台

15+阅读 · 2019年9月26日

港中文开源基于PyTorch的多任务人脸识别框架

极市平台

17+阅读 · 2019年8月31日

CVPR2019年热门论文及开源代码分享

深度学习与NLP

7+阅读 · 2019年6月3日

CVPR2019| 04-17更新17篇论文及代码（目标检测、语义分割、损失函数、姿态估计等）

极市平台

24+阅读 · 2019年4月17日

CVPR2019 | 03-27日更新12篇论文及代码汇总（多目标跟踪、3D目标检测、分割等）

极市平台

55+阅读 · 2019年3月27日

CVPR2019 | 03-25日更新12篇论文及代码汇总（目标检测、姿态估计、跟踪、VQA等）

极市平台

5+阅读 · 2019年3月25日

TorchSeg：基于pytorch的语义分割算法开源了

极市平台

20+阅读 · 2019年1月28日

Facebook PyText 在 Github 上开源了

AINLP

7+阅读 · 2018年12月14日

Mask R-CNN官方实现“又”来了！基于PyTorch，训练速度是原来2倍

机器学习算法与Python学习

5+阅读 · 2018年10月26日

语义分割+视频分割开源代码集合

极市平台

35+阅读 · 2018年3月5日

A Survey of Methods for Low-Power Deep Learning and Computer Vision

Arxiv

14+阅读 · 2020年3月24日

Libra R-CNN: Towards Balanced Learning for Object Detection

Arxiv

7+阅读 · 2019年4月4日

Fire SSD: Wide Fire Modules based Single Shot Detector on Edge Device

Arxiv

3+阅读 · 2018年10月16日

Image Captioning based on Deep Reinforcement Learning

Arxiv

9+阅读 · 2018年9月13日

Deep Adaptive Proposal Network for Object Detection in Optical Remote Sensing Images

Arxiv

6+阅读 · 2018年7月19日

Convolutional CRFs for Semantic Segmentation

Arxiv

8+阅读 · 2018年5月15日

DeepFM: An End-to-End Wide & Deep Learning Framework for CTR Prediction

Arxiv

6+阅读 · 2018年4月12日

Encoder-Decoder with Atrous Separable Convolution for Semantic Image Segmentation

Arxiv

8+阅读 · 2018年2月7日

A Big Data Analysis Framework Using Apache Spark and Deep Learning

Arxiv

3+阅读 · 2017年11月25日

Fast YOLO: A Fast You Only Look Once System for Real-time Embedded Object Detection in Video

Arxiv

5+阅读 · 2017年9月18日

VIP会员