基于PyTorch的CV模型框架,北大学生出品TorchCV

2019 年 10 月 15 日 机器之心

机器之心整理

参与:张倩、泽南

在机器学习带来的所有颠覆性技术中,计算机视觉领域吸引了业内人士和学术界最大的关注。


刚刚推出 1.3 正式版的 PyTorch 风头正劲,人们已经围绕这一深度学习框架开发出了越来越多的工具。最近,一个名为 TorchCV 的计算机视觉模型框架站上了 GitHub 趋势榜。


项目链接:https://github.com/donnyyou/torchcv


该库提供了基于深度学习的大部分 CV 问题研究的源代码,对于使用者来说,调用最常用、最为先进的计算机模型从此可以变得更加容易。TorchCV 的作者 Donny You 来自北京大学,是机器感知与智能教育部重点实验室的一名研三学生。


TorchCV 支持的模型


TorchCV 支持图像分类、语义分割、目标检测、姿态检测、实例分割、生成对抗网络等任务中的多个常见模型,列表如下:


图像分类


  • VGG: Very Deep Convolutional Networks for Large-Scale Image Recognition

  • ResNet: Deep Residual Learning for Image Recognition

  • DenseNet: Densely Connected Convolutional Networks

  • ShuffleNet: An Extremely Efficient Convolutional Neural Network for Mobile Devices

  • ShuffleNet V2: Practical Guidelines for Ecient CNN Architecture Design

  • Partial Order Pruning: for Best Speed/Accuracy Trade-off in Neural Architecture Search


语义分割


  • DeepLabV3: Rethinking Atrous Convolution for Semantic Image Segmentation

  • PSPNet: Pyramid Scene Parsing Network

  • DenseASPP: DenseASPP for Semantic Segmentation in Street Scenes

  • Asymmetric Non-local Neural Networks for Semantic Segmentation


目标检测


  • SSD: Single Shot MultiBox Detector

  • Faster R-CNN: Towards Real-Time Object Detection with Region Proposal Networks

  • YOLOv3: An Incremental Improvement

  • FPN: Feature Pyramid Networks for Object Detection


姿态检测


  • CPM: Convolutional Pose Machines

  • OpenPose: Realtime Multi-Person 2D Pose Estimation using Part Affinity Fields


实例分割

  • Mask R-CNN


生成对抗网络


  • Pix2pix: Image-to-Image Translation with Conditional Adversarial Nets

  • CycleGAN: Unpaired Image-to-Image Translation using Cycle-Consistent 


快速启动 TorchCV


TorchCV 目前仅支持 Python3.x 和 pytorch 1.0。

pip3 install -r requirements.txtcd extensions
sh make.sh

利用 TorchCV 得到的模型性能数据


以下所示的性能数据完全复现了论文的结果。


图像分类


语义分割



目标检测


姿态估计


  • OpenPose: Realtime Multi-Person 2D Pose Estimation using Part Affinity Fields


实例分割


  • Mask R-CNN


生成对抗网


  • Pix2pix

  • CycleGAN


TorchCV 的数据集


TorchCV 定义了你能在数据集子目录中查到的所有任务的数据格式。下面是一个用于训练语义分割的数据集目录树示例。你可以使用 datasets/seg/preprocess文件夹中的脚本对开源数据集进行预处理。

文件夹地址:https://github.com/donnyyou/torchcv/tree/master/datasets/seg/preprocess


TorchCV 的命令


项目作者提供了命令行工具,供用户使用模型,代码如下:


训练

cd scripts/seg/cityscapes/
bash run_fs_pspnet_cityscapes_seg.sh train tag

恢复训练

cd scripts/seg/cityscapes/
bash run_fs_pspnet_cityscapes_seg.sh train tag


验证

cd scripts/seg/cityscapes/
bash run_fs_pspnet_cityscapes_seg.sh val tag


测试

cd scripts/seg/cityscapes/
bash run_fs_pspnet_cityscapes_seg.sh test tag

2019 年,PyTorch 正在逐渐赶超 TensorFlow,在研究领域成为最为流行的深度学习框架。随着后者使用人数的增多,我们未来还会看到更多高效工具。


10月16日晚,NVIDIA GPU 计算专家团队高级工程师季光博士将带来线上主题分享:利用 TensorRT 自由搭建高性能推理模型。点击阅读原文立即免费报名。


登录查看更多
1

相关内容

深度学习目标检测方法及其主流框架综述
专知会员服务
143+阅读 · 2020年6月26日
专知会员服务
59+阅读 · 2020年3月19日
专知会员服务
109+阅读 · 2020年3月12日
近期必读的7篇 CVPR 2019【视觉问答】相关论文和代码
专知会员服务
34+阅读 · 2020年1月10日
八篇 ICCV 2019 【图神经网络(GNN)+CV】相关论文
专知会员服务
29+阅读 · 2020年1月10日
五篇 ICCV 2019 的【图神经网络(GNN)+CV】相关论文
专知会员服务
14+阅读 · 2020年1月9日
一网打尽!100+深度学习模型TensorFlow与Pytorch代码实现集合
开源书:PyTorch深度学习起步
专知会员服务
50+阅读 · 2019年10月11日
[综述]深度学习下的场景文本检测与识别
专知会员服务
77+阅读 · 2019年10月10日
ICCV 2019 行为识别/视频理解论文汇总
极市平台
15+阅读 · 2019年9月26日
港中文开源基于PyTorch的多任务人脸识别框架
极市平台
17+阅读 · 2019年8月31日
CVPR2019年热门论文及开源代码分享
深度学习与NLP
7+阅读 · 2019年6月3日
TorchSeg:基于pytorch的语义分割算法开源了
极市平台
20+阅读 · 2019年1月28日
Facebook PyText 在 Github 上开源了
AINLP
7+阅读 · 2018年12月14日
Mask R-CNN官方实现“又”来了!基于PyTorch,训练速度是原来2倍
机器学习算法与Python学习
5+阅读 · 2018年10月26日
语义分割+视频分割开源代码集合
极市平台
35+阅读 · 2018年3月5日
Image Captioning based on Deep Reinforcement Learning
Arxiv
8+阅读 · 2018年5月15日
VIP会员
相关VIP内容
深度学习目标检测方法及其主流框架综述
专知会员服务
143+阅读 · 2020年6月26日
专知会员服务
59+阅读 · 2020年3月19日
专知会员服务
109+阅读 · 2020年3月12日
近期必读的7篇 CVPR 2019【视觉问答】相关论文和代码
专知会员服务
34+阅读 · 2020年1月10日
八篇 ICCV 2019 【图神经网络(GNN)+CV】相关论文
专知会员服务
29+阅读 · 2020年1月10日
五篇 ICCV 2019 的【图神经网络(GNN)+CV】相关论文
专知会员服务
14+阅读 · 2020年1月9日
一网打尽!100+深度学习模型TensorFlow与Pytorch代码实现集合
开源书:PyTorch深度学习起步
专知会员服务
50+阅读 · 2019年10月11日
[综述]深度学习下的场景文本检测与识别
专知会员服务
77+阅读 · 2019年10月10日
相关资讯
ICCV 2019 行为识别/视频理解论文汇总
极市平台
15+阅读 · 2019年9月26日
港中文开源基于PyTorch的多任务人脸识别框架
极市平台
17+阅读 · 2019年8月31日
CVPR2019年热门论文及开源代码分享
深度学习与NLP
7+阅读 · 2019年6月3日
TorchSeg:基于pytorch的语义分割算法开源了
极市平台
20+阅读 · 2019年1月28日
Facebook PyText 在 Github 上开源了
AINLP
7+阅读 · 2018年12月14日
Mask R-CNN官方实现“又”来了!基于PyTorch,训练速度是原来2倍
机器学习算法与Python学习
5+阅读 · 2018年10月26日
语义分割+视频分割开源代码集合
极市平台
35+阅读 · 2018年3月5日
Top
微信扫码咨询专知VIP会员