Pytorch视频分类教程

会员服务 ·

Pytorch视频分类教程

2019 年 5 月 25 日 专知

【导读】这是一个在UCF101上使用3D RNN/CNN+RNN 进行视频分类的教程，基于Pytorch实现。

数据集

UCF101 含有包括13320个视频与101个动作，视频有不同的视觉长度，视频画面大小也不一样，最小的视频只有29帧。

为了减少视频预处理工作，我们之间使用feichtenhofer预处理结束的数据。

https://github.com/feichtenhofer/twostreamfusion

模型

3D CNN

使用一些3D核和通道数N，来解决视频输入，视频可以看成是3D 的图片，并使用了批归一化与dropout。

CNN+RNN (CRNN)

CRNN 使用了CNN作为编码器，RNN作为解码器。

编码器：CNN函数将一个2D的图片 x(t) 编码成1D的向量z(t)。

解码器：RNN的输入为z(t),是超级为1D的序列h(t),然后输入到一个全连接网络来预测类别。在这里RNN使用了LSTM网络

训练与测试

对于3DCNN：

- 视频首先被变形到(t-dim, channels, x-dim, y-dim) = (29, 3, 256, 342) ，因为CNN需要固定输入输出的尺寸。

- 使用BatchNormalization dropout。

对于CRNN：

- 视频变形到 (t-dim, channels, x-dim, y-dim) = (29, 3, 224, 224) ，因为ResNet152的输入为224x224.

训练与测试视频的数量为9990:3330

Github 链接：

https://github.com/HHTseng/video-classification

-END-

专 · 知

专知，专业可信的人工智能知识分发，让认知协作更快更好！欢迎登录www.zhuanzhi.ai，注册登录专知，获取更多AI知识资料！

欢迎微信扫一扫加入专知人工智能知识星球群，获取最新AI专业干货知识教程视频资料和与专家交流咨询！

请加专知小助手微信（扫一扫如下二维码添加），加入专知人工智能主题群，咨询技术商务合作~

专知《深度学习:算法到实战》课程全部完成！550+位同学在学习，现在报名，限时优惠！网易云课堂人工智能畅销榜首位！

点击“阅读原文”，了解报名专知《深度学习:算法到实战》课程

登录查看更多

相关内容

视频分类

关注 631

一份循环神经网络RNNs简明教程，37页ppt

专知会员服务

173+阅读 · 2020年5月6日

【Facebook AI】低资源机器翻译，74页ppt

专知会员服务

30+阅读 · 2020年4月8日

【干货书】深度学习计算机视觉，332页pdf，手把手教你Python学习CV

专知会员服务

201+阅读 · 2020年3月31日

Sklearn 与 TensorFlow 机器学习实用指南,385页pdf

专知会员服务

130+阅读 · 2020年3月15日

【GitHub实战】Pytorch实现的小样本逼真的视频到视频转换

专知会员服务

36+阅读 · 2019年12月15日

【ICIP2019教程-NVIDIA】图像到图像转换，附7份PPT下载

专知会员服务

55+阅读 · 2019年11月20日

【书籍】深度学习框架：PyTorch入门与实践（附代码）

专知会员服务

167+阅读 · 2019年10月28日

深度学习视频中多目标跟踪：论文综述

专知会员服务

94+阅读 · 2019年10月13日

开源书：PyTorch深度学习起步

专知会员服务

51+阅读 · 2019年10月11日

【资源】强化学习实践教程

专知

43+阅读 · 2019年9月11日

Google大佬Josh Gordon发布Tensorflow 2.0入门教程, 附100页PPT下载

专知

13+阅读 · 2019年8月23日

【综述】深度学习在视频多目标跟踪上的应用

专知

14+阅读 · 2019年8月8日

【CVPR2019教程】视频理解中的图表示学习

专知

43+阅读 · 2019年6月20日

【资源推荐】Machine Learning基础学习资源汇总

专知

30+阅读 · 2019年5月29日

【资源推荐】复旦大学NLP上手教程

专知

41+阅读 · 2019年5月15日

【资源推荐】程序员线性代数教程，附代码实践

专知

29+阅读 · 2019年5月1日

【教程】从代码中理解深度网络架构（附72页slides及代码样例下载）

专知

22+阅读 · 2019年4月17日

921页《用Python3带你从小白入门机器学习实战》教程手册

专知

54+阅读 · 2018年12月28日

深度学习TensorFlow实现集合

专知

10+阅读 · 2018年9月8日

Activitynet 2019 Task 3: Exploring Contexts for Dense Captioning Events in Videos

Arxiv

3+阅读 · 2019年7月11日

Advances in Natural Language Question Answering: A Review

Arxiv

5+阅读 · 2019年4月10日

An End-to-End Baseline for Video Captioning

Arxiv

6+阅读 · 2019年4月4日

Discovery and recognition of motion primitives in human activities

Arxiv

4+阅读 · 2019年2月4日

SlowFast Networks for Video Recognition

Arxiv

19+阅读 · 2018年12月10日

Neural Architecture Search: A Survey

Arxiv

12+阅读 · 2018年9月5日

Joint Image Captioning and Question Answering

Arxiv

6+阅读 · 2018年5月22日

Fine-grained Video Classification and Captioning

Arxiv

7+阅读 · 2018年4月24日

Fine-grained Activity Recognition in Baseball Videos

Arxiv

6+阅读 · 2018年4月9日

Deep learning and its application to medical image segmentation

Arxiv

6+阅读 · 2018年3月23日

VIP会员