Pytorch视频分类教程

2019 年 5 月 25 日 专知

【导读】这是一个在UCF101上使用3D RNN/CNN+RNN 进行视频分类的教程,基于Pytorch实现。


数据集

UCF101 含有包括13320个视频与101个动作,视频有不同的视觉长度,视频画面大小也不一样,最小的视频只有29帧。


为了减少视频预处理工作,我们之间使用feichtenhofer预处理结束的数据。

https://github.com/feichtenhofer/twostreamfusion


模型

3D CNN

使用一些3D核和通道数N,来解决视频输入,视频可以看成是3D 的图片,并使用了批归一化与dropout。

CNN+RNN (CRNN)

CRNN 使用了CNN作为编码器,RNN作为解码器。

编码器:CNN函数将一个2D的图片 x(t) 编码成1D的向量z(t)。

解码器:RNN的输入为z(t),是超级为1D的序列h(t),然后输入到一个全连接网络来预测类别。在这里RNN使用了LSTM网络

训练与测试

对于3DCNN:

- 视频首先被变形到(t-dim, channels, x-dim, y-dim) = (29, 3, 256, 342) ,因为CNN需要固定输入输出的尺寸。

- 使用BatchNormalization dropout。

对于CRNN:

- 视频变形到 (t-dim, channels, x-dim, y-dim) = (29, 3, 224, 224) ,因为ResNet152的输入为224x224.

训练与测试视频的数量为9990:3330


Github 链接:

https://github.com/HHTseng/video-classification

-END-

专 · 知

专知,专业可信的人工智能知识分发,让认知协作更快更好!欢迎登录www.zhuanzhi.ai,注册登录专知,获取更多AI知识资料!

欢迎微信扫一扫加入专知人工智能知识星球群,获取最新AI专业干货知识教程视频资料和与专家交流咨询!

请加专知小助手微信(扫一扫如下二维码添加),加入专知人工智能主题群,咨询技术商务合作~

专知《深度学习:算法到实战》课程全部完成!550+位同学在学习,现在报名,限时优惠!网易云课堂人工智能畅销榜首位!

点击“阅读原文”,了解报名专知《深度学习:算法到实战》课程

登录查看更多
6

相关内容

一份循环神经网络RNNs简明教程,37页ppt
专知会员服务
172+阅读 · 2020年5月6日
【Facebook AI】低资源机器翻译,74页ppt
专知会员服务
29+阅读 · 2020年4月8日
Sklearn 与 TensorFlow 机器学习实用指南,385页pdf
专知会员服务
129+阅读 · 2020年3月15日
【GitHub实战】Pytorch实现的小样本逼真的视频到视频转换
专知会员服务
35+阅读 · 2019年12月15日
【ICIP2019教程-NVIDIA】图像到图像转换,附7份PPT下载
专知会员服务
54+阅读 · 2019年11月20日
【书籍】深度学习框架:PyTorch入门与实践(附代码)
专知会员服务
163+阅读 · 2019年10月28日
深度学习视频中多目标跟踪:论文综述
专知会员服务
92+阅读 · 2019年10月13日
开源书:PyTorch深度学习起步
专知会员服务
50+阅读 · 2019年10月11日
【资源】强化学习实践教程
专知
43+阅读 · 2019年9月11日
【CVPR2019教程】视频理解中的图表示学习
专知
43+阅读 · 2019年6月20日
【资源推荐】复旦大学NLP上手教程
专知
41+阅读 · 2019年5月15日
深度学习TensorFlow实现集合
专知
10+阅读 · 2018年9月8日
Arxiv
6+阅读 · 2019年4月4日
SlowFast Networks for Video Recognition
Arxiv
19+阅读 · 2018年12月10日
Arxiv
12+阅读 · 2018年9月5日
Arxiv
6+阅读 · 2018年5月22日
Arxiv
7+阅读 · 2018年4月24日
VIP会员
相关VIP内容
一份循环神经网络RNNs简明教程,37页ppt
专知会员服务
172+阅读 · 2020年5月6日
【Facebook AI】低资源机器翻译,74页ppt
专知会员服务
29+阅读 · 2020年4月8日
Sklearn 与 TensorFlow 机器学习实用指南,385页pdf
专知会员服务
129+阅读 · 2020年3月15日
【GitHub实战】Pytorch实现的小样本逼真的视频到视频转换
专知会员服务
35+阅读 · 2019年12月15日
【ICIP2019教程-NVIDIA】图像到图像转换,附7份PPT下载
专知会员服务
54+阅读 · 2019年11月20日
【书籍】深度学习框架:PyTorch入门与实践(附代码)
专知会员服务
163+阅读 · 2019年10月28日
深度学习视频中多目标跟踪:论文综述
专知会员服务
92+阅读 · 2019年10月13日
开源书:PyTorch深度学习起步
专知会员服务
50+阅读 · 2019年10月11日
相关论文
Arxiv
6+阅读 · 2019年4月4日
SlowFast Networks for Video Recognition
Arxiv
19+阅读 · 2018年12月10日
Arxiv
12+阅读 · 2018年9月5日
Arxiv
6+阅读 · 2018年5月22日
Arxiv
7+阅读 · 2018年4月24日
Top
微信扫码咨询专知VIP会员