We present SlowFast networks for video recognition. Our model involves (i) a Slow pathway, operating at low frame rate, to capture spatial semantics, and (ii) a Fast pathway, operating at high frame rate, to capture motion at fine temporal resolution. The Fast pathway can be made very lightweight by reducing its channel capacity, yet can learn useful temporal information for video recognition. Our models achieve strong performance for both action classification and detection in video, and large improvements are pin-pointed as contributions by our SlowFast concept. We report state-of-the-art accuracy on major video recognition benchmarks, Kinetics, Charades and AVA. Code will be made publicly available in PyTorch.


翻译:我们展示了“慢速”视频识别网络。我们的模型包括 (一) 慢路,以低框架速率运行,以捕捉空间语义学,和 (二) 快速通道,以高框架速率运行,以精确的时间分辨率捕捉运动。快速通道可以通过降低频道容量而变得非常轻,但可以学习有用的时间信息来进行视频识别。我们的模型在视频行动分类和检测两方面都取得了显著的绩效,而巨大的改进被我们慢框架速率概念的贡献所点出。 我们报告的主要视频识别基准、动因学、剧场和AVA的最新准确性。 代码将在PyTorch上公布。

4
下载
关闭预览

相关内容

【ICML2020】持续图神经网络,Continuous Graph Neural Networks
专知会员服务
149+阅读 · 2020年6月28日
因果图,Causal Graphs,52页ppt
专知会员服务
246+阅读 · 2020年4月19日
抢鲜看!13篇CVPR2020论文链接/开源代码/解读
专知会员服务
49+阅读 · 2020年2月26日
[综述]深度学习下的场景文本检测与识别
专知会员服务
77+阅读 · 2019年10月10日
ICCV 2019 行为识别/视频理解论文汇总
极市平台
15+阅读 · 2019年9月26日
简评 | Video Action Recognition 的近期进展
极市平台
20+阅读 · 2019年4月21日
视频理解 S3D,I3D-GCN,SlowFastNet, LFB
极市平台
7+阅读 · 2019年1月31日
meta learning 17年:MAML SNAIL
CreateAMind
11+阅读 · 2019年1月2日
计算机视觉领域顶会CVPR 2018 接受论文列表
Fast R-CNN
数据挖掘入门与实战
3+阅读 · 2018年4月20日
Arxiv
4+阅读 · 2020年3月27日
Arxiv
7+阅读 · 2018年4月24日
VIP会员
Top
微信扫码咨询专知VIP会员