This paper introduces Continual 3D Convolutional Neural Networks (Co3D CNNs), a new computational formulation of spatio-temporal 3D CNNs, in which videos are processed frame-by-frame rather than by clip. In online processing tasks demanding frame-wise predictions, Co3D CNNs dispense with the computational redundancies of regular 3D CNNs, namely the repeated convolutions over frames, which appear in multiple clips. While yielding an order of magnitude in computational savings, Co3D CNNs have memory requirements comparable with that of corresponding regular 3D CNNs and are less affected by changes in the size of the temporal receptive field. We show that Continual 3D CNNs initialised on the weights from preexisting state-of-the-art video recognition models reduce the floating point operations for frame-wise computations by 10.0-12.4x while improving accuracy on Kinetics-400 by 2.3-3.8. Moreover, we investigate the transient start-up response of Co3D CNNs and perform an extensive benchmark of online processing speed as well as accuracy for publicly available state-of-the-art 3D CNNs on modern hardware.


翻译:本文介绍连续3D进化神经网络(Co3D CNN),这是对连续3D进化神经网络(Co3D CNN)的一种新的计算式配制,其中视频按框架而不是剪辑处理。在网上处理要求框架预测的任务中,Co3D CNN将常规3D进化神经网络的计算重复冗余(即,在多个剪辑中出现的对框架的反复变换)清除。C3D CNN在计算节省数量上达到一定的幅度时,其记忆要求与相应的经常3D CNN的类似,受时间开放域规模变化的影响较小。我们显示,Co3D CNN在原有最新视频识别模型的权重上,将框架计算浮点操作减少10.0-12.4x,同时将Kinitics-400的精确度提高2.3-3.8。此外,我们调查C3D CNNM的快速启动响应情况,并对网上处理速度进行广泛的基准,以及公开提供的现代硬件的准确性。

0
下载
关闭预览

相关内容

让 iOS 8 和 OS X Yosemite 无缝切换的一个新特性。 > Apple products have always been designed to work together beautifully. But now they may really surprise you. With iOS 8 and OS X Yosemite, you’ll be able to do more wonderful things than ever before.

Source: Apple - iOS 8
专知会员服务
31+阅读 · 2021年6月12日
BERT进展2019四篇必读论文
专知会员服务
67+阅读 · 2020年1月2日
《DeepGCNs: Making GCNs Go as Deep as CNNs》
专知会员服务
30+阅读 · 2019年10月17日
ECCV 2020 目标跟踪论文大盘点
极市平台
7+阅读 · 2020年10月4日
AAAI2020 图相关论文集
图与推荐
10+阅读 · 2020年7月15日
“CVPR 2020 接受论文列表 1470篇论文都在这了
17篇必看[知识图谱Knowledge Graphs] 论文@AAAI2020
必读!2018最具突破性计算机视觉论文Top 10
新智元
8+阅读 · 2019年2月15日
误差反向传播——RNN
统计学习与视觉计算组
18+阅读 · 2018年9月6日
IEEE2018|An Accurate and Real-time 3D Tracking System for Robots
【推荐】图像分类必读开创性论文汇总
机器学习研究会
14+阅读 · 2017年8月15日
Arxiv
0+阅读 · 2021年7月23日
Real-Time High-Resolution Background Matting
Arxiv
4+阅读 · 2020年12月14日
Arxiv
8+阅读 · 2018年3月20日
VIP会员
相关VIP内容
专知会员服务
31+阅读 · 2021年6月12日
BERT进展2019四篇必读论文
专知会员服务
67+阅读 · 2020年1月2日
《DeepGCNs: Making GCNs Go as Deep as CNNs》
专知会员服务
30+阅读 · 2019年10月17日
相关资讯
ECCV 2020 目标跟踪论文大盘点
极市平台
7+阅读 · 2020年10月4日
AAAI2020 图相关论文集
图与推荐
10+阅读 · 2020年7月15日
“CVPR 2020 接受论文列表 1470篇论文都在这了
17篇必看[知识图谱Knowledge Graphs] 论文@AAAI2020
必读!2018最具突破性计算机视觉论文Top 10
新智元
8+阅读 · 2019年2月15日
误差反向传播——RNN
统计学习与视觉计算组
18+阅读 · 2018年9月6日
IEEE2018|An Accurate and Real-time 3D Tracking System for Robots
【推荐】图像分类必读开创性论文汇总
机器学习研究会
14+阅读 · 2017年8月15日
Top
微信扫码咨询专知VIP会员