Efficient video architecture is the key to deploying video recognition systems on devices with limited computing resources. Unfortunately, existing video architectures are often computationally intensive and not suitable for such applications. The recent X3D work presents a new family of efficient video models by expanding a hand-crafted image architecture along multiple axes, such as space, time, width, and depth. Although operating in a conceptually large space, X3D searches one axis at a time, and merely explored a small set of 30 architectures in total, which does not sufficiently explore the space. This paper bypasses existing 2D architectures, and directly searched for 3D architectures in a fine-grained space, where block type, filter number, expansion ratio and attention block are jointly searched. A probabilistic neural architecture search method is adopted to efficiently search in such a large space. Evaluations on Kinetics and Something-Something-V2 benchmarks confirm our AutoX3D models outperform existing ones in accuracy up to 1.3% under similar FLOPs, and reduce the computational cost up to x1.74 when reaching similar performance.


翻译:高效视频结构是将视频识别系统安装在计算资源有限的装置上的关键。 不幸的是, 现有的视频结构往往在计算上非常密集, 并且不适合这些应用。 最近的 X3D 工作通过在空间、 时间、 宽度和深度等多个轴上扩展手制图像结构, 呈现出一套新型高效视频模型。 虽然在概念上大的空间运行, X3D 一次搜索一个轴, 并且只是探索了一组由30个小结构组成的、 无法充分探索空间的小型结构。 本文绕过现有的 2D 结构, 直接搜索了微小空间中的 3D 结构, 从而可以共同搜索区块类型、 过滤器号、 扩展率 和 关注区块 。 一种概率性神经结构搜索方法用于在如此大的空域中高效搜索 。 对动能学和某些东西- 点- V2 基准的评估证实了我们的自动X3D 模型在类似 FLOPs 下的准确度为1. 3 3, 并且将计算成本降低到 x1.74 的计算成本 。

0
下载
关闭预览

相关内容

【干货书】机器学习速查手册,135页pdf
专知会员服务
127+阅读 · 2020年11月20日
专知会员服务
61+阅读 · 2020年3月19日
抢鲜看!13篇CVPR2020论文链接/开源代码/解读
专知会员服务
50+阅读 · 2020年2月26日
“CVPR 2020 接受论文列表 1470篇论文都在这了
AutoML与轻量模型大列表
专知
8+阅读 · 2019年4月29日
disentangled-representation-papers
CreateAMind
26+阅读 · 2018年9月12日
Hierarchical Disentangled Representations
CreateAMind
4+阅读 · 2018年4月15日
Arxiv
6+阅读 · 2020年10月8日
Neural Architecture Optimization
Arxiv
8+阅读 · 2018年9月5日
Arxiv
12+阅读 · 2018年9月5日
VIP会员
相关VIP内容
【干货书】机器学习速查手册,135页pdf
专知会员服务
127+阅读 · 2020年11月20日
专知会员服务
61+阅读 · 2020年3月19日
抢鲜看!13篇CVPR2020论文链接/开源代码/解读
专知会员服务
50+阅读 · 2020年2月26日
相关资讯
“CVPR 2020 接受论文列表 1470篇论文都在这了
AutoML与轻量模型大列表
专知
8+阅读 · 2019年4月29日
disentangled-representation-papers
CreateAMind
26+阅读 · 2018年9月12日
Hierarchical Disentangled Representations
CreateAMind
4+阅读 · 2018年4月15日
相关论文
Arxiv
6+阅读 · 2020年10月8日
Neural Architecture Optimization
Arxiv
8+阅读 · 2018年9月5日
Arxiv
12+阅读 · 2018年9月5日
Top
微信扫码咨询专知VIP会员