【CVPR2020-Facebook AI】扩展架构的高效视频识别,X3D: Expanding Architectures

2020 年 4 月 11 日 专知

本文提出了一类高效的视频网络——X3D,它在空间、时间、宽度和深度等多个网络轴上逐步扩展了一个微小的二维图像分类体系结构。受机器学习中特征选择方法的启发,提出了一种简单的分步网络扩展方法,该方法在每一步中扩展一条轴,从而达到了较好的精度和复杂度平衡。为了将X3D扩展到特定的目标复杂性,我们执行前向扩展和后向收缩。X3D实现了最先进的性能,同时需要4.8倍和5.5倍的更少的乘法和参数,以达到与以前的工作类似的精度。我们最令人惊讶的发现是,具有高时空分辨率的网络可以表现得很好,而在网络宽度和参数方面则非常轻。在视频分类和检测基准上,我们报告了具有竞争力的准确性和前所未有的效率。


https://arxiv.org/abs/2004.04730


专知便捷查看

便捷下载,请关注专知公众号(点击上方蓝色专知关注)

  • 后台回复“X3D” 就可以获取【CVPR2020-Facebook AI】扩展架构的高效视频识别》专知下载链接

专知,专业可信的人工智能知识分发,让认知协作更快更好!欢迎注册登录专知www.zhuanzhi.ai,获取5000+AI主题干货知识资料!
欢迎微信扫一扫加入专知人工智能知识星球群,获取最新AI专业干货知识教程资料和与专家交流咨询
点击“ 阅读原文 ”,在 专知 查看 本文详细链接
登录查看更多
1

相关内容

【CVPR2020】视觉推理-可微自适应计算时间
专知会员服务
12+阅读 · 2020年4月28日
【ICLR2020-Facebook AI】张量分解的时序知识图谱补全
专知会员服务
58+阅读 · 2020年4月14日
【SIGMOD2020-腾讯】Web规模本体可扩展构建
专知会员服务
29+阅读 · 2020年4月12日
专知会员服务
60+阅读 · 2020年3月19日
【阿里巴巴-CVPR2020】频域学习,Learning in the Frequency Domain
【泡泡点云时空】PointConv: 3D点云的深度卷积网络
泡泡机器人SLAM
23+阅读 · 2019年6月12日
谷歌 MorphNet:让你的神经网络更小但更快
机器学习算法与Python学习
5+阅读 · 2019年4月18日
解读谷歌NASNet:一个大规模图像识别架构!(附论文)
全球人工智能
9+阅读 · 2018年1月20日
TResNet: High Performance GPU-Dedicated Architecture
Arxiv
8+阅读 · 2020年3月30日
q-Space Novelty Detection with Variational Autoencoders
Neural Architecture Optimization
Arxiv
8+阅读 · 2018年9月5日
Arxiv
12+阅读 · 2018年9月5日
Arxiv
9+阅读 · 2018年1月4日
VIP会员
Top
微信扫码咨询专知VIP会员