【AAAI2021】RSPNet: 相对速度感知的无监督视频表示学习 - 专知

会员服务 ·

0

【AAAI2021】RSPNet: 相对速度感知的无监督视频表示学习

2021 年 2 月 13 日 专知

RSPNet: Relative Speed Perception for Unsupervised Video Representation Learning

我们研究了无监督的视频表示学习，该学习旨在仅从未标记的视频中学习运动和外观特征，可以将其重用于下游任务，例如动作识别。然而，由于以下原因，这项任务极具挑战性：1）视频中的高度时空信息；2）缺少用于训练的标记数据。与静态图像的表示学习不同，难以构造合适的自我监督任务来很好地对运动和外观特征进行建模。最近，已经进行了几种尝试以通过视频回放速度预测来学习视频表示。但是，为视频获取精确的速度标签并非易事。更关键的是，学习的模型可能倾向于集中于运动模式，因此可能无法很好地学习外观特征。在本文中，我们观察到相对回放速度与运动模式更加一致，从而为表示学习提供了更加有效和稳定的监督。因此，我们提出了一种感知播放速度并利用两个视频片段之间的相对速度作为标签的新方法。这样，我们就能很好地感知速度并学习更好的运动功能。此外，为了确保学习外观特征，我们进一步提出了以外观为中心的任务，其中我们强制执行模型以感知两个视频剪辑之间的外观差异。我们表明，优化两个任务可以共同持续改善两个下游任务（即动作识别和视频检索）的性能。值得注意的是，对于UCF101数据集上的动作识别，在不使用标记数据进行预训练的情况下，我们达到了93.7％的准确性，这优于ImageNet监督的预训练模型。

https://arxiv.org/abs/2011.07949

专知便捷查看

便捷下载，请关注专知公众号（点击上方蓝色专知关注）

后台回复“RSPNET” 可以获取《【AAAI2021】RSPNet: 相对速度感知的无监督视频表示学习》专知下载链接索引

专知，专业可信的人工智能知识分发，让认知协作更快更好！欢迎注册登录专知www.zhuanzhi.ai，获取5000+AI主题干货知识资料！

欢迎微信扫一扫加入专知人工智能知识星球群，获取最新AI专业干货知识教程资料和与专家交流咨询！

点击“ 阅读原文 ”，了解使用专知 ，查看获取5000+AI主题知识资源

登录查看更多

2

相关内容

视频表示学习

视频表示学习

【CVPR2021】通过上下文和运动解耦的自监督视频表示学习

专知会员服务

20+阅读 · 2021年4月15日

【WWW2021】自监督多通道超图卷积网络

专知会员服务

40+阅读 · 2021年4月5日

【AAAI2021】基于双任务一致性的半监督医学图像分割

专知会员服务

45+阅读 · 2021年1月31日

【AAAI2021】时间关系建模与自监督的动作分割

【AAAI2021】时间关系建模与自监督的动作分割

专知会员服务

37+阅读 · 2021年1月24日

【AAAI2021】学习场景图之间的相似度实现图像到图像的检索

【AAAI2021】学习场景图之间的相似度实现图像到图像的检索

专知会员服务

38+阅读 · 2021年1月3日

【AAAI2021】数据增强图神经网络

专知会员服务

108+阅读 · 2020年12月21日

【AAAI2021】层次图胶囊网络

【AAAI2021】层次图胶囊网络

专知会员服务

84+阅读 · 2020年12月18日

【AAAI2021】自监督对应学习的对比转换

专知会员服务

20+阅读 · 2020年12月11日

【AAAI2021】利用先验知识对场景图进行分类

【AAAI2021】利用先验知识对场景图进行分类

专知会员服务

61+阅读 · 2020年12月3日

【WSDM2021】弱监督下的分层元数据感知文档分类

【WSDM2021】弱监督下的分层元数据感知文档分类

专知会员服务

11+阅读 · 2020年11月16日

【AAAI2021】自监督对应学习的对比转换

【AAAI2021】自监督对应学习的对比转换

专知

12+阅读 · 2020年12月11日

【AAAI2021】近似梯度下降的学习图神经网络

【AAAI2021】近似梯度下降的学习图神经网络

专知

8+阅读 · 2020年12月9日

【ACM Multimedia2020】跨模态注意力Transformer模型的深度视频理解

【ACM Multimedia2020】跨模态注意力Transformer模型的深度视频理解

专知

15+阅读 · 2020年8月30日

【KDD2020】图神经网络生成式预训练

【KDD2020】图神经网络生成式预训练

专知

22+阅读 · 2020年7月3日

【ICML2020】对比多视角表示学习

【ICML2020】对比多视角表示学习

专知

19+阅读 · 2020年6月28日

【SIGIR2020】用于冷启动推荐的内容感知神经哈希

【SIGIR2020】用于冷启动推荐的内容感知神经哈希

专知

6+阅读 · 2020年6月2日

【CVPR2020-港科大-腾讯】基于注意力机制及多关系检测器的小样本物体检测

【CVPR2020-港科大-腾讯】基于注意力机制及多关系检测器的小样本物体检测

专知

14+阅读 · 2020年4月6日

【CVPR2020】L2 ^GCN：图卷积网络的分层学习高效训练

【CVPR2020】L2 ^GCN：图卷积网络的分层学习高效训练

专知

12+阅读 · 2020年3月31日

【CVPR2020-中科院-腾讯优图】基于注意力卷积二叉神经树的细粒度视觉分类

【CVPR2020-中科院-腾讯优图】基于注意力卷积二叉神经树的细粒度视觉分类

专知

12+阅读 · 2020年3月29日

【IJCV2020】通过迭代亲密学习实现弱监督语义分割

【IJCV2020】通过迭代亲密学习实现弱监督语义分割

专知

6+阅读 · 2020年2月20日

Seasonal Contrast: Unsupervised Pre-Training from Uncurated Remote Sensing Data

Arxiv

0+阅读 · 2021年5月3日

Global2Local: Efficient Structure Search for Video Action Segmentation

Arxiv

5+阅读 · 2021年1月4日

Enhancing Unsupervised Video Representation Learning by Decoupling the Scene and the Motion

Arxiv

4+阅读 · 2020年12月4日

Neural Response Generation with Meta-Words

Neural Response Generation with Meta-Words

Arxiv

6+阅读 · 2019年6月14日

Reverse Attention for Salient Object Detection

Arxiv

11+阅读 · 2019年4月15日

Fire SSD: Wide Fire Modules based Single Shot Detector on Edge Device

Arxiv

3+阅读 · 2018年10月16日

Doubly Attentive Transformer Machine Translation

Doubly Attentive Transformer Machine Translation

Arxiv

4+阅读 · 2018年7月30日

DetNet: A Backbone network for Object Detection

Arxiv

5+阅读 · 2018年4月17日

Single-Shot Object Detection with Enriched Semantics

Arxiv

11+阅读 · 2018年4月8日

FSSD: Feature Fusion Single Shot Multibox Detector

Arxiv

8+阅读 · 2018年1月12日

VIP会员

相关主题

视频表示学习

相关VIP内容

【CVPR2021】通过上下文和运动解耦的自监督视频表示学习

专知会员服务

20+阅读 · 2021年4月15日

【WWW2021】自监督多通道超图卷积网络

专知会员服务

40+阅读 · 2021年4月5日

【AAAI2021】基于双任务一致性的半监督医学图像分割

专知会员服务

45+阅读 · 2021年1月31日

【AAAI2021】时间关系建模与自监督的动作分割

【AAAI2021】时间关系建模与自监督的动作分割

专知会员服务

37+阅读 · 2021年1月24日

【AAAI2021】学习场景图之间的相似度实现图像到图像的检索

【AAAI2021】学习场景图之间的相似度实现图像到图像的检索

专知会员服务

38+阅读 · 2021年1月3日

【AAAI2021】数据增强图神经网络

专知会员服务

108+阅读 · 2020年12月21日

【AAAI2021】层次图胶囊网络

【AAAI2021】层次图胶囊网络

专知会员服务

84+阅读 · 2020年12月18日

【AAAI2021】自监督对应学习的对比转换

专知会员服务

20+阅读 · 2020年12月11日

【AAAI2021】利用先验知识对场景图进行分类

【AAAI2021】利用先验知识对场景图进行分类

专知会员服务

61+阅读 · 2020年12月3日

【WSDM2021】弱监督下的分层元数据感知文档分类

【WSDM2021】弱监督下的分层元数据感知文档分类

专知会员服务

11+阅读 · 2020年11月16日

热门VIP内容

开通专知VIP会员享更多权益服务

操作系统智能体：基于多模态大模型（MLLM）的通用计算设备智能体综述

《美国太空军系统全生命周期建模、仿真与分析效能提升方案》最新84页报告

【博士论文】推进数据高效的深度学习：非参数 Transformer、主动测试与上下文学习

自主人工智能：未来战争是否将是自主化的？

相关资讯

【AAAI2021】自监督对应学习的对比转换

【AAAI2021】自监督对应学习的对比转换

专知

12+阅读 · 2020年12月11日

【AAAI2021】近似梯度下降的学习图神经网络

【AAAI2021】近似梯度下降的学习图神经网络

专知

8+阅读 · 2020年12月9日

【ACM Multimedia2020】跨模态注意力Transformer模型的深度视频理解

【ACM Multimedia2020】跨模态注意力Transformer模型的深度视频理解

专知

15+阅读 · 2020年8月30日

【KDD2020】图神经网络生成式预训练

【KDD2020】图神经网络生成式预训练

专知

22+阅读 · 2020年7月3日

【ICML2020】对比多视角表示学习

【ICML2020】对比多视角表示学习

专知

19+阅读 · 2020年6月28日

【SIGIR2020】用于冷启动推荐的内容感知神经哈希

【SIGIR2020】用于冷启动推荐的内容感知神经哈希

专知

6+阅读 · 2020年6月2日

【CVPR2020-港科大-腾讯】基于注意力机制及多关系检测器的小样本物体检测

【CVPR2020-港科大-腾讯】基于注意力机制及多关系检测器的小样本物体检测

专知

14+阅读 · 2020年4月6日

【CVPR2020】L2 ^GCN：图卷积网络的分层学习高效训练

【CVPR2020】L2 ^GCN：图卷积网络的分层学习高效训练

专知

12+阅读 · 2020年3月31日

【CVPR2020-中科院-腾讯优图】基于注意力卷积二叉神经树的细粒度视觉分类

【CVPR2020-中科院-腾讯优图】基于注意力卷积二叉神经树的细粒度视觉分类

专知

12+阅读 · 2020年3月29日

【IJCV2020】通过迭代亲密学习实现弱监督语义分割

【IJCV2020】通过迭代亲密学习实现弱监督语义分割

专知

6+阅读 · 2020年2月20日

相关论文

Seasonal Contrast: Unsupervised Pre-Training from Uncurated Remote Sensing Data

Arxiv

0+阅读 · 2021年5月3日

Global2Local: Efficient Structure Search for Video Action Segmentation

Arxiv

5+阅读 · 2021年1月4日

Enhancing Unsupervised Video Representation Learning by Decoupling the Scene and the Motion

Arxiv

4+阅读 · 2020年12月4日

Neural Response Generation with Meta-Words

Neural Response Generation with Meta-Words

Arxiv

6+阅读 · 2019年6月14日

Reverse Attention for Salient Object Detection

Arxiv

11+阅读 · 2019年4月15日

Fire SSD: Wide Fire Modules based Single Shot Detector on Edge Device

Arxiv

3+阅读 · 2018年10月16日

Doubly Attentive Transformer Machine Translation

Doubly Attentive Transformer Machine Translation

Arxiv

4+阅读 · 2018年7月30日

DetNet: A Backbone network for Object Detection

Arxiv

5+阅读 · 2018年4月17日

Single-Shot Object Detection with Enriched Semantics

Arxiv

11+阅读 · 2018年4月8日

FSSD: Feature Fusion Single Shot Multibox Detector

Arxiv

8+阅读 · 2018年1月12日

大家都在搜

大型语言模型

CMU博士论文

久别重逢话双塔

OpenKG开源系列 | 海洋鱼类百科知识图谱（浙江大学）

微信扫码咨询专知VIP会员