【AAAI2022】基于对比时空前置学习的视频自监督表示 - 专知VIP

会员服务 ·

6

对比学习 · 自监督学习 · 视频分析 · AAAI 2022 · 论文 ·

2021 年 12 月 19 日

【AAAI2022】基于对比时空前置学习的视频自监督表示

专知会员服务

专知，提供专业可信的知识分发服务，让认知协作更快更好！

时空表示学习是视频自监督表示的关键。目前的学习方法主要是对比学习和前置任务。然而，这些方法都是通过潜在空间中的特征相似度来判别采样实例来学习表征，而忽略了学习表征的中间状态，从而限制了整体性能。在这项工作中，考虑采样实例的相似程度作为中间状态，我们提出了一个新的前置任务-时空重叠率(spatial - temporal overlap rate, STOR)预测。它源于人类能够分辨视频在空间和时间上的重叠率。这个任务鼓励模型区分两个生成样本的STOR来学习表示。此外，我们采用结合前置任务和对比学习的联合优化方法来进一步增强时空表示学习。我们还研究了所提出方案中各组成部分的相互影响。大量实验表明，本文提出的语料存储任务对对比学习和托词学习都有较好的效果。联合优化方案可以显著提高视频理解的时空表征。代码可以在https://github.com/Katou2/CSTP上找到。

https://www.zhuanzhi.ai/paper/c0dee275900d84eb9dddb0d36111a0ed

成为VIP会员查看完整内容

20

相关内容

对比学习

通过潜在空间的对比损失最大限度地提高相同数据样本的不同扩充视图之间的一致性来学习表示。对比式自监督学习技术是一类很有前途的方法，它通过学习编码来构建表征，编码使两个事物相似或不同

【ICCV2021】基于对比视频表示学习的长短视图特征分解

专知会员服务

10+阅读 · 2021年10月6日

【CVPR2021】无监督时空表示学习的大规模研究

专知会员服务

23+阅读 · 2021年5月1日

【AAAI2021】时间关系建模与自监督的动作分割

【AAAI2021】时间关系建模与自监督的动作分割

专知会员服务

37+阅读 · 2021年1月24日

AAAI2021 | DTGRM：具有自监督时间关系建模的动作分割

AAAI2021 | DTGRM：具有自监督时间关系建模的动作分割

专知会员服务

15+阅读 · 2020年12月29日

【AAAI2021】层次图胶囊网络

【AAAI2021】层次图胶囊网络

专知会员服务

84+阅读 · 2020年12月18日

【AAAI2021】自监督对应学习的对比转换

【AAAI2021】自监督对应学习的对比转换

专知

12+阅读 · 2020年12月11日

论文浅尝 | DeCLUTR: 无监督文本表示的深度对比学习

论文浅尝 | DeCLUTR: 无监督文本表示的深度对比学习

开放知识图谱

4+阅读 · 2020年10月4日

何恺明最新一作论文：无监督胜有监督，迁移学习无压力，刷新7项检测分割任务

何恺明最新一作论文：无监督胜有监督，迁移学习无压力，刷新7项检测分割任务

量子位

7+阅读 · 2019年11月19日

AAAI 2019 | 百度、MIT等提出StNet：局部+全局的视频时空联合建模

AAAI 2019 | 百度、MIT等提出StNet：局部+全局的视频时空联合建模

机器之心

3+阅读 · 2019年1月28日

【AAAI2018】通过动态融合方式学习多模态词表示，中科院自动化所宗成庆老师团队最新工作

【AAAI2018】通过动态融合方式学习多模态词表示，中科院自动化所宗成庆老师团队最新工作

专知

6+阅读 · 2018年2月19日

Case-based Reasoning for Better Generalization in Text-Adventure Games

Case-based Reasoning for Better Generalization in Text-Adventure Games

Arxiv

0+阅读 · 2022年2月18日

Contrastive Spatio-Temporal Pretext Learning for Self-supervised Video Representation

Arxiv

11+阅读 · 2021年12月16日

Long Short View Feature Decomposition via Contrastive Video Representation Learning

Arxiv

7+阅读 · 2021年9月23日

Temporal Relational Modeling with Self-Supervision for Action Segmentation

Arxiv

13+阅读 · 2020年12月14日

Gaussian YOLOv3: An Accurate and Fast Object Detector Using Localization Uncertainty for Autonomous Driving

Arxiv

6+阅读 · 2019年4月9日

VIP会员

相关主题

自监督学习

相关VIP内容

【ICCV2021】基于对比视频表示学习的长短视图特征分解

专知会员服务

10+阅读 · 2021年10月6日

【CVPR2021】无监督时空表示学习的大规模研究

专知会员服务

23+阅读 · 2021年5月1日

【AAAI2021】时间关系建模与自监督的动作分割

【AAAI2021】时间关系建模与自监督的动作分割

专知会员服务

37+阅读 · 2021年1月24日

AAAI2021 | DTGRM：具有自监督时间关系建模的动作分割

AAAI2021 | DTGRM：具有自监督时间关系建模的动作分割

专知会员服务

15+阅读 · 2020年12月29日

【AAAI2021】层次图胶囊网络

【AAAI2021】层次图胶囊网络

专知会员服务

84+阅读 · 2020年12月18日

热门VIP内容

开通专知VIP会员享更多权益服务

【MIT博士论文】弱监督学习：理论、方法与应用

Andrej Karpathy：2025 年 LLM 年度回顾（2025 LLM Year in Review）

锚定情报：合成欺骗时代的地面真相

NeurIPS 2025 | NMKE：基于神经元归因与动态稀疏掩码的终身知识编辑

相关资讯

【AAAI2021】自监督对应学习的对比转换

【AAAI2021】自监督对应学习的对比转换

专知

12+阅读 · 2020年12月11日

论文浅尝 | DeCLUTR: 无监督文本表示的深度对比学习

论文浅尝 | DeCLUTR: 无监督文本表示的深度对比学习

开放知识图谱

4+阅读 · 2020年10月4日

何恺明最新一作论文：无监督胜有监督，迁移学习无压力，刷新7项检测分割任务

何恺明最新一作论文：无监督胜有监督，迁移学习无压力，刷新7项检测分割任务

量子位

7+阅读 · 2019年11月19日

AAAI 2019 | 百度、MIT等提出StNet：局部+全局的视频时空联合建模

AAAI 2019 | 百度、MIT等提出StNet：局部+全局的视频时空联合建模

机器之心

3+阅读 · 2019年1月28日

【AAAI2018】通过动态融合方式学习多模态词表示，中科院自动化所宗成庆老师团队最新工作

【AAAI2018】通过动态融合方式学习多模态词表示，中科院自动化所宗成庆老师团队最新工作

专知

6+阅读 · 2018年2月19日

相关论文

Case-based Reasoning for Better Generalization in Text-Adventure Games

Case-based Reasoning for Better Generalization in Text-Adventure Games

Arxiv

0+阅读 · 2022年2月18日

Contrastive Spatio-Temporal Pretext Learning for Self-supervised Video Representation

Arxiv

11+阅读 · 2021年12月16日

Long Short View Feature Decomposition via Contrastive Video Representation Learning

Arxiv

7+阅读 · 2021年9月23日

Temporal Relational Modeling with Self-Supervision for Action Segmentation

Arxiv

13+阅读 · 2020年12月14日

Gaussian YOLOv3: An Accurate and Fast Object Detector Using Localization Uncertainty for Autonomous Driving

Arxiv

6+阅读 · 2019年4月9日

微信扫码咨询专知VIP会员