视频自监督学习综述 - 专知VIP

会员服务 ·

29

视频分析 · 自监督学习 · 综述论文 ·

2022 年 7 月 5 日

视频自监督学习综述

专知会员服务

专知，提供专业可信的知识分发服务，让认知协作更快更好！

深度学习在各个领域的显著成功依赖于大规模注释数据集的可用性。然而，使用人工生成的注释会导致模型有偏差学习、领域泛化能力差和鲁棒性差。获取注释也很昂贵，需要付出很大的努力，这对视频来说尤其具有挑战性。作为另一种选择，自监督学习提供了一种不需要注释的表示学习方法，在图像和视频领域都显示出了前景。与图像域不同，学习视频表示更具有挑战性，因为时间维度，引入了运动和其他环境动力学。这也为在视频和多模态领域推进自监督学习的独家想法提供了机会**。在这项综述中，我们提供了一个现有的方法在视频领域的自监督学习重点。**我们根据它们的学习目标将这些方法总结为三种不同的类别: 1) 文本预置任务，2) 生成式建模，和 3)对比学习。这些方法在使用的方式上也有所不同; 1) video, 2) video-audio, 3) video-text, 4) video-audio-text。我们进一步介绍了常用的数据集、下游评估任务、现有工作的局限性以及该领域未来的潜在方向。

对大规模标记样本的要求限制了深度网络在数据有限且标注困难的问题上的使用，例如医学成像Dargan et al. [2020]。虽然在ImageNet Krizhevsky等人[2012a]和Kinetics Kay等人[2017]的大规模标记数据集上进行预训练确实能提高性能，但这种方法存在一些缺陷，如注释成本Yang et al. [2017], Cai et al. [2021]，注释偏差Chen和Joo [2021]， Rodrigues和Pereira[2018]，缺乏域泛化Wang等人[2021a]， Hu等人[2020]，Kim等人[2021]，以及缺乏鲁棒性Hendrycks和Dietterich[2019]。Hendrycks等[2021]。自监督学习(SSL)已经成为预训练深度模型的一种成功方法，以克服其中一些问题。它是一种很有前途的替代方案，可以在大规模数据集上训练模型，而不需要标记Jing和Tian[2020]，并且具有更好的泛化性。SSL使用一些来自训练样本本身的学习目标来训练模型。然后，这个预训练的模型被用作目标数据集的初始化，然后使用可用的标记样本对其进行微调。图1显示了这种方法的概览。

成为VIP会员查看完整内容

53

相关内容

视频分析

基于模型的强化学习综述

基于模型的强化学习综述

专知会员服务

148+阅读 · 2022年7月13日

小数据如何学习？佐治亚理工杨笛一等《有限文本数据学习》ACL2022教程，阐述最新前沿技术，附Slides

小数据如何学习？佐治亚理工杨笛一等《有限文本数据学习》ACL2022教程，阐述最新前沿技术，附Slides

专知会员服务

34+阅读 · 2022年5月23日

视觉识别的无监督域适应研究综述

视觉识别的无监督域适应研究综述

专知会员服务

32+阅读 · 2021年12月17日

【TPAMI2021】深度神经网络自监督视觉特征学习综述，22页pdf

【TPAMI2021】深度神经网络自监督视觉特征学习综述，22页pdf

专知会员服务

41+阅读 · 2021年10月25日

SiT: 自监督视觉Transformer

专知会员服务

65+阅读 · 2021年4月11日

最新《对比监督学习》综述论文，20页pdf

最新《对比监督学习》综述论文，20页pdf

专知会员服务

86+阅读 · 2020年11月5日

图像分类半监督自监督无监督学习综述，A survey on Semi-, Self- and Unsupervised Learning for Image Classification

图像分类半监督自监督无监督学习综述，A survey on Semi-, Self- and Unsupervised Learning for Image Classification

专知会员服务

46+阅读 · 2020年7月29日

CVPR2020最新《小样本学习》综述教程，145页ppt带你学习最新FSL进展

CVPR2020最新《小样本学习》综述教程，145页ppt带你学习最新FSL进展

专知会员服务

246+阅读 · 2020年6月20日

【综述】图像分类中的半监督、自监督和非监督技术综述相同点，不同点和组合

【综述】图像分类中的半监督、自监督和非监督技术综述相同点，不同点和组合

专知会员服务

49+阅读 · 2020年2月23日

图像分类最新技术综述论文: 21种半监督、自监督和无监督学习方法一较高低

图像分类最新技术综述论文: 21种半监督、自监督和无监督学习方法一较高低

专知会员服务

185+阅读 · 2020年2月22日

最新《神经数据压缩导论》综述

最新《神经数据压缩导论》综述

专知

4+阅读 · 2022年7月19日

基于模型的强化学习综述

基于模型的强化学习综述

专知

42+阅读 · 2022年7月13日

中科院自动化所最新《视觉-语言预训练》综述

中科院自动化所最新《视觉-语言预训练》综述

专知

5+阅读 · 2022年2月23日

「强化学习可解释性」最新2022综述

「强化学习可解释性」最新2022综述

极市平台

3+阅读 · 2022年1月20日

再介绍一篇最新的Contrastive Self-supervised Learning综述论文

再介绍一篇最新的Contrastive Self-supervised Learning综述论文

夕小瑶的卖萌屋

2+阅读 · 2021年9月22日

多模态视觉语言表征学习研究综述

多模态视觉语言表征学习研究综述

专知

27+阅读 · 2020年12月3日

CVPR2020最新《小样本学习》综述教程，145页ppt带你学习最新FSL进展

CVPR2020最新《小样本学习》综述教程，145页ppt带你学习最新FSL进展

专知

40+阅读 · 2020年6月20日

综述 | 近5年基于深度学习的目标检测算法

综述 | 近5年基于深度学习的目标检测算法

计算机视觉life

38+阅读 · 2019年4月18日

迁移自适应学习最新综述，附21页论文下载

迁移自适应学习最新综述，附21页论文下载

专知

34+阅读 · 2019年3月13日

最新《深度神经网络自监督视觉特征学习综述》论文（附24页全文下载）

最新《深度神经网络自监督视觉特征学习综述》论文（附24页全文下载）

专知

36+阅读 · 2019年2月20日

基于深度信念网络的高光谱遥感影像变化检测方法研究

国家自然科学基金

3+阅读 · 2015年12月31日

大规模数据集3D手语识别的研究

国家自然科学基金

1+阅读 · 2014年12月31日

基于弱监督学习的图像语义分割研究

国家自然科学基金

4+阅读 · 2014年12月31日

多任务学习的理论分析与应用

国家自然科学基金

6+阅读 · 2013年12月31日

未标记数据流中的迁移学习关键问题研究

国家自然科学基金

5+阅读 · 2013年12月31日

适应大数据处理的概率特征映射研究

国家自然科学基金

0+阅读 · 2013年12月31日

机器翻译中大规模异类特征的迁移学习

国家自然科学基金

2+阅读 · 2013年12月31日

迁移学习在图像分类中的应用研究

国家自然科学基金

8+阅读 · 2013年12月31日

薄势垒增强型AlGaN/GaN HEMT及可靠性研究

国家自然科学基金

0+阅读 · 2013年12月31日

部分监督学习问题的支持向量机及其应用

国家自然科学基金

3+阅读 · 2012年12月31日

PIFu for the Real World: A Self-supervised Framework to Reconstruct Dressed Human from Single-view Images

Arxiv

0+阅读 · 2022年8月23日

A Survey of Learning on Small Data

Arxiv

19+阅读 · 2022年7月29日

Transformers in Medical Image Analysis: A Review

Transformers in Medical Image Analysis: A Review

Arxiv

40+阅读 · 2022年2月24日

A Survey on Vision Transformer

Arxiv

17+阅读 · 2022年2月23日

Graph Self-Supervised Learning: A Survey

Arxiv

15+阅读 · 2021年8月5日

Graph Neural Networks for Natural Language Processing: A Survey

Arxiv

36+阅读 · 2021年6月10日

A Survey of Transformers

Arxiv

103+阅读 · 2021年6月8日

A Survey on Visual Transformer

Arxiv

19+阅读 · 2020年12月23日

A Comprehensive Survey on Transfer Learning

A Comprehensive Survey on Transfer Learning

Arxiv

121+阅读 · 2019年11月7日

Few-shot Learning: A Survey

Few-shot Learning: A Survey

Arxiv

363+阅读 · 2019年4月10日

VIP会员

相关主题

自监督学习

相关VIP内容

基于模型的强化学习综述

基于模型的强化学习综述

专知会员服务

148+阅读 · 2022年7月13日

小数据如何学习？佐治亚理工杨笛一等《有限文本数据学习》ACL2022教程，阐述最新前沿技术，附Slides

小数据如何学习？佐治亚理工杨笛一等《有限文本数据学习》ACL2022教程，阐述最新前沿技术，附Slides

专知会员服务

34+阅读 · 2022年5月23日

视觉识别的无监督域适应研究综述

视觉识别的无监督域适应研究综述

专知会员服务

32+阅读 · 2021年12月17日

【TPAMI2021】深度神经网络自监督视觉特征学习综述，22页pdf

【TPAMI2021】深度神经网络自监督视觉特征学习综述，22页pdf

专知会员服务

41+阅读 · 2021年10月25日

SiT: 自监督视觉Transformer

专知会员服务

65+阅读 · 2021年4月11日

最新《对比监督学习》综述论文，20页pdf

最新《对比监督学习》综述论文，20页pdf

专知会员服务

86+阅读 · 2020年11月5日

图像分类半监督自监督无监督学习综述，A survey on Semi-, Self- and Unsupervised Learning for Image Classification

图像分类半监督自监督无监督学习综述，A survey on Semi-, Self- and Unsupervised Learning for Image Classification

专知会员服务

46+阅读 · 2020年7月29日

CVPR2020最新《小样本学习》综述教程，145页ppt带你学习最新FSL进展

CVPR2020最新《小样本学习》综述教程，145页ppt带你学习最新FSL进展

专知会员服务

246+阅读 · 2020年6月20日

【综述】图像分类中的半监督、自监督和非监督技术综述相同点，不同点和组合

【综述】图像分类中的半监督、自监督和非监督技术综述相同点，不同点和组合

专知会员服务

49+阅读 · 2020年2月23日

图像分类最新技术综述论文: 21种半监督、自监督和无监督学习方法一较高低

图像分类最新技术综述论文: 21种半监督、自监督和无监督学习方法一较高低

专知会员服务

185+阅读 · 2020年2月22日

热门VIP内容

开通专知VIP会员享更多权益服务

【博士论文】面向开放式世界的鲁棒智能体

美空军如何利用人工智能提升其兵棋推演能力

【AAAI2026】NeSTR：一种用于大型语言模型的神经-符号可溯因框架，用于时间推理

深度强化学习与模仿学习导论

相关资讯

最新《神经数据压缩导论》综述

最新《神经数据压缩导论》综述

专知

4+阅读 · 2022年7月19日

基于模型的强化学习综述

基于模型的强化学习综述

专知

42+阅读 · 2022年7月13日

中科院自动化所最新《视觉-语言预训练》综述

中科院自动化所最新《视觉-语言预训练》综述

专知

5+阅读 · 2022年2月23日

「强化学习可解释性」最新2022综述

「强化学习可解释性」最新2022综述

极市平台

3+阅读 · 2022年1月20日

再介绍一篇最新的Contrastive Self-supervised Learning综述论文

再介绍一篇最新的Contrastive Self-supervised Learning综述论文

夕小瑶的卖萌屋

2+阅读 · 2021年9月22日

多模态视觉语言表征学习研究综述

多模态视觉语言表征学习研究综述

专知

27+阅读 · 2020年12月3日

CVPR2020最新《小样本学习》综述教程，145页ppt带你学习最新FSL进展

CVPR2020最新《小样本学习》综述教程，145页ppt带你学习最新FSL进展

专知

40+阅读 · 2020年6月20日

综述 | 近5年基于深度学习的目标检测算法

综述 | 近5年基于深度学习的目标检测算法

计算机视觉life

38+阅读 · 2019年4月18日

迁移自适应学习最新综述，附21页论文下载

迁移自适应学习最新综述，附21页论文下载

专知

34+阅读 · 2019年3月13日

最新《深度神经网络自监督视觉特征学习综述》论文（附24页全文下载）

最新《深度神经网络自监督视觉特征学习综述》论文（附24页全文下载）

专知

36+阅读 · 2019年2月20日

相关基金

基于深度信念网络的高光谱遥感影像变化检测方法研究

国家自然科学基金

3+阅读 · 2015年12月31日

大规模数据集3D手语识别的研究

国家自然科学基金

1+阅读 · 2014年12月31日

基于弱监督学习的图像语义分割研究

国家自然科学基金

4+阅读 · 2014年12月31日

多任务学习的理论分析与应用

国家自然科学基金

6+阅读 · 2013年12月31日

未标记数据流中的迁移学习关键问题研究

国家自然科学基金

5+阅读 · 2013年12月31日

适应大数据处理的概率特征映射研究

国家自然科学基金

0+阅读 · 2013年12月31日

机器翻译中大规模异类特征的迁移学习

国家自然科学基金

2+阅读 · 2013年12月31日

迁移学习在图像分类中的应用研究

国家自然科学基金

8+阅读 · 2013年12月31日

薄势垒增强型AlGaN/GaN HEMT及可靠性研究

国家自然科学基金

0+阅读 · 2013年12月31日

部分监督学习问题的支持向量机及其应用

国家自然科学基金

3+阅读 · 2012年12月31日

相关论文

PIFu for the Real World: A Self-supervised Framework to Reconstruct Dressed Human from Single-view Images

Arxiv

0+阅读 · 2022年8月23日

A Survey of Learning on Small Data

Arxiv

19+阅读 · 2022年7月29日

Transformers in Medical Image Analysis: A Review

Transformers in Medical Image Analysis: A Review

Arxiv

40+阅读 · 2022年2月24日

A Survey on Vision Transformer

Arxiv

17+阅读 · 2022年2月23日

Graph Self-Supervised Learning: A Survey

Arxiv

15+阅读 · 2021年8月5日

Graph Neural Networks for Natural Language Processing: A Survey

Arxiv

36+阅读 · 2021年6月10日

A Survey of Transformers

Arxiv

103+阅读 · 2021年6月8日

A Survey on Visual Transformer

Arxiv

19+阅读 · 2020年12月23日

A Comprehensive Survey on Transfer Learning

A Comprehensive Survey on Transfer Learning

Arxiv

121+阅读 · 2019年11月7日

Few-shot Learning: A Survey

Few-shot Learning: A Survey

Arxiv

363+阅读 · 2019年4月10日

微信扫码咨询专知VIP会员