视频自监督学习综述 - 专知

会员服务 ·

0

视频自监督学习综述

2022 年 7 月 5 日 专知

深度学习在各个领域的显著成功依赖于大规模注释数据集的可用性。然而，使用人工生成的注释会导致模型有偏差学习、领域泛化能力差和鲁棒性差。获取注释也很昂贵，需要付出很大的努力，这对视频来说尤其具有挑战性。作为另一种选择，自监督学习提供了一种不需要注释的表示学习方法，在图像和视频领域都显示出了前景。与图像域不同，学习视频表示更具有挑战性，因为时间维度，引入了运动和其他环境动力学。这也为在视频和多模态领域推进自监督学习的独家想法提供了机会。在这项综述中，我们提供了一个现有的方法在视频领域的自监督学习重点。我们根据它们的学习目标将这些方法总结为三种不同的类别: 1) 文本预置任务，2) 生成式建模，和 3)对比学习。这些方法在使用的方式上也有所不同; 1) video, 2) video-audio, 3) video-text, 4) video-audio-text。我们进一步介绍了常用的数据集、下游评估任务、现有工作的局限性以及该领域未来的潜在方向。

对大规模标记样本的要求限制了深度网络在数据有限且标注困难的问题上的使用，例如医学成像Dargan et al. [2020]。虽然在ImageNet Krizhevsky等人[2012a]和Kinetics Kay等人[2017]的大规模标记数据集上进行预训练确实能提高性能，但这种方法存在一些缺陷，如注释成本Yang et al. [2017], Cai et al. [2021]，注释偏差Chen和Joo [2021]， Rodrigues和Pereira[2018]，缺乏域泛化Wang等人[2021a]， Hu等人[2020]，Kim等人[2021]，以及缺乏鲁棒性Hendrycks和Dietterich[2019]。Hendrycks等[2021]。自监督学习(SSL)已经成为预训练深度模型的一种成功方法，以克服其中一些问题。它是一种很有前途的替代方案，可以在大规模数据集上训练模型，而不需要标记Jing和Tian[2020]，并且具有更好的泛化性。SSL使用一些来自训练样本本身的学习目标来训练模型。然后，这个预训练的模型被用作目标数据集的初始化，然后使用可用的标记样本对其进行微调。图1显示了这种方法的概览。

专知便捷查看

便捷下载，请关注专知公众号（点击上方蓝色专知关注）

后台回复“VSSL” 就可以获取《视频自监督学习综述》专知下载链接

专知，专业可信的人工智能知识分发 ，让认知协作更快更好！欢迎注册登录专知www.zhuanzhi.ai，获取100000+AI(AI与军事、医药、公安等)主题干货知识资料！

欢迎微信扫一扫加入专知人工智能知识星球群，获取最新AI专业干货知识教程资料和与专家交流咨询！

点击“ 阅读原文 ”，了解使用专知 ，查看获取100000+AI主题知识资料

登录查看更多

1

相关内容

自监督学习

自监督学习

自监督学习（self-supervised learning）可以被看作是机器学习的一种“理想状态”，模型直接从无标签数据中自行学习，无需标注数据。

基于模型的强化学习综述

基于模型的强化学习综述

专知会员服务

148+阅读 · 2022年7月13日

什么是终身学习？171页pdf最新《终身监督学习》新书阐述最新方法体系

什么是终身学习？171页pdf最新《终身监督学习》新书阐述最新方法体系

专知会员服务

88+阅读 · 2022年7月12日

视觉识别的无监督域适应研究综述

视觉识别的无监督域适应研究综述

专知会员服务

32+阅读 · 2021年12月17日

重邮高新波等最新《少样本目标检测算法》综述论文

重邮高新波等最新《少样本目标检测算法》综述论文

专知会员服务

35+阅读 · 2021年11月2日

蒙特利尔最新《自监督少样本目标检测》，20页pdf131系统性阐述少样本和自监督的目标检测研究进展

蒙特利尔最新《自监督少样本目标检测》，20页pdf131系统性阐述少样本和自监督的目标检测研究进展

专知会员服务

43+阅读 · 2021年10月29日

【TPAMI2021】深度神经网络自监督视觉特征学习综述，22页pdf

【TPAMI2021】深度神经网络自监督视觉特征学习综述，22页pdf

专知会员服务

41+阅读 · 2021年10月25日

浙大最新「深度学习弱目标检测定位」综述论文，13页pdf概述WSOD最新进展

浙大最新「深度学习弱目标检测定位」综述论文，13页pdf概述WSOD最新进展

专知会员服务

47+阅读 · 2021年5月30日

最新《对比监督学习》综述论文，20页pdf

最新《对比监督学习》综述论文，20页pdf

专知会员服务

86+阅读 · 2020年11月5日

最新《深度半监督学习》综述论文，43页pdf

最新《深度半监督学习》综述论文，43页pdf

专知会员服务

156+阅读 · 2020年6月12日

基于深度网络的自监督视觉特征学习综述，附24页论文下载

基于深度网络的自监督视觉特征学习综述，附24页论文下载

专知会员服务

66+阅读 · 2020年1月15日

深度学习药物发现综述

深度学习药物发现综述

专知

5+阅读 · 2022年6月2日

【伯克利马毅老师】强化学习与最优控制综述

【伯克利马毅老师】强化学习与最优控制综述

专知

19+阅读 · 2022年4月26日

【CMU博士论文】缓解负迁移提高迁移学习的泛化和效率，201页pdf

【CMU博士论文】缓解负迁移提高迁移学习的泛化和效率，201页pdf

专知

3+阅读 · 2022年4月19日

亚马逊最新《联邦学习》简明综述

亚马逊最新《联邦学习》简明综述

专知

3+阅读 · 2022年2月6日

联邦学习研究综述

联邦学习研究综述

专知

11+阅读 · 2021年12月25日

【NeurIPS2021】用于视频分割的密集无监督学习

【NeurIPS2021】用于视频分割的密集无监督学习

专知

0+阅读 · 2021年11月14日

综述｜重邮高新波等最新《少样本目标检测算法》

综述｜重邮高新波等最新《少样本目标检测算法》

极市平台

1+阅读 · 2021年11月4日

CVPR2020最新《小样本学习》综述教程，145页ppt带你学习最新FSL进展

CVPR2020最新《小样本学习》综述教程，145页ppt带你学习最新FSL进展

专知

40+阅读 · 2020年6月20日

自编码表示学习 25页最新进展综述，90篇参考文献

自编码表示学习 25页最新进展综述，90篇参考文献

专知

34+阅读 · 2018年12月18日

悉尼大学欧阳万里等人30页最新目标检测综述

悉尼大学欧阳万里等人30页最新目标检测综述

专知

12+阅读 · 2018年9月11日

面向跨领域异构数据的患者相似性学习方法及应用

国家自然科学基金

23+阅读 · 2016年12月31日

microRNAs调控自噬治疗大鼠脊髓损伤的实验研究

国家自然科学基金

0+阅读 · 2015年12月31日

面向大数据跨媒体检索的多模态哈希学习方法研究

国家自然科学基金

0+阅读 · 2015年12月31日

面向异分布数据的主动学习方法

国家自然科学基金

12+阅读 · 2015年12月31日

基于几何覆盖方法的半监督聚类算法研究

国家自然科学基金

0+阅读 · 2013年12月31日

谱范数下矩阵的广义最小秩逼近问题及应用

国家自然科学基金

0+阅读 · 2013年12月31日

基于动态图模型与多元结构化在线学习的视觉目标跟踪

国家自然科学基金

0+阅读 · 2013年12月31日

基于视频的行人检测和行为识别研究

国家自然科学基金

2+阅读 · 2012年12月31日

基于图的半监督学习关键问题研究及其在图像理解中的应用

国家自然科学基金

4+阅读 · 2012年12月31日

部分监督学习问题的支持向量机及其应用

国家自然科学基金

3+阅读 · 2012年12月31日

Combining Metric Learning and Attention Heads For Accurate and Efficient Multilabel Image Classification

Arxiv

0+阅读 · 2022年9月14日

Domain Generalization in Vision: A Survey

Arxiv

17+阅读 · 2021年7月18日

Cross-Modal Discrete Representation Learning

Arxiv

18+阅读 · 2021年6月10日

Recent Advances and Trends in Multimodal Deep Learning: A Review

Arxiv

57+阅读 · 2021年5月24日

CURL: Contrastive Unsupervised Representations for Reinforcement Learning

Arxiv

17+阅读 · 2020年4月28日

A Simple Framework for Contrastive Learning of Visual Representations

Arxiv

21+阅读 · 2020年2月13日

A Comprehensive Survey on Transfer Learning

A Comprehensive Survey on Transfer Learning

Arxiv

121+阅读 · 2019年11月7日

Dissecting Contextual Word Embeddings: Architecture and Representation

Dissecting Contextual Word Embeddings: Architecture and Representation

Arxiv

22+阅读 · 2018年8月27日

Video Captioning via Hierarchical Reinforcement Learning

Arxiv

20+阅读 · 2018年3月29日

MSDNN: Multi-Scale Deep Neural Network for Salient Object Detection

Arxiv

21+阅读 · 2018年1月12日

VIP会员

相关主题

自监督学习

注释（编程）

相关VIP内容

基于模型的强化学习综述

基于模型的强化学习综述

专知会员服务

148+阅读 · 2022年7月13日

什么是终身学习？171页pdf最新《终身监督学习》新书阐述最新方法体系

什么是终身学习？171页pdf最新《终身监督学习》新书阐述最新方法体系

专知会员服务

88+阅读 · 2022年7月12日

视觉识别的无监督域适应研究综述

视觉识别的无监督域适应研究综述

专知会员服务

32+阅读 · 2021年12月17日

重邮高新波等最新《少样本目标检测算法》综述论文

重邮高新波等最新《少样本目标检测算法》综述论文

专知会员服务

35+阅读 · 2021年11月2日

蒙特利尔最新《自监督少样本目标检测》，20页pdf131系统性阐述少样本和自监督的目标检测研究进展

蒙特利尔最新《自监督少样本目标检测》，20页pdf131系统性阐述少样本和自监督的目标检测研究进展

专知会员服务

43+阅读 · 2021年10月29日

【TPAMI2021】深度神经网络自监督视觉特征学习综述，22页pdf

【TPAMI2021】深度神经网络自监督视觉特征学习综述，22页pdf

专知会员服务

41+阅读 · 2021年10月25日

浙大最新「深度学习弱目标检测定位」综述论文，13页pdf概述WSOD最新进展

浙大最新「深度学习弱目标检测定位」综述论文，13页pdf概述WSOD最新进展

专知会员服务

47+阅读 · 2021年5月30日

最新《对比监督学习》综述论文，20页pdf

最新《对比监督学习》综述论文，20页pdf

专知会员服务

86+阅读 · 2020年11月5日

最新《深度半监督学习》综述论文，43页pdf

最新《深度半监督学习》综述论文，43页pdf

专知会员服务

156+阅读 · 2020年6月12日

基于深度网络的自监督视觉特征学习综述，附24页论文下载

基于深度网络的自监督视觉特征学习综述，附24页论文下载

专知会员服务

66+阅读 · 2020年1月15日

热门VIP内容

开通专知VIP会员享更多权益服务

【牛津大学博士论文】将序列结构与几何结构融入深度神经网络

工程视角：影响战争进程的小型无人机

企业级AI应用开发：从技术选型到生产落地

AI生成代码缺陷综述

相关资讯

深度学习药物发现综述

深度学习药物发现综述

专知

5+阅读 · 2022年6月2日

【伯克利马毅老师】强化学习与最优控制综述

【伯克利马毅老师】强化学习与最优控制综述

专知

19+阅读 · 2022年4月26日

【CMU博士论文】缓解负迁移提高迁移学习的泛化和效率，201页pdf

【CMU博士论文】缓解负迁移提高迁移学习的泛化和效率，201页pdf

专知

3+阅读 · 2022年4月19日

亚马逊最新《联邦学习》简明综述

亚马逊最新《联邦学习》简明综述

专知

3+阅读 · 2022年2月6日

联邦学习研究综述

联邦学习研究综述

专知

11+阅读 · 2021年12月25日

【NeurIPS2021】用于视频分割的密集无监督学习

【NeurIPS2021】用于视频分割的密集无监督学习

专知

0+阅读 · 2021年11月14日

综述｜重邮高新波等最新《少样本目标检测算法》

综述｜重邮高新波等最新《少样本目标检测算法》

极市平台

1+阅读 · 2021年11月4日

CVPR2020最新《小样本学习》综述教程，145页ppt带你学习最新FSL进展

CVPR2020最新《小样本学习》综述教程，145页ppt带你学习最新FSL进展

专知

40+阅读 · 2020年6月20日

自编码表示学习 25页最新进展综述，90篇参考文献

自编码表示学习 25页最新进展综述，90篇参考文献

专知

34+阅读 · 2018年12月18日

悉尼大学欧阳万里等人30页最新目标检测综述

悉尼大学欧阳万里等人30页最新目标检测综述

专知

12+阅读 · 2018年9月11日

相关基金

面向跨领域异构数据的患者相似性学习方法及应用

国家自然科学基金

23+阅读 · 2016年12月31日

microRNAs调控自噬治疗大鼠脊髓损伤的实验研究

国家自然科学基金

0+阅读 · 2015年12月31日

面向大数据跨媒体检索的多模态哈希学习方法研究

国家自然科学基金

0+阅读 · 2015年12月31日

面向异分布数据的主动学习方法

国家自然科学基金

12+阅读 · 2015年12月31日

基于几何覆盖方法的半监督聚类算法研究

国家自然科学基金

0+阅读 · 2013年12月31日

谱范数下矩阵的广义最小秩逼近问题及应用

国家自然科学基金

0+阅读 · 2013年12月31日

基于动态图模型与多元结构化在线学习的视觉目标跟踪

国家自然科学基金

0+阅读 · 2013年12月31日

基于视频的行人检测和行为识别研究

国家自然科学基金

2+阅读 · 2012年12月31日

基于图的半监督学习关键问题研究及其在图像理解中的应用

国家自然科学基金

4+阅读 · 2012年12月31日

部分监督学习问题的支持向量机及其应用

国家自然科学基金

3+阅读 · 2012年12月31日

相关论文

Combining Metric Learning and Attention Heads For Accurate and Efficient Multilabel Image Classification

Arxiv

0+阅读 · 2022年9月14日

Domain Generalization in Vision: A Survey

Arxiv

17+阅读 · 2021年7月18日

Cross-Modal Discrete Representation Learning

Arxiv

18+阅读 · 2021年6月10日

Recent Advances and Trends in Multimodal Deep Learning: A Review

Arxiv

57+阅读 · 2021年5月24日

CURL: Contrastive Unsupervised Representations for Reinforcement Learning

Arxiv

17+阅读 · 2020年4月28日

A Simple Framework for Contrastive Learning of Visual Representations

Arxiv

21+阅读 · 2020年2月13日

A Comprehensive Survey on Transfer Learning

A Comprehensive Survey on Transfer Learning

Arxiv

121+阅读 · 2019年11月7日

Dissecting Contextual Word Embeddings: Architecture and Representation

Dissecting Contextual Word Embeddings: Architecture and Representation

Arxiv

22+阅读 · 2018年8月27日

Video Captioning via Hierarchical Reinforcement Learning

Arxiv

20+阅读 · 2018年3月29日

MSDNN: Multi-Scale Deep Neural Network for Salient Object Detection

Arxiv

21+阅读 · 2018年1月12日

大家都在搜

大型语言模型

生成式人工智能

蓝牙安全攻防

朱克爱德华兹家族

精排模型-从MLP到行为序列：DIN、DIEN、MIMN、SIM、DSIN

微信扫码咨询专知VIP会员