【CVPR2021】背景鲁棒的自监督视频表征学习 - 专知VIP

会员服务 ·

1

自监督学习 · 视频表征学习 · CVPR 2021 ·

2021 年 3 月 13 日

【CVPR2021】背景鲁棒的自监督视频表征学习

专知会员服务

专知，提供专业可信的知识分发服务，让认知协作更快更好！

自监督学习通过从数据本身来获取监督信号，在视频表征学习领域展现出了巨大潜力。由于一些主流的方法容易受到背景信息的欺骗和影响，为了减轻模型对背景信息的依赖，我们提出通过添加背景来去除背景影响。具体而言，给定一个视频，我们从中随机选择一个静态帧，并将其添加到其它的每一帧中，以构建一个分散注意力的视频样本，然后要求模型拉近分散注意力的视频样本与原始视频样本之间的特征距离，如此使得模型能够更好地抵抗背景的影响，而更多地关注运动变化。我们的方法命名为背景消除（Background Erasing，BE）。值得注意的是，我们的方法可以便捷地添加到大多数SOTA方法中。BE在MoCo的基础上，对具有严重背景偏见的数据集UCF101和HMDB51，分别带来了16.4%和19.1%的提升，而对具有较小背景偏见的数据集Diving48数据集带来了14.5%的提升。

https://www.zhuanzhi.ai/paper/14820cc4d73f0a98bb76c67c3cea6c3c

成为VIP会员查看完整内容

17

相关内容

自监督学习

自监督学习

自监督学习（self-supervised learning）可以被看作是机器学习的一种“理想状态”，模型直接从无标签数据中自行学习，无需标注数据。

【CVPR2021】用于行人重识别的无监督多源域自适应

专知会员服务

21+阅读 · 2021年5月1日

【CVPR2021】无监督时空表示学习的大规模研究

专知会员服务

23+阅读 · 2021年5月1日

【CVPR2021】针对场景图生成语义模糊性的概率性建模

专知会员服务

17+阅读 · 2021年4月27日

【CVPR2021】GAN人脸预训练模型

【CVPR2021】GAN人脸预训练模型

专知会员服务

24+阅读 · 2021年4月10日

【CVPR2021】基于端到端预训练的视觉-语言表征学习

【CVPR2021】基于端到端预训练的视觉-语言表征学习

专知会员服务

38+阅读 · 2021年4月9日

【CVPR2021】动态度量学习

【CVPR2021】动态度量学习

专知会员服务

40+阅读 · 2021年3月30日

CVPR2021-单目实时全身捕捉的方法

专知会员服务

20+阅读 · 2021年3月18日

【CVPR2021】半监督迁移学习的自适应一致性正则化

专知会员服务

33+阅读 · 2021年3月7日

【CVPR2021】自监督几何感知

【CVPR2021】自监督几何感知

专知会员服务

46+阅读 · 2021年3月6日

【AAAI2021】时间关系建模与自监督的动作分割

【AAAI2021】时间关系建模与自监督的动作分割

专知会员服务

37+阅读 · 2021年1月24日

【CVPR2021】半监督迁移学习的自适应一致性正则化

【CVPR2021】半监督迁移学习的自适应一致性正则化

专知

41+阅读 · 2021年3月7日

【CVPR2021】基于反事实推断的视觉问答框架

【CVPR2021】基于反事实推断的视觉问答框架

专知

38+阅读 · 2021年3月4日

【AAAI2021】自监督对应学习的对比转换

【AAAI2021】自监督对应学习的对比转换

专知

12+阅读 · 2020年12月11日

【CVPR2020-牛津-谷歌】语音到动作:动作识别的跨模态监督，Cross-modal Supervision

【CVPR2020-牛津-谷歌】语音到动作:动作识别的跨模态监督，Cross-modal Supervision

专知

10+阅读 · 2020年3月31日

NeurIPS 2019 | 一种对噪音标注鲁棒的基于信息论的损失函数

NeurIPS 2019 | 一种对噪音标注鲁棒的基于信息论的损失函数

机器之心

7+阅读 · 2019年11月21日

训练目标检测模型只需要这 6 行代码

训练目标检测模型只需要这 6 行代码

AI科技评论

8+阅读 · 2019年8月19日

论文浅尝 | 利用关系标签的主题语义知识为关系抽取提供监督 (IJCAI 2019)

论文浅尝 | 利用关系标签的主题语义知识为关系抽取提供监督 (IJCAI 2019)

开放知识图谱

16+阅读 · 2019年8月17日

【CVPR2019】弱监督图像分类建模

【CVPR2019】弱监督图像分类建模

深度学习大讲堂

38+阅读 · 2019年7月25日

【泡泡一分钟】将背景带入前景：在弱监督的视频语义分割中使所有类相等（ICCV2017-221）

【泡泡一分钟】将背景带入前景：在弱监督的视频语义分割中使所有类相等（ICCV2017-221）

泡泡机器人SLAM

4+阅读 · 2018年12月3日

结合弱监督信息的凸聚类

结合弱监督信息的凸聚类

计算机研究与发展

6+阅读 · 2017年8月30日

Learning Position and Target Consistency for Memory-based Video Object Segmentation

Arxiv

3+阅读 · 2021年4月9日

Adaptive Consistency Regularization for Semi-Supervised Transfer Learning

Arxiv

23+阅读 · 2021年3月3日

Disentangled Information Bottleneck

Disentangled Information Bottleneck

Arxiv

12+阅读 · 2020年12月22日

Data Augmentation using Pre-trained Transformer Models

Arxiv

17+阅读 · 2020年3月4日

UniLMv2: Pseudo-Masked Language Models for Unified Language Model Pre-Training

Arxiv

15+阅读 · 2020年2月28日

Vision-based Robotic Grasping from Object Localization, Pose Estimation, Grasp Detection to Motion Planning: A Review

Vision-based Robotic Grasping from Object Localization, Pose Estimation, Grasp Detection to Motion Planning: A Review

Arxiv

6+阅读 · 2019年5月16日

iQIYI-VID: A Large Dataset for Multi-modal Person Identification

Arxiv

4+阅读 · 2018年11月19日

Improving Information Extraction from Images with Learned Semantic Models

Improving Information Extraction from Images with Learned Semantic Models

Arxiv

6+阅读 · 2018年8月27日

Camera Style Adaptation for Person Re-identification

Arxiv

3+阅读 · 2018年4月10日

Appearance-and-Relation Networks for Video Classification

Arxiv

3+阅读 · 2017年11月24日

VIP会员

相关主题

自监督学习

视频表征学习

相关VIP内容

【CVPR2021】用于行人重识别的无监督多源域自适应

专知会员服务

21+阅读 · 2021年5月1日

【CVPR2021】无监督时空表示学习的大规模研究

专知会员服务

23+阅读 · 2021年5月1日

【CVPR2021】针对场景图生成语义模糊性的概率性建模

专知会员服务

17+阅读 · 2021年4月27日

【CVPR2021】GAN人脸预训练模型

【CVPR2021】GAN人脸预训练模型

专知会员服务

24+阅读 · 2021年4月10日

【CVPR2021】基于端到端预训练的视觉-语言表征学习

【CVPR2021】基于端到端预训练的视觉-语言表征学习

专知会员服务

38+阅读 · 2021年4月9日

【CVPR2021】动态度量学习

【CVPR2021】动态度量学习

专知会员服务

40+阅读 · 2021年3月30日

CVPR2021-单目实时全身捕捉的方法

专知会员服务

20+阅读 · 2021年3月18日

【CVPR2021】半监督迁移学习的自适应一致性正则化

专知会员服务

33+阅读 · 2021年3月7日

【CVPR2021】自监督几何感知

【CVPR2021】自监督几何感知

专知会员服务

46+阅读 · 2021年3月6日

【AAAI2021】时间关系建模与自监督的动作分割

【AAAI2021】时间关系建模与自监督的动作分割

专知会员服务

37+阅读 · 2021年1月24日

热门VIP内容

开通专知VIP会员享更多权益服务

《乌克兰无人机产业：志愿者与政策在构建新兴无人机产业中的协同作用》最新报告

《人工智能辅助决策中的数据可视化：系统性综述》

人工智能驱动弹药制造现代化：美国陆军转型之路

《敏捷作战部署中枢纽-辐条基地选址优化研究》80页

相关资讯

【CVPR2021】半监督迁移学习的自适应一致性正则化

【CVPR2021】半监督迁移学习的自适应一致性正则化

专知

41+阅读 · 2021年3月7日

【CVPR2021】基于反事实推断的视觉问答框架

【CVPR2021】基于反事实推断的视觉问答框架

专知

38+阅读 · 2021年3月4日

【AAAI2021】自监督对应学习的对比转换

【AAAI2021】自监督对应学习的对比转换

专知

12+阅读 · 2020年12月11日

【CVPR2020-牛津-谷歌】语音到动作:动作识别的跨模态监督，Cross-modal Supervision

【CVPR2020-牛津-谷歌】语音到动作:动作识别的跨模态监督，Cross-modal Supervision

专知

10+阅读 · 2020年3月31日

NeurIPS 2019 | 一种对噪音标注鲁棒的基于信息论的损失函数

NeurIPS 2019 | 一种对噪音标注鲁棒的基于信息论的损失函数

机器之心

7+阅读 · 2019年11月21日

训练目标检测模型只需要这 6 行代码

训练目标检测模型只需要这 6 行代码

AI科技评论

8+阅读 · 2019年8月19日

论文浅尝 | 利用关系标签的主题语义知识为关系抽取提供监督 (IJCAI 2019)

论文浅尝 | 利用关系标签的主题语义知识为关系抽取提供监督 (IJCAI 2019)

开放知识图谱

16+阅读 · 2019年8月17日

【CVPR2019】弱监督图像分类建模

【CVPR2019】弱监督图像分类建模

深度学习大讲堂

38+阅读 · 2019年7月25日

【泡泡一分钟】将背景带入前景：在弱监督的视频语义分割中使所有类相等（ICCV2017-221）

【泡泡一分钟】将背景带入前景：在弱监督的视频语义分割中使所有类相等（ICCV2017-221）

泡泡机器人SLAM

4+阅读 · 2018年12月3日

结合弱监督信息的凸聚类

结合弱监督信息的凸聚类

计算机研究与发展

6+阅读 · 2017年8月30日

相关论文

Learning Position and Target Consistency for Memory-based Video Object Segmentation

Arxiv

3+阅读 · 2021年4月9日

Adaptive Consistency Regularization for Semi-Supervised Transfer Learning

Arxiv

23+阅读 · 2021年3月3日

Disentangled Information Bottleneck

Disentangled Information Bottleneck

Arxiv

12+阅读 · 2020年12月22日

Data Augmentation using Pre-trained Transformer Models

Arxiv

17+阅读 · 2020年3月4日

UniLMv2: Pseudo-Masked Language Models for Unified Language Model Pre-Training

Arxiv

15+阅读 · 2020年2月28日

Vision-based Robotic Grasping from Object Localization, Pose Estimation, Grasp Detection to Motion Planning: A Review

Vision-based Robotic Grasping from Object Localization, Pose Estimation, Grasp Detection to Motion Planning: A Review

Arxiv

6+阅读 · 2019年5月16日

iQIYI-VID: A Large Dataset for Multi-modal Person Identification

Arxiv

4+阅读 · 2018年11月19日

Improving Information Extraction from Images with Learned Semantic Models

Improving Information Extraction from Images with Learned Semantic Models

Arxiv

6+阅读 · 2018年8月27日

Camera Style Adaptation for Person Re-identification

Arxiv

3+阅读 · 2018年4月10日

Appearance-and-Relation Networks for Video Classification

Arxiv

3+阅读 · 2017年11月24日

微信扫码咨询专知VIP会员