【CVPR 2021】半监督视频目标分割新算法，实现SOTA性能 - 专知

会员服务 ·

0

【CVPR 2021】半监督视频目标分割新算法，实现SOTA性能

2021 年 4 月 26 日 专知

编辑、内容生产、自动驾驶等领域。其中，半监督视频目标分割，是指给定一段视频和第一帧的目标物体，在视频的所有剩余帧中分割出该物体。在一个视频序列中，目标物体往往会因为连续运动和视角变化发生很大的外观改变，包括形变和遮挡。同时视频中往往会有和目标相似的其他物体存在，使得分辨目标更加困难。因此，视频目标分割是一个比较有挑战性的问题，至今还没有很好的解决。

从最近的研究成果来看，Memory-based 的方法是目前 VOS 领域性能表现最佳的一类方法，其代表作是 STM。STM 提出利用过往所有历史帧的信息，对于当前待分割的帧，STM 会将其与所有历史帧在时空域上做一个匹配学习，从而将当前帧的特征和历史帧的特征关联起来，得到了远超之前方法的效果。然而 STM 的分割结果中仍然有很多不足。如下图所示，可以观察到有两个典型的错误现象：

左边一列图中，STM 会倾向于把和目标物体同类别的其他物体也分割出来。右边一列图中，STM 的分割结果中会出现一些错误的碎块。这些错误样本都有一个共同特点，就是其局部像素块的外观特征和待分割目标局部区域的外观特征极为相似。这些 badcase 的现象和 STM 本身的原理是有关联的，因为类似 STM 的 Memory-based 方法，在帧间关系建模上，是均等地在时间和空间域上做了一个特征像素级别的匹配，倾向于找出当前帧和所有历史帧标记 mask 区域的特征相似区域，因此会产生上述 badcase。

为了进一步提升 Memory-based 的 VOS 方法，该研究提出从两个方面去改进：

一、位置一致性。目标物体在视频帧间的运动是遵循一定轨迹的，如果在某一帧的一些位置出现和目标物体相似的同类物体，如果其位置不合理，那么该物体是目标物体的可能性就会降低，不应该被分割。
二、目标一致性。视频目标分割本质上也可以理解为是一个像素级别的物体跟踪。虽然分割是像素级的任务，但 VOS 的处理对象是物体(object)，需要有一个类似图像实例分割中对于物体级别的约束。显然那些错误的碎块分割结果是不满足一个目标物体整体的概念的。

https://www.zhuanzhi.ai/paper/06cfa6f43b8269ce8f4a96da1bd3426d

专知便捷查看

便捷下载，请关注专知公众号（点击上方蓝色专知关注）

后台回复“LCM” 就可以获取《【CVPR 2021】半监督视频目标分割新算法，实现SOTA性能》专知下载链接

专知，专业可信的人工智能知识分发 ，让认知协作更快更好！欢迎注册登录专知www.zhuanzhi.ai，获取5000+AI主题干货知识资料！

欢迎微信扫一扫加入专知人工智能知识星球群，获取最新AI专业干货知识教程资料和与专家交流咨询！

点击“ 阅读原文 ”，了解使用专知 ，查看获取5000+AI主题知识资源

登录查看更多

0

相关内容

视频目标分割

视频目标分割

【CVPR 2021】半监督视频目标分割新算法，实现SOTA性能

【CVPR 2021】半监督视频目标分割新算法，实现SOTA性能

专知会员服务

13+阅读 · 2021年4月26日

CVPR 2021｜无需干净图像的自监督图像降噪

专知会员服务

39+阅读 · 2021年3月29日

CVPR2021-单目实时全身捕捉的方法

专知会员服务

20+阅读 · 2021年3月18日

【CVPR2021】背景鲁棒的自监督视频表征学习

【CVPR2021】背景鲁棒的自监督视频表征学习

专知会员服务

17+阅读 · 2021年3月13日

视觉目标跟踪十年研究进展

视觉目标跟踪十年研究进展

专知会员服务

88+阅读 · 2021年3月10日

【AAAI2021】基于双任务一致性的半监督医学图像分割

专知会员服务

45+阅读 · 2021年1月31日

【AAAI2021】时间关系建模与自监督的动作分割

【AAAI2021】时间关系建模与自监督的动作分割

专知会员服务

37+阅读 · 2021年1月24日

【ACM Multimedia 2020】双时间存储网络有效的视频对象分割

【ACM Multimedia 2020】双时间存储网络有效的视频对象分割

专知会员服务

10+阅读 · 2020年8月13日

【IJCV2020】通过迭代亲密学习实现弱监督语义分割

专知会员服务

42+阅读 · 2020年2月20日

近期必读的9篇 CVPR 2019【视觉目标跟踪】相关论文和代码

近期必读的9篇 CVPR 2019【视觉目标跟踪】相关论文和代码

专知会员服务

33+阅读 · 2020年1月10日

【AAAI2021】自监督对应学习的对比转换

【AAAI2021】自监督对应学习的对比转换

专知

12+阅读 · 2020年12月11日

基于深度学习的医学图像半监督分割

基于深度学习的医学图像半监督分割

CVer

14+阅读 · 2020年9月24日

竞赛推荐 | DAVIS Challenge：视频目标分割挑战赛（CVPR2019）

竞赛推荐 | DAVIS Challenge：视频目标分割挑战赛（CVPR2019）

极市平台

11+阅读 · 2019年5月5日

近期必读的9篇 CVPR 2019【视觉目标跟踪】相关论文和代码

近期必读的9篇 CVPR 2019【视觉目标跟踪】相关论文和代码

专知

78+阅读 · 2019年4月16日

目标跟踪算法分类

目标跟踪算法分类

算法与数据结构

20+阅读 · 2018年9月28日

通过视频着色进行自监督跟踪

通过视频着色进行自监督跟踪

谷歌开发者

3+阅读 · 2018年7月11日

干货！一文读懂行人检测算法

干货！一文读懂行人检测算法

全球人工智能

11+阅读 · 2018年5月31日

CVPR 2018 | 伯克利等提出无监督特征学习新方法，代码已开源

CVPR 2018 | 伯克利等提出无监督特征学习新方法，代码已开源

AI前线

12+阅读 · 2018年5月13日

【ICCV 目标跟踪性能最优】首个应用残差学习的深度目标跟踪算法

【ICCV 目标跟踪性能最优】首个应用残差学习的深度目标跟踪算法

新智元

35+阅读 · 2017年9月10日

目标跟踪的一篇论文及代码视频

目标跟踪的一篇论文及代码视频

CreateAMind

8+阅读 · 2017年9月7日

FusionPainting: Multimodal Fusion with Adaptive Attention for 3D Object Detection

FusionPainting: Multimodal Fusion with Adaptive Attention for 3D Object Detection

Arxiv

0+阅读 · 2021年6月23日

Simple Copy-Paste is a Strong Data Augmentation Method for Instance Segmentation

Arxiv

0+阅读 · 2021年6月23日

Unsupervised Embedding Adaptation via Early-Stage Feature Reconstruction for Few-Shot Classification

Arxiv

0+阅读 · 2021年6月22日

Supervised Momentum Contrastive Learning for Few-Shot Classification

Arxiv

0+阅读 · 2021年6月21日

Bipartite Graph Embedding via Mutual Information Maximization

Bipartite Graph Embedding via Mutual Information Maximization

Arxiv

9+阅读 · 2020年12月10日

Multi-view Knowledge Graph Embedding for Entity Alignment

Arxiv

36+阅读 · 2019年6月6日

iQIYI-VID: A Large Dataset for Multi-modal Person Identification

Arxiv

4+阅读 · 2018年11月19日

Visual Object Tracking: The Initialisation Problem

Arxiv

9+阅读 · 2018年5月22日

MaskRNN: Instance Level Video Object Segmentation

Arxiv

6+阅读 · 2018年3月29日

Tracking Noisy Targets: A Review of Recent Object Tracking Approaches

Arxiv

9+阅读 · 2018年2月14日

VIP会员

相关主题

视频目标分割

相关VIP内容

【CVPR 2021】半监督视频目标分割新算法，实现SOTA性能

【CVPR 2021】半监督视频目标分割新算法，实现SOTA性能

专知会员服务

13+阅读 · 2021年4月26日

CVPR 2021｜无需干净图像的自监督图像降噪

专知会员服务

39+阅读 · 2021年3月29日

CVPR2021-单目实时全身捕捉的方法

专知会员服务

20+阅读 · 2021年3月18日

【CVPR2021】背景鲁棒的自监督视频表征学习

【CVPR2021】背景鲁棒的自监督视频表征学习

专知会员服务

17+阅读 · 2021年3月13日

视觉目标跟踪十年研究进展

视觉目标跟踪十年研究进展

专知会员服务

88+阅读 · 2021年3月10日

【AAAI2021】基于双任务一致性的半监督医学图像分割

专知会员服务

45+阅读 · 2021年1月31日

【AAAI2021】时间关系建模与自监督的动作分割

【AAAI2021】时间关系建模与自监督的动作分割

专知会员服务

37+阅读 · 2021年1月24日

【ACM Multimedia 2020】双时间存储网络有效的视频对象分割

【ACM Multimedia 2020】双时间存储网络有效的视频对象分割

专知会员服务

10+阅读 · 2020年8月13日

【IJCV2020】通过迭代亲密学习实现弱监督语义分割

专知会员服务

42+阅读 · 2020年2月20日

近期必读的9篇 CVPR 2019【视觉目标跟踪】相关论文和代码

近期必读的9篇 CVPR 2019【视觉目标跟踪】相关论文和代码

专知会员服务

33+阅读 · 2020年1月10日

热门VIP内容

开通专知VIP会员享更多权益服务

《俄乌战争中的无人系统：新的战争方式与新兴趋势——来自前线的印象》报告

《海上自主水面船舶远程操作中心：安全可持续运行的多维度分析》

多模态大语言模型下游调优中“保持自我”的重要性

隐身自主无人水下航行器技术如何变革水下作战并重塑海军竞争

相关资讯

【AAAI2021】自监督对应学习的对比转换

【AAAI2021】自监督对应学习的对比转换

专知

12+阅读 · 2020年12月11日

基于深度学习的医学图像半监督分割

基于深度学习的医学图像半监督分割

CVer

14+阅读 · 2020年9月24日

竞赛推荐 | DAVIS Challenge：视频目标分割挑战赛（CVPR2019）

竞赛推荐 | DAVIS Challenge：视频目标分割挑战赛（CVPR2019）

极市平台

11+阅读 · 2019年5月5日

近期必读的9篇 CVPR 2019【视觉目标跟踪】相关论文和代码

近期必读的9篇 CVPR 2019【视觉目标跟踪】相关论文和代码

专知

78+阅读 · 2019年4月16日

目标跟踪算法分类

目标跟踪算法分类

算法与数据结构

20+阅读 · 2018年9月28日

通过视频着色进行自监督跟踪

通过视频着色进行自监督跟踪

谷歌开发者

3+阅读 · 2018年7月11日

干货！一文读懂行人检测算法

干货！一文读懂行人检测算法

全球人工智能

11+阅读 · 2018年5月31日

CVPR 2018 | 伯克利等提出无监督特征学习新方法，代码已开源

CVPR 2018 | 伯克利等提出无监督特征学习新方法，代码已开源

AI前线

12+阅读 · 2018年5月13日

【ICCV 目标跟踪性能最优】首个应用残差学习的深度目标跟踪算法

【ICCV 目标跟踪性能最优】首个应用残差学习的深度目标跟踪算法

新智元

35+阅读 · 2017年9月10日

目标跟踪的一篇论文及代码视频

目标跟踪的一篇论文及代码视频

CreateAMind

8+阅读 · 2017年9月7日

相关论文

FusionPainting: Multimodal Fusion with Adaptive Attention for 3D Object Detection

FusionPainting: Multimodal Fusion with Adaptive Attention for 3D Object Detection

Arxiv

0+阅读 · 2021年6月23日

Simple Copy-Paste is a Strong Data Augmentation Method for Instance Segmentation

Arxiv

0+阅读 · 2021年6月23日

Unsupervised Embedding Adaptation via Early-Stage Feature Reconstruction for Few-Shot Classification

Arxiv

0+阅读 · 2021年6月22日

Supervised Momentum Contrastive Learning for Few-Shot Classification

Arxiv

0+阅读 · 2021年6月21日

Bipartite Graph Embedding via Mutual Information Maximization

Bipartite Graph Embedding via Mutual Information Maximization

Arxiv

9+阅读 · 2020年12月10日

Multi-view Knowledge Graph Embedding for Entity Alignment

Arxiv

36+阅读 · 2019年6月6日

iQIYI-VID: A Large Dataset for Multi-modal Person Identification

Arxiv

4+阅读 · 2018年11月19日

Visual Object Tracking: The Initialisation Problem

Arxiv

9+阅读 · 2018年5月22日

MaskRNN: Instance Level Video Object Segmentation

Arxiv

6+阅读 · 2018年3月29日

Tracking Noisy Targets: A Review of Recent Object Tracking Approaches

Arxiv

9+阅读 · 2018年2月14日

大家都在搜

大型语言模型

蓝牙安全攻防

朱克爱德华兹家族

【论文笔记】用于数据驱动交通预测的扩散卷积循环神经网络（DCRNN）

微信扫码咨询专知VIP会员