【CVPR2021】基于Transformer的视频分割领域 - 专知VIP

会员服务 ·

4

Transformer · 视频分割 · CVPR 2021 ·

2021 年 4 月 16 日

【CVPR2021】基于Transformer的视频分割领域

专知会员服务

专知，提供专业可信的知识分发服务，让认知协作更快更好！

本文是第一个将Transformers应用于视频分割领域的方法。视频实例分割指的是同时对视频中感兴趣的物体进行分类，分割和跟踪的任务。现有的方法通常设计复杂的流程来解决此问题。本文提出了一种基于Transformers的视频实例分割新框架VisTR，该框架将视频实例分割任务视为直接端到端的并行序列解码和预测的问题。给定一个含有多帧图像的视频作为输入，VisTR直接按顺序输出视频中每个实例的掩码序列。该方法的核心是一种新的实例序列匹配和分割的策略，该策略在整个序列级别上对实例进行监督和分割。VisTR将实例分割和跟踪统一到了相似度学习的框架下，从而大大简化了流程。在没有任何trick的情况下，VisTR在所有使用单一模型的方法中获得了最佳效果，并且在YouTube-VIS数据集上实现了最快的速度。

https://www.zhuanzhi.ai/paper/0dfba6abdc5e6a189d86770822c17859

成为VIP会员查看完整内容

38

相关内容

Transformer

Transformer是谷歌发表的论文《Attention Is All You Need》提出一种完全基于Attention的翻译架构

知识荟萃

精品入门和进阶教程、论文和代码整理等

更多

查看相关VIP内容、论文、资讯等

【CVPR2021】密集对比学习的自监督视觉预训练

专知会员服务

39+阅读 · 2021年5月16日

【CVPR2021】基于端到端预训练的视觉-语言表征学习

【CVPR2021】基于端到端预训练的视觉-语言表征学习

专知会员服务

38+阅读 · 2021年4月9日

【CVPR2021】Transformer遇见跟踪器：利用时间上下文进行视觉追踪

【CVPR2021】Transformer遇见跟踪器：利用时间上下文进行视觉追踪

专知会员服务

17+阅读 · 2021年3月24日

【CVPR2021】自监督几何感知

【CVPR2021】自监督几何感知

专知会员服务

46+阅读 · 2021年3月6日

【CVPR2021】用Transformers无监督预训练进行目标检测

【CVPR2021】用Transformers无监督预训练进行目标检测

专知会员服务

58+阅读 · 2021年3月3日

【CVPR2021】细粒度多标签分类

【CVPR2021】细粒度多标签分类

专知

44+阅读 · 2021年3月8日

【CVPR2021】半监督迁移学习的自适应一致性正则化

【CVPR2021】半监督迁移学习的自适应一致性正则化

专知

41+阅读 · 2021年3月7日

Reformer：一个高效的 Transformer

Reformer：一个高效的 Transformer

TensorFlow

9+阅读 · 2020年2月13日

图像分割概述 & ENet 实例

图像分割概述 & ENet 实例

AI研习社

14+阅读 · 2019年2月19日

入门 | 一文概览视频目标分割

入门 | 一文概览视频目标分割

机器之心

10+阅读 · 2017年10月6日

Scaling Vision Transformers

Arxiv

0+阅读 · 2021年6月8日

Arxiv

0+阅读 · 2021年6月7日

Glance-and-Gaze Vision Transformer

Arxiv

0+阅读 · 2021年6月4日

Transformer Tracking

Arxiv

17+阅读 · 2021年3月29日

Colorization Transformer

Arxiv

9+阅读 · 2021年2月8日

VIP会员

相关主题

相关VIP内容

【CVPR2021】密集对比学习的自监督视觉预训练

专知会员服务

39+阅读 · 2021年5月16日

【CVPR2021】基于端到端预训练的视觉-语言表征学习

【CVPR2021】基于端到端预训练的视觉-语言表征学习

专知会员服务

38+阅读 · 2021年4月9日

【CVPR2021】Transformer遇见跟踪器：利用时间上下文进行视觉追踪

【CVPR2021】Transformer遇见跟踪器：利用时间上下文进行视觉追踪

专知会员服务

17+阅读 · 2021年3月24日

【CVPR2021】自监督几何感知

【CVPR2021】自监督几何感知

专知会员服务

46+阅读 · 2021年3月6日

【CVPR2021】用Transformers无监督预训练进行目标检测

【CVPR2021】用Transformers无监督预训练进行目标检测

专知会员服务

58+阅读 · 2021年3月3日

热门VIP内容

开通专知VIP会员享更多权益服务

生成式人工智能导论：可靠性、负责任开发及实际应用（第二版）

《2025财年美陆军转型倡议（ATI）部队结构与组织提案》

【CMU博士论文】分布偏移下的可信机器学习

智能体 EDA 的曙光：自主数字芯片设计综述

相关资讯

【CVPR2021】细粒度多标签分类

【CVPR2021】细粒度多标签分类

专知

44+阅读 · 2021年3月8日

【CVPR2021】半监督迁移学习的自适应一致性正则化

【CVPR2021】半监督迁移学习的自适应一致性正则化

专知

41+阅读 · 2021年3月7日

Reformer：一个高效的 Transformer

Reformer：一个高效的 Transformer

TensorFlow

9+阅读 · 2020年2月13日

图像分割概述 & ENet 实例

图像分割概述 & ENet 实例

AI研习社

14+阅读 · 2019年2月19日

入门 | 一文概览视频目标分割

入门 | 一文概览视频目标分割

机器之心

10+阅读 · 2017年10月6日

相关论文

Scaling Vision Transformers

Arxiv

0+阅读 · 2021年6月8日

Arxiv

0+阅读 · 2021年6月7日

Glance-and-Gaze Vision Transformer

Arxiv

0+阅读 · 2021年6月4日

Transformer Tracking

Arxiv

17+阅读 · 2021年3月29日

Colorization Transformer

Arxiv

9+阅读 · 2021年2月8日

微信扫码咨询专知VIP会员