【CVPR 2022】基于Tracklet查询和建议的高效视频实例分割，Efficient Video Instance Segmentation via Tracklet Query and Proposal - 专知VIP

会员服务 ·

0

CVPR 2022 · 计算机视觉 · 论文 · 视频 ·

2022 年 3 月 3 日

【CVPR 2022】基于Tracklet查询和建议的高效视频实例分割，Efficient Video Instance Segmentation via Tracklet Query and Proposal

专知会员服务

专知，提供专业可信的知识分发服务，让认知协作更快更好！

【基于Tracklet查询和建议的高效视频实例分割】Efficient Video Instance Segmentation via Tracklet Query and Proposal
● 论文摘要：视频实例分割(Video Instance Segmentation, VIS)旨在同时对视频中的多个对象实例进行分类、分割和跟踪。本文提出了一个具有高效训练和推理的全端到端框架EfficientVIS。其核心是tracklet查询和tracklet提议，通过迭代的查询-视频交互将感兴趣区域跨时空关联和分割。我们进一步提出了一种函授学习方法，使片段之间的轨迹链接端到端可学习。与VisTR相比，EfficientVIS在YouTubeVIS基准上实现最先进的精度时，需要更少的15倍的训练时间。同时，我们的方法使整个视频实例分割在一个端到端传递，而不需要任何数据关联。
● 论文主页：https://jialianwu.com/projects/EfficientVIS.html
● 论文视频：https://youtu.be/sSPMzgtMKCE
● 作者单位：纽约州立大学布法罗分校、Amazon

成为VIP会员查看完整内容

16

相关内容

CVPR 2022

CVPR 2022 将于2022年 6 月 21-24 日在美国的新奥尔良举行。CVPR是IEEE Conference on Computer Vision and Pattern Recognition的缩写，即IEEE国际计算机视觉与模式识别会议。该会议是由IEEE举办的计算机视觉和模式识别领域的顶级会议，会议的主要内容是计算机视觉与模式识别技术。

知识荟萃

精品入门和进阶教程、论文和代码整理等

更多

查看相关VIP内容、论文、资讯等

【CVPR 2022】【视频检索用多模态融合Transformer】Everything at Once -- Multi-modal Fusion Transformer for Video Retrieval

【CVPR 2022】【视频检索用多模态融合Transformer】Everything at Once -- Multi-modal Fusion Transformer for Video Retrieval

专知会员服务

29+阅读 · 2022年3月6日

【CVPR 2022】使用多模态Transformer的端到端视频对象分割，End-to-End Referring Video Object Segmentation with Multimodal Transformer

【CVPR 2022】使用多模态Transformer的端到端视频对象分割，End-to-End Referring Video Object Segmentation with Multimodal Transformer

专知会员服务

28+阅读 · 2022年3月3日

【ICCV2021】用于目标检测和实例分割的新损失函数

专知会员服务

22+阅读 · 2021年7月28日

【CVPR2021】基于Transformer的视频分割领域

【CVPR2021】基于Transformer的视频分割领域

专知会员服务

38+阅读 · 2021年4月16日

近期必读的5篇顶会CVPR 2021【视觉目标跟踪】相关论文和代码

专知会员服务

37+阅读 · 2021年3月23日

【Google】多模态Transformer视频检索，Multi-modal Transformer

【Google】多模态Transformer视频检索，Multi-modal Transformer

专知会员服务

103+阅读 · 2020年7月22日

【视频目标检测与跟踪：综述论文】Video Object Segmentation and Tracking: A Survey

专知会员服务

66+阅读 · 2020年6月4日

【CVPR2020】实例感知、上下文聚焦和内存有效的弱监督目标检测，Instance-aware, Context-focused, and Memory-efficient Weakly Supervised Object Detection

【CVPR2020】实例感知、上下文聚焦和内存有效的弱监督目标检测，Instance-aware, Context-focused, and Memory-efficient Weakly Supervised Object Detection

专知会员服务

34+阅读 · 2020年4月11日

CVPR 2020 论文开源项目合集

专知会员服务

110+阅读 · 2020年3月12日

近期必读的9篇 CVPR 2019【视觉目标跟踪】相关论文和代码

近期必读的9篇 CVPR 2019【视觉目标跟踪】相关论文和代码

专知会员服务

33+阅读 · 2020年1月10日

CVPR 2022 | 刷新4个SOTA！港大&字节开源ReferFormer: 语言作为查询的参考视频目标分割框架

CVPR 2022 | 刷新4个SOTA！港大&字节开源ReferFormer: 语言作为查询的参考视频目标分割框架

CVer

1+阅读 · 2022年3月28日

CVPR 2022 | Transformer再屠榜！南大提出MixFormer：端到端目标跟踪新网络

CVPR 2022 | Transformer再屠榜！南大提出MixFormer：端到端目标跟踪新网络

CVer

1+阅读 · 2022年3月23日

CVPR 2022 | 多模态Transformer用于视频分割效果惊艳！MTTR：单GPU上速度高达76 FPS！

CVPR 2022 | 多模态Transformer用于视频分割效果惊艳！MTTR：单GPU上速度高达76 FPS！

CVer

0+阅读 · 2022年3月11日

打打字就能指挥算法视频抠图，Transformer掌握跨模态新技能，精度优于现有模型丨CVPR 2022

打打字就能指挥算法视频抠图，Transformer掌握跨模态新技能，精度优于现有模型丨CVPR 2022

量子位

0+阅读 · 2022年3月7日

VALSE 论文速览第43期：AOT for Video Object Segmentation

VALSE 论文速览第43期：AOT for Video Object Segmentation

VALSE

0+阅读 · 2022年1月22日

屠榜多目标跟踪！华科&港大提出ByteTrack：基于数据关联方法BYTE的跟踪器

屠榜多目标跟踪！华科&港大提出ByteTrack：基于数据关联方法BYTE的跟踪器

极市平台

0+阅读 · 2021年10月17日

【CVPR2021】基于Transformer的视频分割领域

【CVPR2021】基于Transformer的视频分割领域

专知

2+阅读 · 2021年4月16日

近期必读的5篇顶会CVPR 2021【视觉目标跟踪】相关论文和代码

近期必读的5篇顶会CVPR 2021【视觉目标跟踪】相关论文和代码

专知

4+阅读 · 2021年3月23日

一文看尽9篇CVPR 2020目标跟踪论文开源项目！Siam R-CNN/AutoTrack/MAST等

一文看尽9篇CVPR 2020目标跟踪论文开源项目！Siam R-CNN/AutoTrack/MAST等

CVer

22+阅读 · 2020年5月10日

【泡泡图灵智库】DenseFusion:基于迭代密集融合的6D目标姿态估计

【泡泡图灵智库】DenseFusion:基于迭代密集融合的6D目标姿态估计

泡泡机器人SLAM

16+阅读 · 2019年9月3日

量质融合的移动轨迹相似性查询技术研究

国家自然科学基金

0+阅读 · 2015年12月31日

基于多源视频的大范围场景目标跟踪

国家自然科学基金

2+阅读 · 2015年12月31日

基于无视觉码本框架的大规模图像检索研究

国家自然科学基金

0+阅读 · 2014年12月31日

不确定性信号测试的模拟电子系统任意故障定位与定值方法研究

国家自然科学基金

0+阅读 · 2013年12月31日

无线传感器网络移动目标的支持向量机建模定位理论

国家自然科学基金

1+阅读 · 2011年12月31日

智能摄像机传感网络分布式数据关联方法研究

国家自然科学基金

0+阅读 · 2011年12月31日

复杂环境下的目标检测识别与跟踪若干关键问题研究

国家自然科学基金

7+阅读 · 2011年12月31日

传感器网络下分布式多目标跟踪方法研究

国家自然科学基金

1+阅读 · 2009年12月31日

融合显式和隐含语义概念的视频检索技术研究

国家自然科学基金

0+阅读 · 2008年12月31日

无线传感器网络定位技术研究

国家自然科学基金

3+阅读 · 2008年12月31日

Less than Few: Self-Shot Video Instance Segmentation

Arxiv

0+阅读 · 2022年4月19日

M$^2$BEV: Multi-Camera Joint 3D Detection and Segmentation with Unified Birds-Eye View Representation

Arxiv

0+阅读 · 2022年4月19日

Temporally Efficient Vision Transformer for Video Instance Segmentation

Arxiv

0+阅读 · 2022年4月18日

Deep Instance Segmentation with Automotive Radar Detection Points

Arxiv

0+阅读 · 2022年4月18日

An Extendable, Efficient and Effective Transformer-based Object Detector

Arxiv

0+阅读 · 2022年4月17日

FasterVideo: Efficient Online Joint Object Detection And Tracking

FasterVideo: Efficient Online Joint Object Detection And Tracking

Arxiv

0+阅读 · 2022年4月15日

Efficient Transformers: A Survey

Arxiv

35+阅读 · 2022年3月14日

K-Net: Towards Unified Image Segmentation

Arxiv

12+阅读 · 2021年11月1日

Transformer Tracking

Arxiv

17+阅读 · 2021年3月29日

Contrastive Transformation for Self-supervised Correspondence Learning

Contrastive Transformation for Self-supervised Correspondence Learning

Arxiv

13+阅读 · 2020年12月9日

VIP会员

相关主题

计算机视觉

相关VIP内容

【CVPR 2022】【视频检索用多模态融合Transformer】Everything at Once -- Multi-modal Fusion Transformer for Video Retrieval

【CVPR 2022】【视频检索用多模态融合Transformer】Everything at Once -- Multi-modal Fusion Transformer for Video Retrieval

专知会员服务

29+阅读 · 2022年3月6日

【CVPR 2022】使用多模态Transformer的端到端视频对象分割，End-to-End Referring Video Object Segmentation with Multimodal Transformer

【CVPR 2022】使用多模态Transformer的端到端视频对象分割，End-to-End Referring Video Object Segmentation with Multimodal Transformer

专知会员服务

28+阅读 · 2022年3月3日

【ICCV2021】用于目标检测和实例分割的新损失函数

专知会员服务

22+阅读 · 2021年7月28日

【CVPR2021】基于Transformer的视频分割领域

【CVPR2021】基于Transformer的视频分割领域

专知会员服务

38+阅读 · 2021年4月16日

近期必读的5篇顶会CVPR 2021【视觉目标跟踪】相关论文和代码

专知会员服务

37+阅读 · 2021年3月23日

【Google】多模态Transformer视频检索，Multi-modal Transformer

【Google】多模态Transformer视频检索，Multi-modal Transformer

专知会员服务

103+阅读 · 2020年7月22日

【视频目标检测与跟踪：综述论文】Video Object Segmentation and Tracking: A Survey

专知会员服务

66+阅读 · 2020年6月4日

【CVPR2020】实例感知、上下文聚焦和内存有效的弱监督目标检测，Instance-aware, Context-focused, and Memory-efficient Weakly Supervised Object Detection

【CVPR2020】实例感知、上下文聚焦和内存有效的弱监督目标检测，Instance-aware, Context-focused, and Memory-efficient Weakly Supervised Object Detection

专知会员服务

34+阅读 · 2020年4月11日

CVPR 2020 论文开源项目合集

专知会员服务

110+阅读 · 2020年3月12日

近期必读的9篇 CVPR 2019【视觉目标跟踪】相关论文和代码

近期必读的9篇 CVPR 2019【视觉目标跟踪】相关论文和代码

专知会员服务

33+阅读 · 2020年1月10日

热门VIP内容

开通专知VIP会员享更多权益服务

《城市滨海地区：理解复杂多变环境下的指挥控制框架》50页报告

《理解城市战及其在俄乌战争中的表现》报告

美空军“顶点2025”实验：推进AI在C2、动态目标锁定与联盟集成中的应用

《建设式兵棋模拟作为战术集群配置优化的关键组成部分》

相关资讯

CVPR 2022 | 刷新4个SOTA！港大&字节开源ReferFormer: 语言作为查询的参考视频目标分割框架

CVPR 2022 | 刷新4个SOTA！港大&字节开源ReferFormer: 语言作为查询的参考视频目标分割框架

CVer

1+阅读 · 2022年3月28日

CVPR 2022 | Transformer再屠榜！南大提出MixFormer：端到端目标跟踪新网络

CVPR 2022 | Transformer再屠榜！南大提出MixFormer：端到端目标跟踪新网络

CVer

1+阅读 · 2022年3月23日

CVPR 2022 | 多模态Transformer用于视频分割效果惊艳！MTTR：单GPU上速度高达76 FPS！

CVPR 2022 | 多模态Transformer用于视频分割效果惊艳！MTTR：单GPU上速度高达76 FPS！

CVer

0+阅读 · 2022年3月11日

打打字就能指挥算法视频抠图，Transformer掌握跨模态新技能，精度优于现有模型丨CVPR 2022

打打字就能指挥算法视频抠图，Transformer掌握跨模态新技能，精度优于现有模型丨CVPR 2022

量子位

0+阅读 · 2022年3月7日

VALSE 论文速览第43期：AOT for Video Object Segmentation

VALSE 论文速览第43期：AOT for Video Object Segmentation

VALSE

0+阅读 · 2022年1月22日

屠榜多目标跟踪！华科&港大提出ByteTrack：基于数据关联方法BYTE的跟踪器

屠榜多目标跟踪！华科&港大提出ByteTrack：基于数据关联方法BYTE的跟踪器

极市平台

0+阅读 · 2021年10月17日

【CVPR2021】基于Transformer的视频分割领域

【CVPR2021】基于Transformer的视频分割领域

专知

2+阅读 · 2021年4月16日

近期必读的5篇顶会CVPR 2021【视觉目标跟踪】相关论文和代码

近期必读的5篇顶会CVPR 2021【视觉目标跟踪】相关论文和代码

专知

4+阅读 · 2021年3月23日

一文看尽9篇CVPR 2020目标跟踪论文开源项目！Siam R-CNN/AutoTrack/MAST等

一文看尽9篇CVPR 2020目标跟踪论文开源项目！Siam R-CNN/AutoTrack/MAST等

CVer

22+阅读 · 2020年5月10日

【泡泡图灵智库】DenseFusion:基于迭代密集融合的6D目标姿态估计

【泡泡图灵智库】DenseFusion:基于迭代密集融合的6D目标姿态估计

泡泡机器人SLAM

16+阅读 · 2019年9月3日

相关基金

量质融合的移动轨迹相似性查询技术研究

国家自然科学基金

0+阅读 · 2015年12月31日

基于多源视频的大范围场景目标跟踪

国家自然科学基金

2+阅读 · 2015年12月31日

基于无视觉码本框架的大规模图像检索研究

国家自然科学基金

0+阅读 · 2014年12月31日

不确定性信号测试的模拟电子系统任意故障定位与定值方法研究

国家自然科学基金

0+阅读 · 2013年12月31日

无线传感器网络移动目标的支持向量机建模定位理论

国家自然科学基金

1+阅读 · 2011年12月31日

智能摄像机传感网络分布式数据关联方法研究

国家自然科学基金

0+阅读 · 2011年12月31日

复杂环境下的目标检测识别与跟踪若干关键问题研究

国家自然科学基金

7+阅读 · 2011年12月31日

传感器网络下分布式多目标跟踪方法研究

国家自然科学基金

1+阅读 · 2009年12月31日

融合显式和隐含语义概念的视频检索技术研究

国家自然科学基金

0+阅读 · 2008年12月31日

无线传感器网络定位技术研究

国家自然科学基金

3+阅读 · 2008年12月31日

相关论文

Less than Few: Self-Shot Video Instance Segmentation

Arxiv

0+阅读 · 2022年4月19日

M$^2$BEV: Multi-Camera Joint 3D Detection and Segmentation with Unified Birds-Eye View Representation

Arxiv

0+阅读 · 2022年4月19日

Temporally Efficient Vision Transformer for Video Instance Segmentation

Arxiv

0+阅读 · 2022年4月18日

Deep Instance Segmentation with Automotive Radar Detection Points

Arxiv

0+阅读 · 2022年4月18日

An Extendable, Efficient and Effective Transformer-based Object Detector

Arxiv

0+阅读 · 2022年4月17日

FasterVideo: Efficient Online Joint Object Detection And Tracking

FasterVideo: Efficient Online Joint Object Detection And Tracking

Arxiv

0+阅读 · 2022年4月15日

Efficient Transformers: A Survey

Arxiv

35+阅读 · 2022年3月14日

K-Net: Towards Unified Image Segmentation

Arxiv

12+阅读 · 2021年11月1日

Transformer Tracking

Arxiv

17+阅读 · 2021年3月29日

Contrastive Transformation for Self-supervised Correspondence Learning

Contrastive Transformation for Self-supervised Correspondence Learning

Arxiv

13+阅读 · 2020年12月9日

微信扫码咨询专知VIP会员