Video Instance Segmentation (VIS) is a new and inherently multi-task problem, which aims to detect, segment and track each instance in a video sequence. Existing approaches are mainly based on single-frame features or single-scale features of multiple frames, where temporal information or multi-scale information is ignored. To incorporate both temporal and scale information, we propose a Temporal Pyramid Routing (TPR) strategy to conditionally align and conduct pixel-level aggregation from a feature pyramid pair of two adjacent frames. Specifically, TPR contains two novel components, including Dynamic Aligned Cell Routing (DACR) and Cross Pyramid Routing (CPR), where DACR is designed for aligning and gating pyramid features across temporal dimension, while CPR transfers temporally aggregated features across scale dimension. Moreover, our approach is a plug-and-play module and can be easily applied to existing instance segmentation methods. Extensive experiments on YouTube-VIS dataset demonstrate the effectiveness and efficiency of the proposed approach on several state-of-the-art instance segmentation methods. Codes and trained models will be publicly available to facilitate future research.(\url{https://github.com/lxtGH/TemporalPyramidRouting}).


翻译:视频分层(VIS)是一个新而内在的多任务问题,目的是在视频序列中检测、分段和跟踪每个实例。现有方法主要基于多个框架的单一框架特征或单一尺度特征,即时间信息或多尺度信息被忽略。为了纳入时间和规模信息,我们建议采用时空金字塔路流(TPR)战略,有条件地对齐并用两个相邻框架的特征金字塔对齐来进行像素级聚合。具体地说,TPR包含两个新颖的组成部分,包括动态统一细胞路程(DACR)和Cross Pyramid Rout(CPR),其中,DACR旨在将金字塔特征与时空维相协调并划钩,而CPR则将时间综合特征传遍各尺度。此外,我们的方法是一个插图-VIS数据集的广泛实验,展示了若干州-艺术区段分割法的拟议方法的实效和效率。代码和经过培训的模型将公开用于便利未来研究。({urgrgal/rgrgrg)/tromaxmus/tal/trgusing。

0
下载
关闭预览

相关内容

Pyramid is a small, fast, down-to-earth Python web application development framework.
专知会员服务
109+阅读 · 2020年3月12日
抢鲜看!13篇CVPR2020论文链接/开源代码/解读
专知会员服务
49+阅读 · 2020年2月26日
近期必读的7篇 CVPR 2019【视觉问答】相关论文和代码
专知会员服务
35+阅读 · 2020年1月10日
视频目标识别资源集合
专知
25+阅读 · 2019年6月15日
Hierarchically Structured Meta-learning
CreateAMind
26+阅读 · 2019年5月22日
简评 | Video Action Recognition 的近期进展
极市平台
20+阅读 · 2019年4月21日
Unsupervised Learning via Meta-Learning
CreateAMind
42+阅读 · 2019年1月3日
《pyramid Attention Network for Semantic Segmentation》
统计学习与视觉计算组
44+阅读 · 2018年8月30日
(TensorFlow)实时语义分割比较研究
机器学习研究会
9+阅读 · 2018年3月12日
ActivityNet Challenge 2017 冠军方案分享
极市平台
4+阅读 · 2017年7月25日
VIP会员
Top
微信扫码咨询专知VIP会员