【AAAI2022】基于交互式transformer和暹罗网络的视频目标分割 - 专知VIP

会员服务 ·

4

AAAI 2022 · Transformer · 视频目标分割 · 论文 ·

2022 年 2 月 6 日

【AAAI2022】基于交互式transformer和暹罗网络的视频目标分割

专知会员服务

专知，提供专业可信的知识分发服务，让认知协作更快更好！

论文题目：Siamese Network with Interactive Transformer for Video Object Segmentation

作者：Meng Lan, Jing Zhang, Fengxiang He, Lefei Zhang

指导教师：张乐飞教授

论文概述：在半监督视频目标分割中如何高效的学习和利用过去帧中目标的时空特征对于当前帧目标的分割至关重要。本文提出了一个新颖的基于交互式transformer和暹罗网络的视频目标分割框架SITVOS，交互式transformer以暹罗网路提取的当前帧和过去帧的特征作为输入，分别通过自注意力机制和互注意力机制对目标特征表达进行增强，并实现时序目标特征信息向当前帧的传播，实现对当前帧指定目标的特征增强，最后通过一个解码器完成指定目标的分割。相比于之前的基于匹配的方法，我们采用的暹罗网络在维护memory bank时可以实现特征复用，提高模型的效率。SITVOS在三个标准测试集上都达到了SOTA的性能。

成为VIP会员查看完整内容

24

相关内容

AAAI 2022

CVPR 2022 | 利用递归 “瞥视” 解码器优化基于Transformer的目标检测算法

CVPR 2022 | 利用递归 “瞥视” 解码器优化基于Transformer的目标检测算法

专知会员服务

11+阅读 · 2022年4月15日

【CVPR 2022】采用稀疏Transformer的单步法三维物体检测器，Embracing Single Stride 3D Object Detector with Sparse Transformer

【CVPR 2022】采用稀疏Transformer的单步法三维物体检测器，Embracing Single Stride 3D Object Detector with Sparse Transformer

专知会员服务

5+阅读 · 2022年3月12日

【AAAI2022】用于在线视频实例分割的混合实例觉知时序融合方法

【AAAI2022】用于在线视频实例分割的混合实例觉知时序融合方法

专知会员服务

12+阅读 · 2022年1月29日

【AAAI2022】基于属性的渐进融合网络的RGBT跟踪

【AAAI2022】基于属性的渐进融合网络的RGBT跟踪

专知会员服务

22+阅读 · 2022年1月8日

【AAAI2022】锚点DETR：基于transformer检测器的查询设计

【AAAI2022】锚点DETR：基于transformer检测器的查询设计

专知会员服务

13+阅读 · 2021年12月31日

【CVPR 2021】半监督视频目标分割新算法，实现SOTA性能

【CVPR 2021】半监督视频目标分割新算法，实现SOTA性能

专知会员服务

13+阅读 · 2021年4月26日

【CVPR2021】基于Transformer的视频分割领域

【CVPR2021】基于Transformer的视频分割领域

专知会员服务

38+阅读 · 2021年4月16日

【CVPR2021】Transformer遇见跟踪器：利用时间上下文进行视觉追踪

【CVPR2021】Transformer遇见跟踪器：利用时间上下文进行视觉追踪

专知会员服务

17+阅读 · 2021年3月24日

【CVPR2021】坐标注意力的高效移动网络设计

专知会员服务

23+阅读 · 2021年3月9日

【AAAI2021】基于双任务一致性的半监督医学图像分割

专知会员服务

45+阅读 · 2021年1月31日

CVPR 2022 | 利用递归 “瞥视” 解码器优化基于Transformer的目标检测算法

CVPR 2022 | 利用递归 “瞥视” 解码器优化基于Transformer的目标检测算法

专知

0+阅读 · 2022年4月16日

【CVPR2022】基于粗-精视觉Transformer的仿射医学图像配准

【CVPR2022】基于粗-精视觉Transformer的仿射医学图像配准

专知

4+阅读 · 2022年4月2日

CVPR 2022 | GeoTransformer：基于Transformer的点云配准网络

CVPR 2022 | GeoTransformer：基于Transformer的点云配准网络

PaperWeekly

2+阅读 · 2022年3月30日

CVPR 2022 | Transformer再屠榜！南大提出MixFormer：端到端目标跟踪新网络

CVPR 2022 | Transformer再屠榜！南大提出MixFormer：端到端目标跟踪新网络

CVer

1+阅读 · 2022年3月23日

人大金琴团队：基于Transformer的「视频-语言」预训练综述

人大金琴团队：基于Transformer的「视频-语言」预训练综述

CVer

0+阅读 · 2022年3月5日

CNN和Transformer再组合！UniFormer：新的主干网络！在六大视觉任务上大放光彩！

CNN和Transformer再组合！UniFormer：新的主干网络！在六大视觉任务上大放光彩！

CVer

2+阅读 · 2022年1月25日

VALSE 论文速览第43期：AOT for Video Object Segmentation

VALSE 论文速览第43期：AOT for Video Object Segmentation

VALSE

0+阅读 · 2022年1月22日

VALSE 论文速览第19期：基于Transformer的视觉目标跟踪

VALSE 论文速览第19期：基于Transformer的视觉目标跟踪

VALSE

0+阅读 · 2021年10月21日

【CVPR 2021】半监督视频目标分割新算法，实现SOTA性能

【CVPR 2021】半监督视频目标分割新算法，实现SOTA性能

专知

0+阅读 · 2021年4月26日

CVPR 2021 | 阿里达摩院提出半监督视频目标分割新算法，实现SOTA性能

CVPR 2021 | 阿里达摩院提出半监督视频目标分割新算法，实现SOTA性能

机器之心

0+阅读 · 2021年4月24日

基于异构并行计算平台的信息自适应接入与协作传输优化控制方法的研究

国家自然科学基金

1+阅读 · 2014年12月31日

基于协同学习进化多目标优化的网络结构分析

国家自然科学基金

0+阅读 · 2014年12月31日

基于立体视觉的动态在体软组织表面三维运动跟踪研究

国家自然科学基金

2+阅读 · 2013年12月31日

目标跟踪中的时空上下文建模方法研究

国家自然科学基金

2+阅读 · 2013年12月31日

跟踪器融合的视觉跟踪方法研究

国家自然科学基金

1+阅读 · 2013年12月31日

基于三维视频多视觉任务协同分析研究

国家自然科学基金

0+阅读 · 2013年12月31日

基于附加传输技术的无线信道信息利用与网络性能优化研究

国家自然科学基金

0+阅读 · 2012年12月31日

基于行为模型和超图匹配的多目标跟踪技术研究

国家自然科学基金

3+阅读 · 2012年12月31日

复杂网络的传播动力学及其在信息安全中的应用

国家自然科学基金

0+阅读 · 2012年12月31日

基于社交访问行为与传播特性的在线视频内容部署与传输方法研究

国家自然科学基金

0+阅读 · 2012年12月31日

STAU: A SpatioTemporal-Aware Unit for Video Prediction and Beyond

STAU: A SpatioTemporal-Aware Unit for Video Prediction and Beyond

Arxiv

1+阅读 · 2022年4月20日

Dual Aspect Self-Attention based on Transformer for Remaining Useful Life Prediction

Arxiv

0+阅读 · 2022年4月20日

Non-autoregressive Transformer-based End-to-end ASR using BERT

Arxiv

0+阅读 · 2022年4月18日

Vision-Language Pre-Training for Multimodal Aspect-Based Sentiment Analysis

Arxiv

0+阅读 · 2022年4月17日

Knowledge Distillation for Object Detection via Rank Mimicking and Prediction-guided Feature Imitation

Arxiv

11+阅读 · 2021年12月9日

Survey: Transformer based Video-Language Pre-training

Arxiv

20+阅读 · 2021年9月21日

A Survey of Transformers

Arxiv

103+阅读 · 2021年6月8日

Transformer Tracking

Arxiv

17+阅读 · 2021年3月29日

UP-DETR: Unsupervised Pre-training for Object Detection with Transformers

UP-DETR: Unsupervised Pre-training for Object Detection with Transformers

Arxiv

19+阅读 · 2020年11月18日

End-to-End Dense Video Captioning with Masked Transformer

Arxiv

14+阅读 · 2018年4月3日

VIP会员

相关主题

视频目标分割

相关VIP内容

CVPR 2022 | 利用递归 “瞥视” 解码器优化基于Transformer的目标检测算法

CVPR 2022 | 利用递归 “瞥视” 解码器优化基于Transformer的目标检测算法

专知会员服务

11+阅读 · 2022年4月15日

【CVPR 2022】采用稀疏Transformer的单步法三维物体检测器，Embracing Single Stride 3D Object Detector with Sparse Transformer

【CVPR 2022】采用稀疏Transformer的单步法三维物体检测器，Embracing Single Stride 3D Object Detector with Sparse Transformer

专知会员服务

5+阅读 · 2022年3月12日

【AAAI2022】用于在线视频实例分割的混合实例觉知时序融合方法

【AAAI2022】用于在线视频实例分割的混合实例觉知时序融合方法

专知会员服务

12+阅读 · 2022年1月29日

【AAAI2022】基于属性的渐进融合网络的RGBT跟踪

【AAAI2022】基于属性的渐进融合网络的RGBT跟踪

专知会员服务

22+阅读 · 2022年1月8日

【AAAI2022】锚点DETR：基于transformer检测器的查询设计

【AAAI2022】锚点DETR：基于transformer检测器的查询设计

专知会员服务

13+阅读 · 2021年12月31日

【CVPR 2021】半监督视频目标分割新算法，实现SOTA性能

【CVPR 2021】半监督视频目标分割新算法，实现SOTA性能

专知会员服务

13+阅读 · 2021年4月26日

【CVPR2021】基于Transformer的视频分割领域

【CVPR2021】基于Transformer的视频分割领域

专知会员服务

38+阅读 · 2021年4月16日

【CVPR2021】Transformer遇见跟踪器：利用时间上下文进行视觉追踪

【CVPR2021】Transformer遇见跟踪器：利用时间上下文进行视觉追踪

专知会员服务

17+阅读 · 2021年3月24日

【CVPR2021】坐标注意力的高效移动网络设计

专知会员服务

23+阅读 · 2021年3月9日

【AAAI2021】基于双任务一致性的半监督医学图像分割

专知会员服务

45+阅读 · 2021年1月31日

热门VIP内容

开通专知VIP会员享更多权益服务

《多智能体不确定环境追逃博弈研究》216页

美智库最新发布《解放军"人机编组协同作战"发展路径：理论与实践》53页

现代战争"杀伤区"理论：空间尺度与结构特征、控制手段与毁伤机制、生存策略与战线转移

《俄军无人机创新技术或已在乌克兰达成"战场空中封锁"作战效果》最新18页报告

相关资讯

CVPR 2022 | 利用递归 “瞥视” 解码器优化基于Transformer的目标检测算法

CVPR 2022 | 利用递归 “瞥视” 解码器优化基于Transformer的目标检测算法

专知

0+阅读 · 2022年4月16日

【CVPR2022】基于粗-精视觉Transformer的仿射医学图像配准

【CVPR2022】基于粗-精视觉Transformer的仿射医学图像配准

专知

4+阅读 · 2022年4月2日

CVPR 2022 | GeoTransformer：基于Transformer的点云配准网络

CVPR 2022 | GeoTransformer：基于Transformer的点云配准网络

PaperWeekly

2+阅读 · 2022年3月30日

CVPR 2022 | Transformer再屠榜！南大提出MixFormer：端到端目标跟踪新网络

CVPR 2022 | Transformer再屠榜！南大提出MixFormer：端到端目标跟踪新网络

CVer

1+阅读 · 2022年3月23日

人大金琴团队：基于Transformer的「视频-语言」预训练综述

人大金琴团队：基于Transformer的「视频-语言」预训练综述

CVer

0+阅读 · 2022年3月5日

CNN和Transformer再组合！UniFormer：新的主干网络！在六大视觉任务上大放光彩！

CNN和Transformer再组合！UniFormer：新的主干网络！在六大视觉任务上大放光彩！

CVer

2+阅读 · 2022年1月25日

VALSE 论文速览第43期：AOT for Video Object Segmentation

VALSE 论文速览第43期：AOT for Video Object Segmentation

VALSE

0+阅读 · 2022年1月22日

VALSE 论文速览第19期：基于Transformer的视觉目标跟踪

VALSE 论文速览第19期：基于Transformer的视觉目标跟踪

VALSE

0+阅读 · 2021年10月21日

【CVPR 2021】半监督视频目标分割新算法，实现SOTA性能

【CVPR 2021】半监督视频目标分割新算法，实现SOTA性能

专知

0+阅读 · 2021年4月26日

CVPR 2021 | 阿里达摩院提出半监督视频目标分割新算法，实现SOTA性能

CVPR 2021 | 阿里达摩院提出半监督视频目标分割新算法，实现SOTA性能

机器之心

0+阅读 · 2021年4月24日

相关基金

基于异构并行计算平台的信息自适应接入与协作传输优化控制方法的研究

国家自然科学基金

1+阅读 · 2014年12月31日

基于协同学习进化多目标优化的网络结构分析

国家自然科学基金

0+阅读 · 2014年12月31日

基于立体视觉的动态在体软组织表面三维运动跟踪研究

国家自然科学基金

2+阅读 · 2013年12月31日

目标跟踪中的时空上下文建模方法研究

国家自然科学基金

2+阅读 · 2013年12月31日

跟踪器融合的视觉跟踪方法研究

国家自然科学基金

1+阅读 · 2013年12月31日

基于三维视频多视觉任务协同分析研究

国家自然科学基金

0+阅读 · 2013年12月31日

基于附加传输技术的无线信道信息利用与网络性能优化研究

国家自然科学基金

0+阅读 · 2012年12月31日

基于行为模型和超图匹配的多目标跟踪技术研究

国家自然科学基金

3+阅读 · 2012年12月31日

复杂网络的传播动力学及其在信息安全中的应用

国家自然科学基金

0+阅读 · 2012年12月31日

基于社交访问行为与传播特性的在线视频内容部署与传输方法研究

国家自然科学基金

0+阅读 · 2012年12月31日

相关论文

STAU: A SpatioTemporal-Aware Unit for Video Prediction and Beyond

STAU: A SpatioTemporal-Aware Unit for Video Prediction and Beyond

Arxiv

1+阅读 · 2022年4月20日

Dual Aspect Self-Attention based on Transformer for Remaining Useful Life Prediction

Arxiv

0+阅读 · 2022年4月20日

Non-autoregressive Transformer-based End-to-end ASR using BERT

Arxiv

0+阅读 · 2022年4月18日

Vision-Language Pre-Training for Multimodal Aspect-Based Sentiment Analysis

Arxiv

0+阅读 · 2022年4月17日

Knowledge Distillation for Object Detection via Rank Mimicking and Prediction-guided Feature Imitation

Arxiv

11+阅读 · 2021年12月9日

Survey: Transformer based Video-Language Pre-training

Arxiv

20+阅读 · 2021年9月21日

A Survey of Transformers

Arxiv

103+阅读 · 2021年6月8日

Transformer Tracking

Arxiv

17+阅读 · 2021年3月29日

UP-DETR: Unsupervised Pre-training for Object Detection with Transformers

UP-DETR: Unsupervised Pre-training for Object Detection with Transformers

Arxiv

19+阅读 · 2020年11月18日

End-to-End Dense Video Captioning with Masked Transformer

Arxiv

14+阅读 · 2018年4月3日

微信扫码咨询专知VIP会员