【AAAI2022】用于在线视频实例分割的混合实例觉知时序融合方法 - 专知

会员服务 ·

0

【AAAI2022】用于在线视频实例分割的混合实例觉知时序融合方法

2022 年 1 月 29 日 专知

用于在线视频实例分割的混合实例觉知时序融合方法

Hybrid Instance-aware Temporal Fusion for Online Video Instance Segmentation

论文摘要：本文提出了一种基于实例的时序内容融合方法，用于在线视频实例分割框架。首先，我们利用图像分割的一种表示，基于实例的全局编码和 CNN 特征图来表示实例级和像素级特征。基于这种表示，我们引入了一种无需裁剪的时序融合方法来对视频帧之间的时间一致性进行建模。具体地，我们在实例编码中对全局实例信息进行编码，并通过实例编码和 CNN 特征图之间的混合注意力机制建模帧间的上下文融合。利用学习到的混合时间一致性，我们能够直接检索和维护跨帧的实例身份，去除了先前方法中复杂的逐帧实例匹配方案。在 Youtube-VIS-19/21 数据集，我们的模型在所有在线视频实例分割方法中取得了最佳性能。

论文开创性突破与核心贡献：用于实时视频实力分割的高效时序融合方法，在所有在线视频实例分割方法中取得了最佳性能。

https://www.zhuanzhi.ai/paper/7ea2959c252c2c2e8bbc5614bc159ef3

专知便捷查看

便捷下载，请关注专知公众号（点击上方蓝色专知关注）

后台回复“HTFS” 就可以获取《【AAAI2022】用于在线视频实例分割的混合实例觉知时序融合方法》专知下载链接

专知，专业可信的人工智能知识分发 ，让认知协作更快更好！欢迎注册登录专知www.zhuanzhi.ai，获取70000+AI主题干货知识资料！

欢迎微信扫一扫加入专知人工智能知识星球群，获取最新AI专业干货知识教程资料和与专家交流咨询！

点击“ 阅读原文 ”，了解使用专知 ，查看获取70000+AI主题知识资源

登录查看更多

1

相关内容

时序融合

【CVPR2022】CAT-Det:用于多模态三维物体检测的对比增强Transformer

【CVPR2022】CAT-Det:用于多模态三维物体检测的对比增强Transformer

专知会员服务

19+阅读 · 2022年4月7日

【CVPR2022】基于粗-精视觉Transformer的仿射医学图像配准

【CVPR2022】基于粗-精视觉Transformer的仿射医学图像配准

专知会员服务

36+阅读 · 2022年4月2日

【CVPR2022】基于序列对比学习的长视频帧方向动作表示

【CVPR2022】基于序列对比学习的长视频帧方向动作表示

专知会员服务

10+阅读 · 2022年3月29日

【CVPR2022】UniVIP：自监督视觉预训练的统一框架

【CVPR2022】UniVIP：自监督视觉预训练的统一框架

专知会员服务

28+阅读 · 2022年3月16日

【CVPR2022】弱监督语义分割的类重新激活图

【CVPR2022】弱监督语义分割的类重新激活图

专知会员服务

17+阅读 · 2022年3月7日

【CVPR2022】基于联合表示学习和在线聚类的无监督活动分割

【CVPR2022】基于联合表示学习和在线聚类的无监督活动分割

专知会员服务

13+阅读 · 2022年3月2日

【AAAI2022】基于交互式transformer和暹罗网络的视频目标分割

【AAAI2022】基于交互式transformer和暹罗网络的视频目标分割

专知会员服务

24+阅读 · 2022年2月6日

【AAAI2022】用于在线视频实例分割的混合实例觉知时序融合方法

【AAAI2022】用于在线视频实例分割的混合实例觉知时序融合方法

专知会员服务

12+阅读 · 2022年1月29日

【NeurIPS 2021】实例依赖的偏标记学习

【NeurIPS 2021】实例依赖的偏标记学习

专知会员服务

11+阅读 · 2021年11月28日

|[IEEE TPAMI2021]一种基于合成样本和1维CNN的免伪造样本联机签名认证特征学习方法 (代码已开源)

专知会员服务

13+阅读 · 2021年7月28日

【CVPR2022】CAT-Det:用于多模态三维物体检测的对比增强Transformer

【CVPR2022】CAT-Det:用于多模态三维物体检测的对比增强Transformer

专知

2+阅读 · 2022年4月7日

【CVPR2022】基于粗-精视觉Transformer的仿射医学图像配准

【CVPR2022】基于粗-精视觉Transformer的仿射医学图像配准

专知

4+阅读 · 2022年4月2日

【CVPR2022】基于序列对比学习的长视频帧方向动作表示

【CVPR2022】基于序列对比学习的长视频帧方向动作表示

专知

1+阅读 · 2022年3月30日

【CVPR2022】UniVIP：自监督视觉预训练的统一框架

【CVPR2022】UniVIP：自监督视觉预训练的统一框架

专知

1+阅读 · 2022年3月16日

【CVPR2022】通过特征Mixing进行主动学习

【CVPR2022】通过特征Mixing进行主动学习

专知

0+阅读 · 2022年3月15日

【CVPR2022】弱监督语义分割的类重新激活图

【CVPR2022】弱监督语义分割的类重新激活图

专知

3+阅读 · 2022年3月7日

【AAAI2022】基于图神经网络的统一离群点异常检测方法

【AAAI2022】基于图神经网络的统一离群点异常检测方法

专知

4+阅读 · 2022年2月12日

【AAAI2022】基于交互式transformer和暹罗网络的视频目标分割

【AAAI2022】基于交互式transformer和暹罗网络的视频目标分割

专知

0+阅读 · 2022年2月6日

【AAAI2022】推荐系统应用中的上下文老虎机中的上下文不确定性

【AAAI2022】推荐系统应用中的上下文老虎机中的上下文不确定性

专知

0+阅读 · 2022年2月4日

【CVPR2021】基于Transformer的视频分割领域

【CVPR2021】基于Transformer的视频分割领域

专知

2+阅读 · 2021年4月16日

基于机电混合数据驱动的风力发电机故障诊断与预测方法研究

国家自然科学基金

2+阅读 · 2015年12月31日

基于概率图谱引导的群组自适应时序脑MR图像脑提取方法研究

国家自然科学基金

1+阅读 · 2015年12月31日

面向在线检索的医学影像多特征降维方法研究

国家自然科学基金

0+阅读 · 2015年12月31日

高维混合数据异常知识发现的粒计算模型关键问题研究

国家自然科学基金

1+阅读 · 2014年12月31日

面向安全认证的掌纹掌脉特征融合识别方法研究

国家自然科学基金

0+阅读 · 2014年12月31日

基于视觉感知的HEVC优化策略研究

国家自然科学基金

0+阅读 · 2013年12月31日

基于sEMG非线性动力学分析的人体运动意图在线识别方法研究

国家自然科学基金

0+阅读 · 2013年12月31日

基于蚁群算法面向对象的遥感图像分类方法研究

国家自然科学基金

2+阅读 · 2013年12月31日

基于在线数据与专家知识的燃煤锅炉混合智能建模及模型更新研究

国家自然科学基金

0+阅读 · 2012年12月31日

基于多源信息融合策略的支持向量机用于中药谱效关系的研究

国家自然科学基金

0+阅读 · 2009年12月31日

Isogeometric boundary element method for acoustic scattering by a submarine

Arxiv

0+阅读 · 2022年4月20日

Isogeometric Analysis of Acoustic Scattering with Perfectly Matched Layers (IGAPML)

Arxiv

0+阅读 · 2022年4月20日

Blockwise Streaming Transformer for Spoken Language Understanding and Simultaneous Speech Translation

Blockwise Streaming Transformer for Spoken Language Understanding and Simultaneous Speech Translation

Arxiv

0+阅读 · 2022年4月19日

Bootstrapped Representation Learning for Skeleton-Based Action Recognition

Arxiv

0+阅读 · 2022年4月19日

High-Dimensional Geometric Streaming in Polynomial Space

Arxiv

0+阅读 · 2022年4月18日

Vision-Language Pre-Training for Multimodal Aspect-Based Sentiment Analysis

Arxiv

0+阅读 · 2022年4月17日

DialAug: Mixing up Dialogue Contexts in Contrastive Learning for Robust Conversational Modeling

Arxiv

0+阅读 · 2022年4月15日

Look-into-Object: Self-supervised Structure Modeling for Object Recognition

Look-into-Object: Self-supervised Structure Modeling for Object Recognition

Arxiv

15+阅读 · 2020年3月31日

Cross-Modal Self-Attention Network for Referring Image Segmentation

Cross-Modal Self-Attention Network for Referring Image Segmentation

Arxiv

18+阅读 · 2019年4月9日

f-VAEGAN-D2: A Feature Generating Framework for Any-Shot Learning

Arxiv

11+阅读 · 2019年3月25日

VIP会员

相关主题

视频实例分割

基于实例的

相关VIP内容

【CVPR2022】CAT-Det:用于多模态三维物体检测的对比增强Transformer

【CVPR2022】CAT-Det:用于多模态三维物体检测的对比增强Transformer

专知会员服务

19+阅读 · 2022年4月7日

【CVPR2022】基于粗-精视觉Transformer的仿射医学图像配准

【CVPR2022】基于粗-精视觉Transformer的仿射医学图像配准

专知会员服务

36+阅读 · 2022年4月2日

【CVPR2022】基于序列对比学习的长视频帧方向动作表示

【CVPR2022】基于序列对比学习的长视频帧方向动作表示

专知会员服务

10+阅读 · 2022年3月29日

【CVPR2022】UniVIP：自监督视觉预训练的统一框架

【CVPR2022】UniVIP：自监督视觉预训练的统一框架

专知会员服务

28+阅读 · 2022年3月16日

【CVPR2022】弱监督语义分割的类重新激活图

【CVPR2022】弱监督语义分割的类重新激活图

专知会员服务

17+阅读 · 2022年3月7日

【CVPR2022】基于联合表示学习和在线聚类的无监督活动分割

【CVPR2022】基于联合表示学习和在线聚类的无监督活动分割

专知会员服务

13+阅读 · 2022年3月2日

【AAAI2022】基于交互式transformer和暹罗网络的视频目标分割

【AAAI2022】基于交互式transformer和暹罗网络的视频目标分割

专知会员服务

24+阅读 · 2022年2月6日

【AAAI2022】用于在线视频实例分割的混合实例觉知时序融合方法

【AAAI2022】用于在线视频实例分割的混合实例觉知时序融合方法

专知会员服务

12+阅读 · 2022年1月29日

【NeurIPS 2021】实例依赖的偏标记学习

【NeurIPS 2021】实例依赖的偏标记学习

专知会员服务

11+阅读 · 2021年11月28日

|[IEEE TPAMI2021]一种基于合成样本和1维CNN的免伪造样本联机签名认证特征学习方法 (代码已开源)

专知会员服务

13+阅读 · 2021年7月28日

热门VIP内容

开通专知VIP会员享更多权益服务

【博士论文】扩展可扩展会话推荐的边界

别想太多：高效 R1 风格大型推理模型综述

【ACMMM2025】EvoVLMA: 进化式视觉-语言模型自适应

智能体网络：用AI智能体编织下一代网络

相关资讯

【CVPR2022】CAT-Det:用于多模态三维物体检测的对比增强Transformer

【CVPR2022】CAT-Det:用于多模态三维物体检测的对比增强Transformer

专知

2+阅读 · 2022年4月7日

【CVPR2022】基于粗-精视觉Transformer的仿射医学图像配准

【CVPR2022】基于粗-精视觉Transformer的仿射医学图像配准

专知

4+阅读 · 2022年4月2日

【CVPR2022】基于序列对比学习的长视频帧方向动作表示

【CVPR2022】基于序列对比学习的长视频帧方向动作表示

专知

1+阅读 · 2022年3月30日

【CVPR2022】UniVIP：自监督视觉预训练的统一框架

【CVPR2022】UniVIP：自监督视觉预训练的统一框架

专知

1+阅读 · 2022年3月16日

【CVPR2022】通过特征Mixing进行主动学习

【CVPR2022】通过特征Mixing进行主动学习

专知

0+阅读 · 2022年3月15日

【CVPR2022】弱监督语义分割的类重新激活图

【CVPR2022】弱监督语义分割的类重新激活图

专知

3+阅读 · 2022年3月7日

【AAAI2022】基于图神经网络的统一离群点异常检测方法

【AAAI2022】基于图神经网络的统一离群点异常检测方法

专知

4+阅读 · 2022年2月12日

【AAAI2022】基于交互式transformer和暹罗网络的视频目标分割

【AAAI2022】基于交互式transformer和暹罗网络的视频目标分割

专知

0+阅读 · 2022年2月6日

【AAAI2022】推荐系统应用中的上下文老虎机中的上下文不确定性

【AAAI2022】推荐系统应用中的上下文老虎机中的上下文不确定性

专知

0+阅读 · 2022年2月4日

【CVPR2021】基于Transformer的视频分割领域

【CVPR2021】基于Transformer的视频分割领域

专知

2+阅读 · 2021年4月16日

相关基金

基于机电混合数据驱动的风力发电机故障诊断与预测方法研究

国家自然科学基金

2+阅读 · 2015年12月31日

基于概率图谱引导的群组自适应时序脑MR图像脑提取方法研究

国家自然科学基金

1+阅读 · 2015年12月31日

面向在线检索的医学影像多特征降维方法研究

国家自然科学基金

0+阅读 · 2015年12月31日

高维混合数据异常知识发现的粒计算模型关键问题研究

国家自然科学基金

1+阅读 · 2014年12月31日

面向安全认证的掌纹掌脉特征融合识别方法研究

国家自然科学基金

0+阅读 · 2014年12月31日

基于视觉感知的HEVC优化策略研究

国家自然科学基金

0+阅读 · 2013年12月31日

基于sEMG非线性动力学分析的人体运动意图在线识别方法研究

国家自然科学基金

0+阅读 · 2013年12月31日

基于蚁群算法面向对象的遥感图像分类方法研究

国家自然科学基金

2+阅读 · 2013年12月31日

基于在线数据与专家知识的燃煤锅炉混合智能建模及模型更新研究

国家自然科学基金

0+阅读 · 2012年12月31日

基于多源信息融合策略的支持向量机用于中药谱效关系的研究

国家自然科学基金

0+阅读 · 2009年12月31日

相关论文

Isogeometric boundary element method for acoustic scattering by a submarine

Arxiv

0+阅读 · 2022年4月20日

Isogeometric Analysis of Acoustic Scattering with Perfectly Matched Layers (IGAPML)

Arxiv

0+阅读 · 2022年4月20日

Blockwise Streaming Transformer for Spoken Language Understanding and Simultaneous Speech Translation

Blockwise Streaming Transformer for Spoken Language Understanding and Simultaneous Speech Translation

Arxiv

0+阅读 · 2022年4月19日

Bootstrapped Representation Learning for Skeleton-Based Action Recognition

Arxiv

0+阅读 · 2022年4月19日

High-Dimensional Geometric Streaming in Polynomial Space

Arxiv

0+阅读 · 2022年4月18日

Vision-Language Pre-Training for Multimodal Aspect-Based Sentiment Analysis

Arxiv

0+阅读 · 2022年4月17日

DialAug: Mixing up Dialogue Contexts in Contrastive Learning for Robust Conversational Modeling

Arxiv

0+阅读 · 2022年4月15日

Look-into-Object: Self-supervised Structure Modeling for Object Recognition

Look-into-Object: Self-supervised Structure Modeling for Object Recognition

Arxiv

15+阅读 · 2020年3月31日

Cross-Modal Self-Attention Network for Referring Image Segmentation

Cross-Modal Self-Attention Network for Referring Image Segmentation

Arxiv

18+阅读 · 2019年4月9日

f-VAEGAN-D2: A Feature Generating Framework for Any-Shot Learning

Arxiv

11+阅读 · 2019年3月25日

大家都在搜

大型语言模型

久别重逢话双塔

国防科技创新

OpenKG开源系列 | 海洋鱼类百科知识图谱（浙江大学）

微信扫码咨询专知VIP会员