【CVPR 2022】基于代表性片段知识传播的弱监督时间动作定位，Weakly Supervised Temporal Action Localization via Representative Snippet Knowledge Propagation - 专知VIP

会员服务 ·

1

CVPR 2022 · 弱监督学习 · 弱监督目标定位 · 知识传播 · 中科院自动化所 ·

2022 年 3 月 12 日

【CVPR 2022】基于代表性片段知识传播的弱监督时间动作定位，Weakly Supervised Temporal Action Localization via Representative Snippet Knowledge Propagation

专知会员服务

专知，提供专业可信的知识分发服务，让认知协作更快更好！

标题：Weakly Supervised Temporal Action Localization via Representative Snippet Knowledge Propagation

作者：Linjiang Huang, Liang Wang, Hongsheng Li

摘要：弱监督时序行为定位的目的是仅通过视频类别定位出视频中的行为边界。现有的许多方法大多基于分类的框架，并试图生成伪标签以减小分类任务和定位任务之间的差异。然后现有的方法通常只利用有限的上下文信息来生成伪标签，导致生成的伪标签。为了解决这个问题，我们提出了一个提取出并传播代表性的片段的弱监督时序行为定位框架。我们的方法旨在挖掘每个视频中的代表性片段，以便在视频片段之间传播信息，以生成更好的伪标签。对于每个视频，我们的方法基于高斯混合模型生成其独有的代表性片段，并将代表性片段根据分数优先的原则储存在对应类别的记忆库中。在得到代表性片段后，我们的方法利用所提出的双向随机游走模块更新原始的视频特征，利用更新后的视频特征生成视频的伪标签，以在线的方式纠正主分支的预测结果。我们的方法在两个基准数据集THUMOS14和ActivityNet1.3上获得了优越的性能，在THUMOS14上的平均mAP高于最优方法1.2%。

代表性片段知识传递框架

成为VIP会员查看完整内容

6

相关内容

CVPR 2022

CVPR 2022 将于2022年 6 月 21-24 日在美国的新奥尔良举行。CVPR是IEEE Conference on Computer Vision and Pattern Recognition的缩写，即IEEE国际计算机视觉与模式识别会议。该会议是由IEEE举办的计算机视觉和模式识别领域的顶级会议，会议的主要内容是计算机视觉与模式识别技术。

知识荟萃

精品入门和进阶教程、论文和代码整理等

更多

查看相关VIP内容、论文、资讯等

【MM 2021】基于自监督区域和时序辅助任务的面部运动单元识别，Self-Supervised Regional and Temporal Auxiliary Tasks for Facial Action Unit Recognition

【MM 2021】基于自监督区域和时序辅助任务的面部运动单元识别，Self-Supervised Regional and Temporal Auxiliary Tasks for Facial Action Unit Recognition

专知会员服务

4+阅读 · 2022年3月22日

【CVPR 2022】基于细粒度时序对比学习的弱监督行为定位， Fine-grained Temporal Contrastive Learning forWeakly-supervised Temporal Action Localization

【CVPR 2022】基于细粒度时序对比学习的弱监督行为定位， Fine-grained Temporal Contrastive Learning forWeakly-supervised Temporal Action Localization

专知会员服务

5+阅读 · 2022年3月19日

【CVPR 2022】一种无需使用负样本的自监督学习方法，Self-Supervised Predictive Learning: A Negative-Free Method for Sound Source Localization in Visual Scenes

【CVPR 2022】一种无需使用负样本的自监督学习方法，Self-Supervised Predictive Learning: A Negative-Free Method for Sound Source Localization in Visual Scenes

专知会员服务

15+阅读 · 2022年3月12日

【CVPR2022】弱监督目标定位建模为领域适应

【CVPR2022】弱监督目标定位建模为领域适应

专知会员服务

17+阅读 · 2022年3月4日

【WWW2021】充分利用层级结构进行自监督分类法扩展

【WWW2021】充分利用层级结构进行自监督分类法扩展

专知会员服务

16+阅读 · 2021年2月7日

【AAAI2021】时间关系建模与自监督的动作分割

【AAAI2021】时间关系建模与自监督的动作分割

专知会员服务

37+阅读 · 2021年1月24日

AAAI2021 | DTGRM：具有自监督时间关系建模的动作分割

AAAI2021 | DTGRM：具有自监督时间关系建模的动作分割

专知会员服务

15+阅读 · 2020年12月29日

【AAAI2021】利用先验知识对场景图进行分类

【AAAI2021】利用先验知识对场景图进行分类

专知会员服务

61+阅读 · 2020年12月3日

【ECCV2020-牛津大学】基于自监督学习的视频音视觉物体结构化

【ECCV2020-牛津大学】基于自监督学习的视频音视觉物体结构化

专知会员服务

20+阅读 · 2020年8月11日

【IJCAI2020-南京大学】用紧凑、有代表性的相关知识图谱丰富文档，Enriching Documents with Compact, Representative, Relevant Knowledge Graphs

【IJCAI2020-南京大学】用紧凑、有代表性的相关知识图谱丰富文档，Enriching Documents with Compact, Representative, Relevant Knowledge Graphs

专知会员服务

17+阅读 · 2020年5月4日

CVPR 2022 | 南大提出：Structured Sparse R-CNN：单阶段端到端场景图生成器

CVPR 2022 | 南大提出：Structured Sparse R-CNN：单阶段端到端场景图生成器

CVer

0+阅读 · 2022年4月13日

VALSE 论文速览第58期：背景标注引导的动作定位

VALSE 论文速览第58期：背景标注引导的动作定位

VALSE

0+阅读 · 2022年3月18日

【CVPR2022】弱监督目标定位建模为领域适应

【CVPR2022】弱监督目标定位建模为领域适应

专知

1+阅读 · 2022年3月4日

VALSE 论文速览第43期：AOT for Video Object Segmentation

VALSE 论文速览第43期：AOT for Video Object Segmentation

VALSE

0+阅读 · 2022年1月22日

NeurIPS 2021 | MSRA提出：目标检测与分割的零标签视觉学习

NeurIPS 2021 | MSRA提出：目标检测与分割的零标签视觉学习

CVer

0+阅读 · 2021年12月3日

VALSE 论文速览第30期：基于并行解码的端到端密集视频描述

VALSE 论文速览第30期：基于并行解码的端到端密集视频描述

VALSE

0+阅读 · 2021年12月1日

NeuralPS'20 | Graph Meta Learning via Local Subgraphs

NeuralPS'20 | Graph Meta Learning via Local Subgraphs

图与推荐

3+阅读 · 2021年10月29日

视频目标检测：Flow-based

视频目标检测：Flow-based

极市平台

22+阅读 · 2019年5月27日

论文浅尝 | Global Relation Embedding for Relation Extraction

论文浅尝 | Global Relation Embedding for Relation Extraction

开放知识图谱

12+阅读 · 2019年3月3日

基于弱监督的视频时序动作检测的介绍

基于弱监督的视频时序动作检测的介绍

极市平台

30+阅读 · 2019年2月6日

离散事件系统的监督与重构

国家自然科学基金

1+阅读 · 2014年12月31日

多模态融合的大规模网络视频名人标注研究

国家自然科学基金

0+阅读 · 2013年12月31日

基于知识迁移的跨领域人体动作识别

国家自然科学基金

5+阅读 · 2013年12月31日

多约束条件下的目标超分辨检测方法研究

国家自然科学基金

0+阅读 · 2013年12月31日

弱标注下基于主动学习的检测器适应问题研究

国家自然科学基金

0+阅读 · 2012年12月31日

跨汉斯拉夫蒙古文的信息检索关键技术研究

国家自然科学基金

0+阅读 · 2012年12月31日

基于感知哈希的视频篡改快速检测与多粒度定位技术研究

国家自然科学基金

0+阅读 · 2011年12月31日

基于运动模式在线学习的移动机器人对运动目标的主动观测与最优跟踪

国家自然科学基金

0+阅读 · 2011年12月31日

视觉识别中类别信息早期加工的认知神经机制

国家自然科学基金

0+阅读 · 2009年12月31日

多摄像机视频监控中的人物角色分类技术研究

国家自然科学基金

0+阅读 · 2009年12月31日

Memory-Constrained Policy Optimization

Arxiv

0+阅读 · 2022年4月20日

Reconstruction-Aware Prior Distillation for Semi-supervised Point Cloud Completion

Arxiv

1+阅读 · 2022年4月20日

M$^2$BEV: Multi-Camera Joint 3D Detection and Segmentation with Unified Birds-Eye View Representation

Arxiv

0+阅读 · 2022年4月19日

Inference for Cluster Randomized Experiments with Non-ignorable Cluster Sizes

Inference for Cluster Randomized Experiments with Non-ignorable Cluster Sizes

Arxiv

0+阅读 · 2022年4月18日

Incremental Prompting: Episodic Memory Prompt for Lifelong Event Detection

Arxiv

0+阅读 · 2022年4月15日

Multi-Domain Multi-Task Rehearsal for Lifelong Learning

Multi-Domain Multi-Task Rehearsal for Lifelong Learning

Arxiv

12+阅读 · 2020年12月14日

Scalable Graph Neural Networks via Bidirectional Propagation

Arxiv

16+阅读 · 2020年10月29日

Look-into-Object: Self-supervised Structure Modeling for Object Recognition

Look-into-Object: Self-supervised Structure Modeling for Object Recognition

Arxiv

15+阅读 · 2020年3月31日

Domain Representation for Knowledge Graph Embedding

Domain Representation for Knowledge Graph Embedding

Arxiv

14+阅读 · 2019年9月11日

Cross-lingual Knowledge Graph Alignment via Graph Matching Neural Network

Arxiv

15+阅读 · 2019年5月28日

VIP会员

相关主题

弱监督学习

弱监督目标定位

中科院自动化所

相关VIP内容

【MM 2021】基于自监督区域和时序辅助任务的面部运动单元识别，Self-Supervised Regional and Temporal Auxiliary Tasks for Facial Action Unit Recognition

【MM 2021】基于自监督区域和时序辅助任务的面部运动单元识别，Self-Supervised Regional and Temporal Auxiliary Tasks for Facial Action Unit Recognition

专知会员服务

4+阅读 · 2022年3月22日

【CVPR 2022】基于细粒度时序对比学习的弱监督行为定位， Fine-grained Temporal Contrastive Learning forWeakly-supervised Temporal Action Localization

【CVPR 2022】基于细粒度时序对比学习的弱监督行为定位， Fine-grained Temporal Contrastive Learning forWeakly-supervised Temporal Action Localization

专知会员服务

5+阅读 · 2022年3月19日

【CVPR 2022】一种无需使用负样本的自监督学习方法，Self-Supervised Predictive Learning: A Negative-Free Method for Sound Source Localization in Visual Scenes

【CVPR 2022】一种无需使用负样本的自监督学习方法，Self-Supervised Predictive Learning: A Negative-Free Method for Sound Source Localization in Visual Scenes

专知会员服务

15+阅读 · 2022年3月12日

【CVPR2022】弱监督目标定位建模为领域适应

【CVPR2022】弱监督目标定位建模为领域适应

专知会员服务

17+阅读 · 2022年3月4日

【WWW2021】充分利用层级结构进行自监督分类法扩展

【WWW2021】充分利用层级结构进行自监督分类法扩展

专知会员服务

16+阅读 · 2021年2月7日

【AAAI2021】时间关系建模与自监督的动作分割

【AAAI2021】时间关系建模与自监督的动作分割

专知会员服务

37+阅读 · 2021年1月24日

AAAI2021 | DTGRM：具有自监督时间关系建模的动作分割

AAAI2021 | DTGRM：具有自监督时间关系建模的动作分割

专知会员服务

15+阅读 · 2020年12月29日

【AAAI2021】利用先验知识对场景图进行分类

【AAAI2021】利用先验知识对场景图进行分类

专知会员服务

61+阅读 · 2020年12月3日

【ECCV2020-牛津大学】基于自监督学习的视频音视觉物体结构化

【ECCV2020-牛津大学】基于自监督学习的视频音视觉物体结构化

专知会员服务

20+阅读 · 2020年8月11日

【IJCAI2020-南京大学】用紧凑、有代表性的相关知识图谱丰富文档，Enriching Documents with Compact, Representative, Relevant Knowledge Graphs

【IJCAI2020-南京大学】用紧凑、有代表性的相关知识图谱丰富文档，Enriching Documents with Compact, Representative, Relevant Knowledge Graphs

专知会员服务

17+阅读 · 2020年5月4日

热门VIP内容

开通专知VIP会员享更多权益服务

新书册《几何深度学习的数学基础》

中程单向攻击无人机的战略意义：俄乌战争启示

在无标注条件下适配视觉—语言模型：全面综述

面向视觉语言模型的持续学习：遗忘之外的综述与分类体系

相关资讯

CVPR 2022 | 南大提出：Structured Sparse R-CNN：单阶段端到端场景图生成器

CVPR 2022 | 南大提出：Structured Sparse R-CNN：单阶段端到端场景图生成器

CVer

0+阅读 · 2022年4月13日

VALSE 论文速览第58期：背景标注引导的动作定位

VALSE 论文速览第58期：背景标注引导的动作定位

VALSE

0+阅读 · 2022年3月18日

【CVPR2022】弱监督目标定位建模为领域适应

【CVPR2022】弱监督目标定位建模为领域适应

专知

1+阅读 · 2022年3月4日

VALSE 论文速览第43期：AOT for Video Object Segmentation

VALSE 论文速览第43期：AOT for Video Object Segmentation

VALSE

0+阅读 · 2022年1月22日

NeurIPS 2021 | MSRA提出：目标检测与分割的零标签视觉学习

NeurIPS 2021 | MSRA提出：目标检测与分割的零标签视觉学习

CVer

0+阅读 · 2021年12月3日

VALSE 论文速览第30期：基于并行解码的端到端密集视频描述

VALSE 论文速览第30期：基于并行解码的端到端密集视频描述

VALSE

0+阅读 · 2021年12月1日

NeuralPS'20 | Graph Meta Learning via Local Subgraphs

NeuralPS'20 | Graph Meta Learning via Local Subgraphs

图与推荐

3+阅读 · 2021年10月29日

视频目标检测：Flow-based

视频目标检测：Flow-based

极市平台

22+阅读 · 2019年5月27日

论文浅尝 | Global Relation Embedding for Relation Extraction

论文浅尝 | Global Relation Embedding for Relation Extraction

开放知识图谱

12+阅读 · 2019年3月3日

基于弱监督的视频时序动作检测的介绍

基于弱监督的视频时序动作检测的介绍

极市平台

30+阅读 · 2019年2月6日

相关基金

离散事件系统的监督与重构

国家自然科学基金

1+阅读 · 2014年12月31日

多模态融合的大规模网络视频名人标注研究

国家自然科学基金

0+阅读 · 2013年12月31日

基于知识迁移的跨领域人体动作识别

国家自然科学基金

5+阅读 · 2013年12月31日

多约束条件下的目标超分辨检测方法研究

国家自然科学基金

0+阅读 · 2013年12月31日

弱标注下基于主动学习的检测器适应问题研究

国家自然科学基金

0+阅读 · 2012年12月31日

跨汉斯拉夫蒙古文的信息检索关键技术研究

国家自然科学基金

0+阅读 · 2012年12月31日

基于感知哈希的视频篡改快速检测与多粒度定位技术研究

国家自然科学基金

0+阅读 · 2011年12月31日

基于运动模式在线学习的移动机器人对运动目标的主动观测与最优跟踪

国家自然科学基金

0+阅读 · 2011年12月31日

视觉识别中类别信息早期加工的认知神经机制

国家自然科学基金

0+阅读 · 2009年12月31日

多摄像机视频监控中的人物角色分类技术研究

国家自然科学基金

0+阅读 · 2009年12月31日

相关论文

Memory-Constrained Policy Optimization

Arxiv

0+阅读 · 2022年4月20日

Reconstruction-Aware Prior Distillation for Semi-supervised Point Cloud Completion

Arxiv

1+阅读 · 2022年4月20日

M$^2$BEV: Multi-Camera Joint 3D Detection and Segmentation with Unified Birds-Eye View Representation

Arxiv

0+阅读 · 2022年4月19日

Inference for Cluster Randomized Experiments with Non-ignorable Cluster Sizes

Inference for Cluster Randomized Experiments with Non-ignorable Cluster Sizes

Arxiv

0+阅读 · 2022年4月18日

Incremental Prompting: Episodic Memory Prompt for Lifelong Event Detection

Arxiv

0+阅读 · 2022年4月15日

Multi-Domain Multi-Task Rehearsal for Lifelong Learning

Multi-Domain Multi-Task Rehearsal for Lifelong Learning

Arxiv

12+阅读 · 2020年12月14日

Scalable Graph Neural Networks via Bidirectional Propagation

Arxiv

16+阅读 · 2020年10月29日

Look-into-Object: Self-supervised Structure Modeling for Object Recognition

Look-into-Object: Self-supervised Structure Modeling for Object Recognition

Arxiv

15+阅读 · 2020年3月31日

Domain Representation for Knowledge Graph Embedding

Domain Representation for Knowledge Graph Embedding

Arxiv

14+阅读 · 2019年9月11日

Cross-lingual Knowledge Graph Alignment via Graph Matching Neural Network

Arxiv

15+阅读 · 2019年5月28日

微信扫码咨询专知VIP会员