使用头脑：改善长尾视频识别 (Use Your Head: Improving Long-Tail Video Recognition) - 专知论文

会员服务 ·

0

视频识别 · 基准测试 · 基准 · 识别 · 视频 ·

2023 年 4 月 3 日

Use Your Head: Improving Long-Tail Video Recognition

翻译：使用头脑：改善长尾视频识别

Toby Perrett,Saptarshi Sinha,Tilo Burghardt,Majid Mirmehdi,Dima Damen

from arxiv, CVPR 2023

This paper presents an investigation into long-tail video recognition. We demonstrate that, unlike naturally-collected video datasets and existing long-tail image benchmarks, current video benchmarks fall short on multiple long-tailed properties. Most critically, they lack few-shot classes in their tails. In response, we propose new video benchmarks that better assess long-tail recognition, by sampling subsets from two datasets: SSv2 and VideoLT. We then propose a method, Long-Tail Mixed Reconstruction, which reduces overfitting to instances from few-shot classes by reconstructing them as weighted combinations of samples from head classes. LMR then employs label mixing to learn robust decision boundaries. It achieves state-of-the-art average class accuracy on EPIC-KITCHENS and the proposed SSv2-LT and VideoLT-LT. Benchmarks and code at: tobyperrett.github.io/lmr

翻译：本文介绍长尾视频识别的研究。我们展示了当前的视频基准测试与自然收集的视频数据集和现有的长尾图像基准测试相比，在多个长尾属性方面都存在缺陷。最重要的是，它们在尾部缺乏几个示例类别。因此，我们提出了新的视频基准测试，通过对两个数据集SSv2和VideoLT的子集进行采样来更好地评估长尾识别。接着，我们提出一种方法，Long-Tail Mixed Reconstruction（长尾混合重建），它通过将尾部类别的实例重建为来自头部类别样本的加权组合来减少过度拟合。接着，LMR采用标签混合来学习强健的决策边界。它在EPIC-KITCHENS和SSv2-LT、VideoLT-LT上实现了最先进的平均类准确性。基准测试和代码位于：tobyperrett.github.io/lmr。

0

相关内容

视频识别

【ICML2022】长尾识别中分布外检测的部分和非对称对比学习

【ICML2022】长尾识别中分布外检测的部分和非对称对比学习

专知会员服务

24+阅读 · 2022年7月5日

【CVPR 2022】基于灵活模态Transformer的人脸防伪 FM-ViT: Flexible Modal Vision Transformers for Face Anti-Spoofing

【CVPR 2022】基于灵活模态Transformer的人脸防伪 FM-ViT: Flexible Modal Vision Transformers for Face Anti-Spoofing

专知会员服务

17+阅读 · 2022年3月19日

【CVPR 2022】长尾视觉数据识别的嵌套式协同学习方法 Nested Collaborative Learning for Long-Tailed Visual Recognition

【CVPR 2022】长尾视觉数据识别的嵌套式协同学习方法 Nested Collaborative Learning for Long-Tailed Visual Recognition

专知会员服务

13+阅读 · 2022年3月19日

【ACMMM2021】密集对比视觉语言预训练

专知会员服务

13+阅读 · 2021年10月11日

[NeurIPS 2020 oral] 基于因果干预的弱监督语义分割

专知会员服务

47+阅读 · 2020年10月5日

【ACL2020】对抗性文本生成，Improving Adversarial Text Generation

专知会员服务

52+阅读 · 2020年5月5日

50+篇《神经架构搜索NAS》2020论文合集

专知会员服务

61+阅读 · 2020年3月19日

【CVPR2020】用于细粒度动作识别的多模式域自适应，Multi-Modal Domain Adaptation for Fine-Grained Action Recognition

【CVPR2020】用于细粒度动作识别的多模式域自适应，Multi-Modal Domain Adaptation for Fine-Grained Action Recognition

专知会员服务

78+阅读 · 2020年2月25日

【Google AI】开源NoisyStudent：自监督图像分类

【Google AI】开源NoisyStudent：自监督图像分类

专知会员服务

55+阅读 · 2020年2月18日

强化学习最新教程，17页pdf

强化学习最新教程，17页pdf

专知会员服务

181+阅读 · 2019年10月11日

VCIP 2022 Call for Demos

VCIP 2022 Call for Demos

CCF多媒体专委会

1+阅读 · 2022年6月6日

视频分析/多模态学习论文、代码、数据集大列表

视频分析/多模态学习论文、代码、数据集大列表

专知

57+阅读 · 2019年7月13日

【泡泡汇总】CVPR2019 SLAM Paperlist

【泡泡汇总】CVPR2019 SLAM Paperlist

泡泡机器人SLAM

14+阅读 · 2019年6月12日

强化学习三篇论文避免遗忘等

强化学习三篇论文避免遗忘等

CreateAMind

20+阅读 · 2019年5月24日

Hierarchically Structured Meta-learning

Hierarchically Structured Meta-learning

CreateAMind

27+阅读 · 2019年5月22日

强化学习的Unsupervised Meta-Learning

强化学习的Unsupervised Meta-Learning

CreateAMind

18+阅读 · 2019年1月7日

无监督元学习表示学习

无监督元学习表示学习

CreateAMind

27+阅读 · 2019年1月4日

Unsupervised Learning via Meta-Learning

Unsupervised Learning via Meta-Learning

CreateAMind

43+阅读 · 2019年1月3日

【泡泡一分钟】PathTrack：使用路径监督的快速轨迹标注方法（ICCV2017-28）

【泡泡一分钟】PathTrack：使用路径监督的快速轨迹标注方法（ICCV2017-28）

泡泡机器人SLAM

10+阅读 · 2018年5月26日

【泡泡一分钟】使用深度神经网络提取局部特征的大规模图像检索算法(ICCV-2)

【泡泡一分钟】使用深度神经网络提取局部特征的大规模图像检索算法(ICCV-2)

泡泡机器人SLAM

16+阅读 · 2018年2月10日

网络图像标注中多视图半监督稀疏特征选择算法研究

国家自然科学基金

1+阅读 · 2015年12月31日

封闭空间中声源辐射阻抗特性研究

国家自然科学基金

0+阅读 · 2015年12月31日

多源卫星遥感反演气溶胶光学特性研究

国家自然科学基金

0+阅读 · 2014年12月31日

东亚地区沙尘气溶胶对云、降水及辐射的影响

国家自然科学基金

0+阅读 · 2014年12月31日

东亚东北海域云上气溶胶直接辐射强迫研究

国家自然科学基金

0+阅读 · 2013年12月31日

“喜胜忧”调节抑郁症患者负性认知偏向的神经机制研究

国家自然科学基金

0+阅读 · 2013年12月31日

基于WorldView-3和OP-ELM的矿化蚀变提取方法研究

国家自然科学基金

0+阅读 · 2013年12月31日

卫星观测研究气溶胶对中国降水垂直结构的影响

国家自然科学基金

0+阅读 · 2012年12月31日

乌鲁木齐市大气污染空间格局变化趋势及酸沉降的研究

国家自然科学基金

0+阅读 · 2011年12月31日

中国地区云水资源气候特征及其变化机理研究

国家自然科学基金

0+阅读 · 2008年12月31日

Synthesizing Permissive Winning Strategy Templates for Parity Games

Arxiv

0+阅读 · 2023年5月23日

Spatiotemporal Attention-based Semantic Compression for Real-time Video Recognition

Arxiv

0+阅读 · 2023年5月22日

On recoverability from failures in dual voting

Arxiv

0+阅读 · 2023年5月20日

Multimodal Prompting with Missing Modalities for Visual Recognition

Arxiv

11+阅读 · 2023年3月6日

Improving evidential deep learning via multi-task learning

Arxiv

11+阅读 · 2021年12月17日

Deep Long-Tailed Learning: A Survey

Arxiv

13+阅读 · 2021年10月9日

Open Domain Generalization with Domain-Augmented Meta-Learning

Arxiv

21+阅读 · 2021年4月8日

Transformer Tracking

Arxiv

17+阅读 · 2021年3月29日

MVFNet: Multi-View Fusion Network for Efficient Video Recognition

Arxiv

13+阅读 · 2021年1月5日

Video Captioning via Hierarchical Reinforcement Learning

Arxiv

20+阅读 · 2018年3月29日

VIP会员

文章信息

相关主题

相关VIP内容

【ICML2022】长尾识别中分布外检测的部分和非对称对比学习

【ICML2022】长尾识别中分布外检测的部分和非对称对比学习

专知会员服务

24+阅读 · 2022年7月5日

【CVPR 2022】基于灵活模态Transformer的人脸防伪 FM-ViT: Flexible Modal Vision Transformers for Face Anti-Spoofing

【CVPR 2022】基于灵活模态Transformer的人脸防伪 FM-ViT: Flexible Modal Vision Transformers for Face Anti-Spoofing

专知会员服务

17+阅读 · 2022年3月19日

【CVPR 2022】长尾视觉数据识别的嵌套式协同学习方法 Nested Collaborative Learning for Long-Tailed Visual Recognition

【CVPR 2022】长尾视觉数据识别的嵌套式协同学习方法 Nested Collaborative Learning for Long-Tailed Visual Recognition

专知会员服务

13+阅读 · 2022年3月19日

【ACMMM2021】密集对比视觉语言预训练

专知会员服务

13+阅读 · 2021年10月11日

[NeurIPS 2020 oral] 基于因果干预的弱监督语义分割

专知会员服务

47+阅读 · 2020年10月5日

【ACL2020】对抗性文本生成，Improving Adversarial Text Generation

专知会员服务

52+阅读 · 2020年5月5日

50+篇《神经架构搜索NAS》2020论文合集

专知会员服务

61+阅读 · 2020年3月19日

【CVPR2020】用于细粒度动作识别的多模式域自适应，Multi-Modal Domain Adaptation for Fine-Grained Action Recognition

【CVPR2020】用于细粒度动作识别的多模式域自适应，Multi-Modal Domain Adaptation for Fine-Grained Action Recognition

专知会员服务

78+阅读 · 2020年2月25日

【Google AI】开源NoisyStudent：自监督图像分类

【Google AI】开源NoisyStudent：自监督图像分类

专知会员服务

55+阅读 · 2020年2月18日

强化学习最新教程，17页pdf

强化学习最新教程，17页pdf

专知会员服务

181+阅读 · 2019年10月11日

热门VIP内容

开通专知VIP会员享更多权益服务

人工智能治理的未来

模态感知的特征匹配：单一模态与跨模态技术的全面综述

无监督行人重识别研究综述

【牛津博士论文】面向神经影像应用的可扩展且可解释的空间模型

相关资讯

VCIP 2022 Call for Demos

VCIP 2022 Call for Demos

CCF多媒体专委会

1+阅读 · 2022年6月6日

视频分析/多模态学习论文、代码、数据集大列表

视频分析/多模态学习论文、代码、数据集大列表

专知

57+阅读 · 2019年7月13日

【泡泡汇总】CVPR2019 SLAM Paperlist

【泡泡汇总】CVPR2019 SLAM Paperlist

泡泡机器人SLAM

14+阅读 · 2019年6月12日

强化学习三篇论文避免遗忘等

强化学习三篇论文避免遗忘等

CreateAMind

20+阅读 · 2019年5月24日

Hierarchically Structured Meta-learning

Hierarchically Structured Meta-learning

CreateAMind

27+阅读 · 2019年5月22日

强化学习的Unsupervised Meta-Learning

强化学习的Unsupervised Meta-Learning

CreateAMind

18+阅读 · 2019年1月7日

无监督元学习表示学习

无监督元学习表示学习

CreateAMind

27+阅读 · 2019年1月4日

Unsupervised Learning via Meta-Learning

Unsupervised Learning via Meta-Learning

CreateAMind

43+阅读 · 2019年1月3日

【泡泡一分钟】PathTrack：使用路径监督的快速轨迹标注方法（ICCV2017-28）

【泡泡一分钟】PathTrack：使用路径监督的快速轨迹标注方法（ICCV2017-28）

泡泡机器人SLAM

10+阅读 · 2018年5月26日

【泡泡一分钟】使用深度神经网络提取局部特征的大规模图像检索算法(ICCV-2)

【泡泡一分钟】使用深度神经网络提取局部特征的大规模图像检索算法(ICCV-2)

泡泡机器人SLAM

16+阅读 · 2018年2月10日

相关论文

Synthesizing Permissive Winning Strategy Templates for Parity Games

Arxiv

0+阅读 · 2023年5月23日

Spatiotemporal Attention-based Semantic Compression for Real-time Video Recognition

Arxiv

0+阅读 · 2023年5月22日

On recoverability from failures in dual voting

Arxiv

0+阅读 · 2023年5月20日

Multimodal Prompting with Missing Modalities for Visual Recognition

Arxiv

11+阅读 · 2023年3月6日

Improving evidential deep learning via multi-task learning

Arxiv

11+阅读 · 2021年12月17日

Deep Long-Tailed Learning: A Survey

Arxiv

13+阅读 · 2021年10月9日

Open Domain Generalization with Domain-Augmented Meta-Learning

Arxiv

21+阅读 · 2021年4月8日

Transformer Tracking

Arxiv

17+阅读 · 2021年3月29日

MVFNet: Multi-View Fusion Network for Efficient Video Recognition

Arxiv

13+阅读 · 2021年1月5日

Video Captioning via Hierarchical Reinforcement Learning

Arxiv

20+阅读 · 2018年3月29日

相关基金

网络图像标注中多视图半监督稀疏特征选择算法研究

国家自然科学基金

1+阅读 · 2015年12月31日

封闭空间中声源辐射阻抗特性研究

国家自然科学基金

0+阅读 · 2015年12月31日

多源卫星遥感反演气溶胶光学特性研究

国家自然科学基金

0+阅读 · 2014年12月31日

东亚地区沙尘气溶胶对云、降水及辐射的影响

国家自然科学基金

0+阅读 · 2014年12月31日

东亚东北海域云上气溶胶直接辐射强迫研究

国家自然科学基金

0+阅读 · 2013年12月31日

“喜胜忧”调节抑郁症患者负性认知偏向的神经机制研究

国家自然科学基金

0+阅读 · 2013年12月31日

基于WorldView-3和OP-ELM的矿化蚀变提取方法研究

国家自然科学基金

0+阅读 · 2013年12月31日

卫星观测研究气溶胶对中国降水垂直结构的影响

国家自然科学基金

0+阅读 · 2012年12月31日

乌鲁木齐市大气污染空间格局变化趋势及酸沉降的研究

国家自然科学基金

0+阅读 · 2011年12月31日

中国地区云水资源气候特征及其变化机理研究

国家自然科学基金

0+阅读 · 2008年12月31日

微信扫码咨询专知VIP会员