【CVPR 2022】采用稀疏Transformer的单步法三维物体检测器，Embracing Single Stride 3D Object Detector with Sparse Transformer - 专知VIP

会员服务 ·

1

CVPR 2022 · Transformer · Sparse Transformer · 三维物体检测 · Swin Transformer ·

2022 年 3 月 12 日

【CVPR 2022】采用稀疏Transformer的单步法三维物体检测器，Embracing Single Stride 3D Object Detector with Sparse Transformer

专知会员服务

专知，提供专业可信的知识分发服务，让认知协作更快更好！

Embracing Single Stride 3D Object Detector with Sparse Transformer

Lue Fan, Ziqi Pang, Tianyuan Zhang, Yu-Xiong Wang, Hang Zhao, Feng Wang, Naiyan Wang, Zhaoxiang Zhang

在自动驾驶场景中，相比于整个场景的尺度，单个物体的尺度通常很小。下图展示了COCO数据集和Waymo数据集上物体相对尺度的分布情况：

COCO和Waymo上物体相对尺度分布

这一特性往往被基于Pillar或者体素的检测器所忽略，它们通常借用了成熟的2D多尺度检测器的结构。基于这一考量，本文探索了单步长（无降采样）的检测器结构。如果简单地将卷积网络提升为单步长网络，会取得一定的性能提升，但是会带来感受野不足的问题以及巨大的计算量。为了得到一个高效高性能的单步长检测器，我们借用了当前流行的swin transformer的结构，舍弃了其多尺度的结构并且针对点云数据的特点将其稀疏化，我们将其命名为单步长稀疏Transformer（Single-stride Sparse Transformer, SST）。我们在当前最大的3D检测数据集Waymo Open Dataset上做了详尽的实验，从各个方面探讨了SST的特性，并取得了SoTA的性能，特别是在小物体上比之前的方法有了显著的提升（达到了83.8的Level 1 AP）。代码已开源在：

https://github.com/wuhuikai/DeepGuidedFilter

Sparse Attention结构设计

成为VIP会员查看完整内容

5

相关内容

CVPR 2022

CVPR 2022 将于2022年 6 月 21-24 日在美国的新奥尔良举行。CVPR是IEEE Conference on Computer Vision and Pattern Recognition的缩写，即IEEE国际计算机视觉与模式识别会议。该会议是由IEEE举办的计算机视觉和模式识别领域的顶级会议，会议的主要内容是计算机视觉与模式识别技术。

知识荟萃

精品入门和进阶教程、论文和代码整理等

更多

查看相关VIP内容、论文、资讯等

CVPR 2022 Oral | 南京大学AdaMixer：基于快速收敛查询的目标检测器

CVPR 2022 Oral | 南京大学AdaMixer：基于快速收敛查询的目标检测器

专知会员服务

11+阅读 · 2022年4月10日

【CVPR2022】CAT-Det:用于多模态三维物体检测的对比增强Transformer

【CVPR2022】CAT-Det:用于多模态三维物体检测的对比增强Transformer

专知会员服务

19+阅读 · 2022年4月7日

【CVPR2022】自动驾驶中的伪双目三维目标检测，Pseudo-Stereo for Monocular 3D Object Detection in Autonomous Driving

【CVPR2022】自动驾驶中的伪双目三维目标检测，Pseudo-Stereo for Monocular 3D Object Detection in Autonomous Driving

专知会员服务

18+阅读 · 2022年3月19日

CVPR2022 | Sparse Transformer刷新点云目标检测的SOTA

CVPR2022 | Sparse Transformer刷新点云目标检测的SOTA

专知会员服务

25+阅读 · 2022年3月9日

【AAAI2022】锚点DETR：基于transformer检测器的查询设计

【AAAI2022】锚点DETR：基于transformer检测器的查询设计

专知会员服务

13+阅读 · 2021年12月31日

【ICCV2021】基于Transformer 的神经绘画

专知会员服务

23+阅读 · 2021年9月20日

【CVPR2021】用Transformers无监督预训练进行目标检测

【CVPR2021】用Transformers无监督预训练进行目标检测

专知会员服务

58+阅读 · 2021年3月3日

【商汤科技】可变形Transformers端到端对象检测，Deformable DETR

【商汤科技】可变形Transformers端到端对象检测，Deformable DETR

专知会员服务

33+阅读 · 2020年10月11日

【ACL2020-亚马逊】Transformers多分辨率和多模态语音识别，Multiresolution and Multimodal Speech Recognition with Transformers

【ACL2020-亚马逊】Transformers多分辨率和多模态语音识别，Multiresolution and Multimodal Speech Recognition with Transformers

专知会员服务

15+阅读 · 2020年5月5日

【伯克利】再思考 Transformer中的Batch Normalization

【伯克利】再思考 Transformer中的Batch Normalization

专知会员服务

41+阅读 · 2020年3月21日

CVPR 2022 | Mobile-Former来了！微软提出：MobileNet+Transformer轻量化并行网络

CVPR 2022 | Mobile-Former来了！微软提出：MobileNet+Transformer轻量化并行网络

CVer

0+阅读 · 2022年4月3日

CVPR 2022 | 商汤&南洋理工开源PTTR：基于Transformer的3D点云目标跟踪网络

CVPR 2022 | 商汤&南洋理工开源PTTR：基于Transformer的3D点云目标跟踪网络

CVer

3+阅读 · 2022年3月31日

CVPR 2022 | GeoTransformer：基于Transformer的点云配准网络

CVPR 2022 | GeoTransformer：基于Transformer的点云配准网络

PaperWeekly

2+阅读 · 2022年3月30日

CVPR2022 | Sparse Transformer刷新点云目标检测的SOTA

CVPR2022 | Sparse Transformer刷新点云目标检测的SOTA

专知

2+阅读 · 2022年3月9日

当可变形注意力机制引入Vision Transformer

当可变形注意力机制引入Vision Transformer

极市平台

1+阅读 · 2022年1月23日

【AAAI2022】锚点DETR：基于transformer检测器的查询设计

【AAAI2022】锚点DETR：基于transformer检测器的查询设计

专知

0+阅读 · 2021年12月31日

初探Video Transformer（二）：谷歌开源更全面、高效的无卷积视频分类模型ViViT

初探Video Transformer（二）：谷歌开源更全面、高效的无卷积视频分类模型ViViT

极市平台

1+阅读 · 2021年12月30日

【商汤科技】可变形Transformers端到端对象检测，Deformable DETR

【商汤科技】可变形Transformers端到端对象检测，Deformable DETR

专知

18+阅读 · 2020年10月11日

何恺明团队开源3D目标检测新框架VoteNet：模型更简单、效率更高

何恺明团队开源3D目标检测新框架VoteNet：模型更简单、效率更高

AI前线

15+阅读 · 2019年9月1日

Focal Loss for Dense Object Detection

Focal Loss for Dense Object Detection

统计学习与视觉计算组

12+阅读 · 2018年3月15日

基于深度卷积神经网络的多源遥感图像时空融合方法研究

国家自然科学基金

3+阅读 · 2015年12月31日

基于框架提升变换的多源图像融合研究

国家自然科学基金

1+阅读 · 2015年12月31日

基于同步多双目立体视觉的高精度人体建模

国家自然科学基金

0+阅读 · 2014年12月31日

融合多尺度稀疏与稠密特征结构的透视不变图像匹配模型研究

国家自然科学基金

0+阅读 · 2014年12月31日

基于迭代支撑集检测的稀疏信号重构算法的研究和拓展

国家自然科学基金

0+阅读 · 2012年12月31日

地震波传播与成像保持效率的高精度算法的研究

国家自然科学基金

0+阅读 · 2012年12月31日

基于结构化稀疏的大场景高分辨SAR图像压缩感知

国家自然科学基金

0+阅读 · 2012年12月31日

基于压缩感知的稀疏阵列MIMO-SAR成像及动目标检测

国家自然科学基金

0+阅读 · 2012年12月31日

低速重载机械早期故障稀疏特征识别的研究

国家自然科学基金

0+阅读 · 2011年12月31日

基于密集图像/视频采样的三维重建技术研究

国家自然科学基金

0+阅读 · 2009年12月31日

Quantized Guessing Random Additive Noise Decoding

Arxiv

0+阅读 · 2022年4月19日

Shape-Aware Monocular 3D Object Detection

Arxiv

0+阅读 · 2022年4月19日

M$^2$BEV: Multi-Camera Joint 3D Detection and Segmentation with Unified Birds-Eye View Representation

Arxiv

0+阅读 · 2022年4月19日

Entropy-based Active Learning for Object Detection with Progressive Diversity Constraint

Arxiv

0+阅读 · 2022年4月17日

An Extendable, Efficient and Effective Transformer-based Object Detector

Arxiv

0+阅读 · 2022年4月17日

Efficient Spatial Representation and Routing of Deformable One-Dimensional Objects for Manipulation

Arxiv

0+阅读 · 2022年4月16日

A Keypoint-based Global Association Network for Lane Detection

Arxiv

0+阅读 · 2022年4月15日

Dense Learning based Semi-Supervised Object Detection

Arxiv

9+阅读 · 2022年4月15日

UP-DETR: Unsupervised Pre-training for Object Detection with Transformers

UP-DETR: Unsupervised Pre-training for Object Detection with Transformers

Arxiv

19+阅读 · 2020年11月18日

Object Detection in 20 Years: A Survey

Object Detection in 20 Years: A Survey

Arxiv

48+阅读 · 2019年5月13日

VIP会员

相关主题

Sparse Transformer

三维物体检测

Swin Transformer

相关VIP内容

CVPR 2022 Oral | 南京大学AdaMixer：基于快速收敛查询的目标检测器

CVPR 2022 Oral | 南京大学AdaMixer：基于快速收敛查询的目标检测器

专知会员服务

11+阅读 · 2022年4月10日

【CVPR2022】CAT-Det:用于多模态三维物体检测的对比增强Transformer

【CVPR2022】CAT-Det:用于多模态三维物体检测的对比增强Transformer

专知会员服务

19+阅读 · 2022年4月7日

【CVPR2022】自动驾驶中的伪双目三维目标检测，Pseudo-Stereo for Monocular 3D Object Detection in Autonomous Driving

【CVPR2022】自动驾驶中的伪双目三维目标检测，Pseudo-Stereo for Monocular 3D Object Detection in Autonomous Driving

专知会员服务

18+阅读 · 2022年3月19日

CVPR2022 | Sparse Transformer刷新点云目标检测的SOTA

CVPR2022 | Sparse Transformer刷新点云目标检测的SOTA

专知会员服务

25+阅读 · 2022年3月9日

【AAAI2022】锚点DETR：基于transformer检测器的查询设计

【AAAI2022】锚点DETR：基于transformer检测器的查询设计

专知会员服务

13+阅读 · 2021年12月31日

【ICCV2021】基于Transformer 的神经绘画

专知会员服务

23+阅读 · 2021年9月20日

【CVPR2021】用Transformers无监督预训练进行目标检测

【CVPR2021】用Transformers无监督预训练进行目标检测

专知会员服务

58+阅读 · 2021年3月3日

【商汤科技】可变形Transformers端到端对象检测，Deformable DETR

【商汤科技】可变形Transformers端到端对象检测，Deformable DETR

专知会员服务

33+阅读 · 2020年10月11日

【ACL2020-亚马逊】Transformers多分辨率和多模态语音识别，Multiresolution and Multimodal Speech Recognition with Transformers

【ACL2020-亚马逊】Transformers多分辨率和多模态语音识别，Multiresolution and Multimodal Speech Recognition with Transformers

专知会员服务

15+阅读 · 2020年5月5日

【伯克利】再思考 Transformer中的Batch Normalization

【伯克利】再思考 Transformer中的Batch Normalization

专知会员服务

41+阅读 · 2020年3月21日

热门VIP内容

开通专知VIP会员享更多权益服务

【牛津博士论文】零样本强化学习综述

《美军条令：陆军指挥官与规划人员地理空间指南》60页

战术边缘指挥控制：防务面临的核心挑战

迈向开放世界检测：综述

相关资讯

CVPR 2022 | Mobile-Former来了！微软提出：MobileNet+Transformer轻量化并行网络

CVPR 2022 | Mobile-Former来了！微软提出：MobileNet+Transformer轻量化并行网络

CVer

0+阅读 · 2022年4月3日

CVPR 2022 | 商汤&南洋理工开源PTTR：基于Transformer的3D点云目标跟踪网络

CVPR 2022 | 商汤&南洋理工开源PTTR：基于Transformer的3D点云目标跟踪网络

CVer

3+阅读 · 2022年3月31日

CVPR 2022 | GeoTransformer：基于Transformer的点云配准网络

CVPR 2022 | GeoTransformer：基于Transformer的点云配准网络

PaperWeekly

2+阅读 · 2022年3月30日

CVPR2022 | Sparse Transformer刷新点云目标检测的SOTA

CVPR2022 | Sparse Transformer刷新点云目标检测的SOTA

专知

2+阅读 · 2022年3月9日

当可变形注意力机制引入Vision Transformer

当可变形注意力机制引入Vision Transformer

极市平台

1+阅读 · 2022年1月23日

【AAAI2022】锚点DETR：基于transformer检测器的查询设计

【AAAI2022】锚点DETR：基于transformer检测器的查询设计

专知

0+阅读 · 2021年12月31日

初探Video Transformer（二）：谷歌开源更全面、高效的无卷积视频分类模型ViViT

初探Video Transformer（二）：谷歌开源更全面、高效的无卷积视频分类模型ViViT

极市平台

1+阅读 · 2021年12月30日

【商汤科技】可变形Transformers端到端对象检测，Deformable DETR

【商汤科技】可变形Transformers端到端对象检测，Deformable DETR

专知

18+阅读 · 2020年10月11日

何恺明团队开源3D目标检测新框架VoteNet：模型更简单、效率更高

何恺明团队开源3D目标检测新框架VoteNet：模型更简单、效率更高

AI前线

15+阅读 · 2019年9月1日

Focal Loss for Dense Object Detection

Focal Loss for Dense Object Detection

统计学习与视觉计算组

12+阅读 · 2018年3月15日

相关基金

基于深度卷积神经网络的多源遥感图像时空融合方法研究

国家自然科学基金

3+阅读 · 2015年12月31日

基于框架提升变换的多源图像融合研究

国家自然科学基金

1+阅读 · 2015年12月31日

基于同步多双目立体视觉的高精度人体建模

国家自然科学基金

0+阅读 · 2014年12月31日

融合多尺度稀疏与稠密特征结构的透视不变图像匹配模型研究

国家自然科学基金

0+阅读 · 2014年12月31日

基于迭代支撑集检测的稀疏信号重构算法的研究和拓展

国家自然科学基金

0+阅读 · 2012年12月31日

地震波传播与成像保持效率的高精度算法的研究

国家自然科学基金

0+阅读 · 2012年12月31日

基于结构化稀疏的大场景高分辨SAR图像压缩感知

国家自然科学基金

0+阅读 · 2012年12月31日

基于压缩感知的稀疏阵列MIMO-SAR成像及动目标检测

国家自然科学基金

0+阅读 · 2012年12月31日

低速重载机械早期故障稀疏特征识别的研究

国家自然科学基金

0+阅读 · 2011年12月31日

基于密集图像/视频采样的三维重建技术研究

国家自然科学基金

0+阅读 · 2009年12月31日

相关论文

Quantized Guessing Random Additive Noise Decoding

Arxiv

0+阅读 · 2022年4月19日

Shape-Aware Monocular 3D Object Detection

Arxiv

0+阅读 · 2022年4月19日

M$^2$BEV: Multi-Camera Joint 3D Detection and Segmentation with Unified Birds-Eye View Representation

Arxiv

0+阅读 · 2022年4月19日

Entropy-based Active Learning for Object Detection with Progressive Diversity Constraint

Arxiv

0+阅读 · 2022年4月17日

An Extendable, Efficient and Effective Transformer-based Object Detector

Arxiv

0+阅读 · 2022年4月17日

Efficient Spatial Representation and Routing of Deformable One-Dimensional Objects for Manipulation

Arxiv

0+阅读 · 2022年4月16日

A Keypoint-based Global Association Network for Lane Detection

Arxiv

0+阅读 · 2022年4月15日

Dense Learning based Semi-Supervised Object Detection

Arxiv

9+阅读 · 2022年4月15日

UP-DETR: Unsupervised Pre-training for Object Detection with Transformers

UP-DETR: Unsupervised Pre-training for Object Detection with Transformers

Arxiv

19+阅读 · 2020年11月18日

Object Detection in 20 Years: A Survey

Object Detection in 20 Years: A Survey

Arxiv

48+阅读 · 2019年5月13日

微信扫码咨询专知VIP会员