CBGS : 三维点云物体检测的类平衡分组和采样(新自动驾驶数据集nScenes第一名算法)

2019 年 9 月 11 日 CVer

点击上方“CVer”,选择加"星标"或“置顶”

重磅干货,第一时间送达

作者 Geek

https://zhuanlan.zhihu.com/p/80086809

本文已由作者授权,未经允许,不得二次转载


《Class-balanced Grouping and Sampling for Point Cloud 3D Object Detection》

一、摘要:

本篇文章为新自动驾驶数据集nuScenes第一名的算法。作者利用稀疏3D卷积来提取丰富的语义特征,然后将其送入类平衡多头网络以执行3D物体检测。以处理在自动驾驶场景中,类不平衡问题,作者设计了一个类平衡采样和增强策略以生成更平衡的数据,并提出了一个平衡的分组头来提高类别的性能类似的形状。基于比赛结果,我们的方法所有指标均大幅提升PointPillars 基线,在nuScenes数据集上实现最先进的(SOTA)检测性能。

二、主要贡献:

传统我们做kitti数据集只有三个类别(车、人、骑行者),而在Nuscenes中,类别上升到十类,且是以长尾形式存在(大量的车,小量的骑行者),这种数据型态更符合真实驾驶场景,也因此产生出类别不均衡的问题。

本篇文章,作者试图解决Nuscenes中,类别不均衡的问题,具体解决方法有二大点:

一、我们提出了类平衡采样策略来处理,nuScenes数据集中的极端不平衡问题

二、我们设计了一个多组头网络,使类似形状或大小的类别可以从中受益彼此,以及不同形状或大小的类别停止互相干扰。

三、主要方法:

Input阶段:

两种策略解决样本不均衡问题:

一、DS Sampling (作者提出)

基本思想是把占比较小的类别进行复制,制作出较大数据集,然后针对每个类别用固定比例random sample这个大的数据集,组合出最终数据集,最终数据集的类别密度(类别数量/样本总数)是相近的,这方法可以减缓样本不平均问题。

二、GT-AUG (SECOND引用)

把某一样本中的物体点云数据,放到另一个样本中,过程中需要计算摆放位置是否合理。(详见原文)


Network阶段 (3D特徵提取网络、RPN):

使用稀疏3D卷积和skip connection来构建类似resnet的体系结构3D特征提取器网络。这边注意三维的卷积完,会从原本的N ×C ×H ×W变成N× l × C/m × H/n × W/n,五维的没办法用二维RPN进行操作,所以作者讲 l × C/m合并,变回四维,最后使用RPN是类似于VoxelNet的RPN结构(跟SSD类似),先用二维卷积降维三次,才分别反卷积回原大小,Concate在一起,有点类似特徵金字塔的味道,但最后输出是Concate所有从低到高层次的特徵。

(这边说的RPN其实只是RPN head的部份,真正回归object在下一阶段,此阶段是把特徵从3维做成2维让下一阶段好操作)

Head階段(Class-balanced Grouping) :

为了解决类別不均衡问题,作者提出Class Grouping的概念,简而言之,将相似形状的类別分成一个群(Group),让该群中样本数量较多的类去提升样本数量较少的类的精度,而每个Group之间的总数量也接近,如此一来,网络在学习时,就能够减缓数量较多类别有主导整个网络的问题。

二个重点:

  • 手动区分出每个Group中,该Group包含的类别有哪些,主要是透过样本总数与形状进行分组

  • Group之间样本总数量相近

目标函数(Loss Function) :

目标函数部分参照SECOND, 常见的问题如物体正反向问题(朝向相反),在这部份做了小改进,额外加入自己设计的朝向性分类(这部份没写公式,不确定是二分类正反,还是多一个朝向性分支)

为了降低学习难度,使用了anchor机制,其他设置都SECOND类似,Focal loss做Classification, Smoothl1回归x, y, z, l, w, h, yaw, vx, vy,值得一提的是,每个分支用Uniform Scaling做学习权重。

其他训练调参数细节详见论文。

四、实验结果:

直上结果,目前NuScence第一名,mAP超Pointpillar12个点。


Ablation studies比较有意思,可以看每个trick具体涨点多少,本篇文章重点就DB-Sample,涨点还算是明显。

五、结论:

新的自动驾驶数据集nuScence与kitti其中一个不同点是类别变多,且其类别样本不平均,本篇文章主要提出新的类别不均衡解决方法,透过扩增数据集后,在随机采样以平衡较少的类别,并且将形状类似的分为一组,样本较少的类别能被形状类似的样本较多类别提升精度。

心得(填坑):

  1. 本文提出的方法透过较多先验知识来完成,包括类别形状,类别数量等,未来是否能考虑用无监督的方法来学习分组,

2. 进一步探讨解决样本不均衡问题中,DB-sample中相比OHEM、Focal loss等方法有什么优势与劣势,个人觉得DB-sample相比其他解决样本不均衡的方法相对比较手工且暴力。

重磅!CVer-目标检测交流群成立啦


扫码添加CVer助手,可申请加入CVer-目标检测交流群,同时还可以加入目标检测、图像分割、目标跟踪、人脸检测&识别、OCR、姿态估计、超分辨率、SLAM、医疗影像、Re-ID、GAN、NAS、深度估计、自动驾驶、强化学习、车道线检测和模型剪枝&压缩等群。一定要备注:研究方向+地点+学校/公司+昵称(如目标检测+上海+上交+卡卡)

▲长按加群


▲长按关注我们

麻烦给我一个在看!

登录查看更多
1

相关内容

【CVPR2020】时序分组注意力视频超分
专知会员服务
31+阅读 · 2020年7月1日
3D目标检测进展综述
专知会员服务
193+阅读 · 2020年4月24日
CVPR2020 | 商汤-港中文等提出PV-RCNN:3D目标检测新网络
专知会员服务
44+阅读 · 2020年4月17日
【泡泡图灵智库】体积实例感知语义建图与3D对象发现
泡泡机器人SLAM
22+阅读 · 2019年9月7日
CVPR2019 | FSAF:来自CMU的Single-Shot目标检测算法
极市平台
41+阅读 · 2019年3月8日
ECCV 2018 | Bi-box行人检测:‘行人遮挡’为几何?
极市平台
13+阅读 · 2018年9月30日
用于RGB-D室内场景语义分割的门式融合局部感知反卷积网络
机器学习研究会
7+阅读 · 2017年10月30日
EfficientDet: Scalable and Efficient Object Detection
Arxiv
6+阅读 · 2019年11月20日
Arxiv
12+阅读 · 2019年1月24日
Arxiv
5+阅读 · 2018年5月16日
Arxiv
3+阅读 · 2018年3月5日
Arxiv
5+阅读 · 2016年12月29日
VIP会员
Top
微信扫码咨询专知VIP会员