通用汽车最新提出:3D车道线检测新方法

2020 年 5 月 16 日 计算机视觉life

点击上方“计算机视觉life”,选择“星标”

快速获得最新干货

本文作者:黄浴

https://zhuanlan.zhihu.com/p/133623737

本文已由原作者授权,不得二次转载

2020年3月11日GM以色列研发中心在arXiv上传论文“Semi-Local 3D Lane Detection and Uncertainty Estimation”。

论文链接:https://arxiv.org/abs/2003.05257


摘要:本文提出了一种基于相机的新型DNN方法,用于带不确定性估计的3D车道线检测。该方法基于半局部BEV(鸟瞰视角)的网格表示形式,其将车道线分解为简单车道线段。该方法结合了线段学习的参数化模型和聚类线段成为全车道线的深度特征嵌入。这种结合可以将该方法推广到复杂的车道拓扑结构、曲率和曲面几何。此外,该方法是第一个为车道线检测任务提供基于学习估计不确定性的方法。

如图是有不确定性估计网络的基于摄像机3-D车道线检测示意图。该方法适用于“鸟瞰视角(Bird Eye View)”透视图,该视图被栅格化为粗网格。输出所有网格的参数化3-D曲线表示,然后处理形成整个3-D车道曲线以及检测的不确定性估计。

假设通过每个网格的车道线段很简单,用低维参数模型表示。具体而言,每个网格均包含一条线段,该线段的参数包括距网格中心偏移、方向和距鸟瞰视角平面的高度偏移。这种半局部网格表示位于从全局表示(整个通道)到局部表示(像素级别)之间的连续变化。这种基于分段的解决方案,每个网格输出比单个像素更具信息性,它可以推理局部车道线结构,只是不像全局解决方案那样受限,因为全局解决方案必须获取整个车道的拓扑、曲率和表面几何的复杂性。

该表示将车道曲线细分为多个车道线段,但未明确获取它们之间的任何关系。相邻的网格将具有重叠的感受野并产生相关结果,但是没有捕获多个网格表示的是同一车道的事实。为了生成完整的车道曲线,文中学习了每个网格的嵌入,其沿着车道满足全局一致性。这样,可以将小车道线段聚类成一个完整的曲线。

此外,通过网络输出建模为高斯分布并估计其均值和方差值,可以实现不确定性估计。对每个车道线段参数操作,将其组合在一起,对每个车道线的点生成最终的协方差矩阵。与沿着网格进行局部学习的线段参数不同,这种方法训练不确定性所需的经验误差,取决于组成整个车道的所有网格并全局进行推理。

如图是网络结构图。该网络由两个处理流水线组成:图像视图和鸟瞰(BEV)视图。图像视图编码器由ResNet块组成。BEV主干由投影图像视图的特征图组成,并与来自前一个块的卷积投影特征图拼接。最终BEV特征图是生成局部车道线段的车道线预测头输入、将这些线段聚类到整个车道的全局嵌入、以及依赖于局部网格和整个车道曲线的车道点位置不确定性。

网络的输入是单目图像。该方法采用了该团队以前提出的双途径主干方法【1】。上一个工作【1】使用编码器和反透视映射(IPM)模块将特征图投影到鸟瞰图(BEV)。如图所示。

投影应用相机俯仰角ϕ和高度h定义的单应变换(homography),将图像平面映射到道路平面,如图所示。最终BEV特征图在空间上分为由W×H个非重叠网格组成的网格G。与以前方法【1】相似,投影可确保BEV特征图中的每个像素对应于预定义的道路位置,与摄像机的内参数和外部姿态无关。

假设通过每个网格的车道线可以拟合为一个线段。具体地说,网络针对每个网格回归三个参数:相对于网格中心的横向偏移距离,直线角度和高度偏移。除了这些参数之外,网络还预测二值分类分数,该分数指示车道与特定网格相交的概率。将网格相交的车道线投影到道路平面后,用GT车道线点把网格相交的车道线段近似为直线,可计算出偏移量和角度,即GT回归的目标。

以下是预测模型训练的损失函数:

其中

以下是车道线聚类的全局嵌入所采用的鉴别损失(discriminative push-pull loss):

其中

最后,要将BEV平面的车道线点转换到摄像头坐标系:

这是一些实验结果:GT(红色)、【1】方法(青色)和本文方法(蓝色)的比较。

注明:同时,大家也可以参考百度阿波罗发表的3D车道线检测文章【2】。

参考文献

[1] Garnett, N., Cohen, R., Pe’er, T., Lahav, R., Levi, D. ”3D-lanenet: end-to-end 3d multiple lane detection“,ICCV 2019.

[2] Y Guo et al., "Gen-LaneNet: A Generalized and Scalable Approach for 3D Lane Detection", arXiv 2003.10656, March 24, 2020.


交流群

欢迎加入公众号读者群一起和同行交流,目前覆盖SLAM、三维视觉、传感器自动驾驶、计算摄影、检测、分割、识别、医学影像、GAN算法竞赛等微信群,请扫描下面微信号加群,备注:”昵称+学校/公司+研究方向“,例如:”张三 + 上海交大 + 视觉SLAM“。请按照格式备注,否则不予通过。添加成功后会根据研究方向邀请进入相关微信群。请勿在群内发送广告,否则会请出群,谢谢理解~


投稿、合作也欢迎联系:simiter@126.com

好赞!我看完啦  

登录查看更多
2

相关内容

CVPR 2020 最佳论文与最佳学生论文!
专知会员服务
34+阅读 · 2020年6月17日
最新《深度学习自动驾驶》技术综述论文,28页pdf
专知会员服务
153+阅读 · 2020年6月14日
3D目标检测进展综述
专知会员服务
187+阅读 · 2020年4月24日
专知会员服务
31+阅读 · 2020年4月24日
CVPR2020 | 商汤-港中文等提出PV-RCNN:3D目标检测新网络
专知会员服务
43+阅读 · 2020年4月17日
【CVPR2020-谷歌】多目标(车辆)跟踪与检测框架 RetinaTrack
专知会员服务
44+阅读 · 2020年4月10日
【泡泡一分钟】基于几何约束的单目视觉里程计尺度恢复
ECCV 2018 | Bi-box行人检测:‘行人遮挡’为几何?
极市平台
13+阅读 · 2018年9月30日
Clustered Object Detection in Aerial Images
Arxiv
5+阅读 · 2019年8月27日
Mesh R-CNN
Arxiv
4+阅读 · 2019年6月6日
DPOD: Dense 6D Pose Object Detector in RGB images
Arxiv
5+阅读 · 2019年2月28日
Arxiv
10+阅读 · 2019年1月24日
Self-Driving Cars: A Survey
Arxiv
41+阅读 · 2019年1月14日
3D-LaneNet: end-to-end 3D multiple lane detection
Arxiv
7+阅读 · 2018年11月26日
VIP会员
相关论文
Clustered Object Detection in Aerial Images
Arxiv
5+阅读 · 2019年8月27日
Mesh R-CNN
Arxiv
4+阅读 · 2019年6月6日
DPOD: Dense 6D Pose Object Detector in RGB images
Arxiv
5+阅读 · 2019年2月28日
Arxiv
10+阅读 · 2019年1月24日
Self-Driving Cars: A Survey
Arxiv
41+阅读 · 2019年1月14日
3D-LaneNet: end-to-end 3D multiple lane detection
Arxiv
7+阅读 · 2018年11月26日
Top
微信扫码咨询专知VIP会员