Although lane detection methods have shown impressive performance in real-world scenarios, most of methods require post-processing which is not robust enough. Therefore, end-to-end detectors like DEtection TRansformer(DETR) have been introduced in lane detection. However, one-to-one label assignment in DETR can degrade the training efficiency due to label semantic conflicts. Besides, positional query in DETR is unable to provide explicit positional prior, making it difficult to be optimized. In this paper, we present the One-to-Several Transformer(O2SFormer). We first propose the one-to-several label assignment, which combines one-to-one and one-to-many label assignments to improve the training efficiency while keeping end-to-end detection. To overcome the difficulty in optimizing one-to-one assignment. We further propose the layer-wise soft label which adjusts the positive weight of positive lane anchors across different decoder layers. Finally, we design the dynamic anchor-based positional query to explore positional prior by incorporating lane anchors into positional query. Experimental results show that O2SFormer significantly speeds up the convergence of DETR and outperforms Transformer-based and CNN-based detectors on the CULane dataset. Code will be available athttps://github.com/zkyseu/O2SFormer.


翻译:虽然车道检测方法在实际场景中表现出了出色的性能,但是大多数方法都需要后处理,这使得方法不够稳健。因此,端到端检测器如DEtection TRansformer(DETR)被引入到车道检测中。然而,在DETR中,一对一的标签分配可能会由于标签语义冲突而降低训练效率。此外,DETR中的位置查询无法提供明确的位置先验,这使得其难以优化。在本文中,我们提出了一种一对多Transformer(O2SFormer)。我们首先提出了一对多的标签分配方法,将一对一和一对多的标签分配方法相结合,以提高训练效率,同时保持端到端检测。为了克服一对一分配中的优化困难,我们进一步提出了层次软标签,通过调整正向车道锚点在不同解码器层中的正向权重来改善效果。最后,我们设计了基于动态锚点的位置查询方法,将车道锚点用于位置查询,以探索位置先验。实验结果表明,O2SFormer可以显著加速DETR的收敛速度,并在CULane数据集上优于基于Transformer和CNN的检测器。代码将在https://github.com/zkyseu/O2SFormer上公开发布。

0
下载
关闭预览

相关内容

CVPR2022 | 一种适用于密集场景的渐进式端到端目标检测器
【AAAI2022】锚点DETR:基于transformer检测器的查询设计
专知会员服务
12+阅读 · 2021年12月31日
【ICML2020】小样本目标检测
专知会员服务
90+阅读 · 2020年6月2日
BEVFormer:基于Transformer的自动驾驶BEV纯视觉感知
Hierarchically Structured Meta-learning
CreateAMind
23+阅读 · 2019年5月22日
【泡泡一分钟】RoomNet:端到端房屋布局估计
泡泡机器人SLAM
18+阅读 · 2018年12月4日
Focal Loss for Dense Object Detection
统计学习与视觉计算组
11+阅读 · 2018年3月15日
【推荐】YOLO实时目标检测(6fps)
机器学习研究会
20+阅读 · 2017年11月5日
国家自然科学基金
0+阅读 · 2014年12月31日
国家自然科学基金
1+阅读 · 2013年12月31日
国家自然科学基金
0+阅读 · 2012年12月31日
国家自然科学基金
0+阅读 · 2012年12月31日
国家自然科学基金
0+阅读 · 2011年12月31日
国家自然科学基金
0+阅读 · 2008年12月31日
Arxiv
11+阅读 · 2022年3月16日
Arxiv
13+阅读 · 2021年3月3日
Arxiv
11+阅读 · 2019年4月15日
Arxiv
12+阅读 · 2019年4月9日
Arxiv
10+阅读 · 2019年1月24日
Arxiv
19+阅读 · 2018年5月17日
VIP会员
相关VIP内容
CVPR2022 | 一种适用于密集场景的渐进式端到端目标检测器
【AAAI2022】锚点DETR:基于transformer检测器的查询设计
专知会员服务
12+阅读 · 2021年12月31日
【ICML2020】小样本目标检测
专知会员服务
90+阅读 · 2020年6月2日
相关论文
Arxiv
11+阅读 · 2022年3月16日
Arxiv
13+阅读 · 2021年3月3日
Arxiv
11+阅读 · 2019年4月15日
Arxiv
12+阅读 · 2019年4月9日
Arxiv
10+阅读 · 2019年1月24日
Arxiv
19+阅读 · 2018年5月17日
相关基金
国家自然科学基金
0+阅读 · 2014年12月31日
国家自然科学基金
1+阅读 · 2013年12月31日
国家自然科学基金
0+阅读 · 2012年12月31日
国家自然科学基金
0+阅读 · 2012年12月31日
国家自然科学基金
0+阅读 · 2011年12月31日
国家自然科学基金
0+阅读 · 2008年12月31日
Top
微信扫码咨询专知VIP会员