嬴彻科技拿下SemanticKITTI榜单两项第一

会员服务 ·

嬴彻科技拿下SemanticKITTI榜单两项第一

2020 年 12 月 1 日 量子位

萧箫发自凹非寺
量子位报道 | 公众号 QbitAI

在感知算法领域，嬴彻科技近期凭借「精准语义分割3D感知技术」，在SemanticKITTI 的「语义分割」和「全景语义分割」两项任务中夺得第一，领先于来自MIT、芝加哥大学、阿里、华为等全球各地的100多支队伍。

语义分割是自动驾驶感知算法的关键技术，能识别出各种场景物体，告诉汽车“身边有什么危险”，从而保障出行安全。

KITTI是目前发布最早、影响力最大的自动驾驶算法评测数据集。

SemanticKITTI是KITTI在语义分割方向的子数据集，是激光雷达语义分割的重要基准之一。为了推动激光雷达的语义分割研究，SemanticKITTI举办了3D语义分割比赛，包括「语义分割」和「全景语义分割」等任务。

任务一「语义分割」，要求能准确识别出场景中的物体类型（如汽车、行人）；任务二「全景语义分割」，要求对场景中的所有物体都进行精确个体级辨识，即类型基础上，为每个物体赋予1个ID（如1号车、2号车……）。

△ 榜首的Cylinder3D & noah820为来自嬴彻科技的两支参赛团队

相较于传统的激光雷达语义分割算法，嬴彻这次做出了哪些突破？来自嬴彻Inceptio X-Lab的李伟博士，与量子位详细分享了其中的技术原理。

1、从“划井字”到“切蛋糕”，使点云分割更均衡

在点云分割上，算法实现了「圆柱坐标系下的体素划分」。

李伟博士用“划井字”和“切蛋糕”，对这一突破进行了类比。传统激光雷达点云的分割方法，就像是正正经经划“井”字一样，将空间划成多个方块，但是单个体素块内的点云就会出现近多远少、分布不均衡的问题；

那么，“圆柱坐标系下的体素划分”，就是从激光雷达扇形扫描的特性出发，即更加符合点云数据的分布特点，以“切蛋糕”的方式进行分区。近处密集的点，单元划分空间也小；远处稀疏的点，单元划分空间就更大，体素块内点云更均匀。

2、“核骨架增强”，揭开半遮半掩的面纱

做目标检测的小伙伴们都有过这样的经历：一个完整的物体，AI通常都能检测出来。

然而如果这个物体“遮遮掩掩”，检测效果就大打折扣。

通过识别这个物体的核骨架（skeleton of the kernel），就能够拨开面纱检测出物体。

为达到这个目的，在数据处理的部分，算法中新增了「非对称3维神经网络模块」。

这一模块，在水平和垂直两个方向分别增强卷积核，能更好地匹配驾驶场景下的物体形状分布，从多角度更全面地看到每个点云的状态，即使在遮挡或是稀疏点云输入的情况下，也能准确地辨别物体。

3、从单一划区到块点结合，精细区分小物体

区块检测是目前常用的方法，缺点是不同类别的点云有可能被划分到一个体素块内，物体分割的细节容易丢失，准确性降低。

嬴彻在划区的基础上，再进行「单个三维点云级别的分割」，获得精细细节。如下图所示，嬴彻的方法有效在一个小区域中继续精确分割出更小的物体。

块点结合检测的效果，不仅辨识精度更高，且更易于小物体的识别，极大地提升了高速行车的安全性。

嬴彻此次发布的「精准语义分割3D感知技术」，基于激光雷达的感知算法，与纯摄像头方案形成双重冗余，满足在多场景下、尤其是夜晚的感知需求。

此外，这一算法还能更鲁棒、更及时的感知高速公路上突发遇到的小物体，如突然蹿出的小动物，从而更及时做出路径规划，确保高速行车安全。

比赛链接：
https://competitions.codalab.org/competitions/24025#results
https://competitions.codalab.org/competitions/20331#results
http://www.semantic-kitti.org/

paper链接：

https://arxiv.org/abs/2011.10033

https://arxiv.org/abs/2011.11964

code链接：

https://github.com/xinge008/Cylinder3D

— 完 —

本文系网易新闻•网易号特色内容激励计划签约账号【量子位】原创内容，未经账号授权，禁止随意转载。

量子位 QbitAI · 头条号签约作者

վ'ᴗ' ի 追踪AI技术和产品新动态

一键三连「分享」、「点赞」和「在看」

科技前沿进展日日相见~

登录查看更多

相关内容

语义分割

关注 263

语义分割，在机器学习上，多指对一段文本或者一张图片，提取其中有意义的部分，我们将这些有意义的部分称为语义单元，将这些语义单元提取出来的过程，称为语义分割。

全景分割研究综述

专知会员服务

33+阅读 · 2020年12月25日

【NeurIPS 2020】依图推出预训练语言理解模型ConvBERT

专知会员服务

12+阅读 · 2020年11月13日

CVPR2020 | 商汤-港中文等提出PV-RCNN：3D目标检测新网络

专知会员服务

45+阅读 · 2020年4月17日

[CVPR 2020 Oral-牛津] RandLA-Net:大场景三维点云语义分割新框架

专知会员服务

26+阅读 · 2020年3月15日

2019中国硬科技发展白皮书 193页

专知会员服务

86+阅读 · 2019年12月13日

超过Google，微信AI在NLP领域又获一项世界第一

量子位

6+阅读 · 2019年10月19日

照片上的人出来了！云从3D人体重建登顶三项榜单，一张照片就能生成3D形象

量子位

4+阅读 · 2019年3月20日

深度长文：NLP的巨人肩膀（上）

PaperWeekly

3+阅读 · 2018年12月10日

2017年中国互联网“独角兽俱乐部”榜单发布，半数被BAT投资，人工智能新晋4家

新智元

4+阅读 · 2018年2月8日

自然语言推理新突破，地平线斩获三个世界第一

HorizonRobotics

6+阅读 · 2017年9月22日

Lévy Adaptive B-spline Regression via Overcomplete Systems

Arxiv

0+阅读 · 2021年1月28日

GREASE: A Generative Model for Relevance Search over Knowledge Graphs

Arxiv

4+阅读 · 2019年10月11日

A Sketch-Based System for Semantic Parsing

Arxiv

4+阅读 · 2019年9月12日

Semantically Enhanced Models for Commonsense Knowledge Acquisition

Arxiv

3+阅读 · 2018年9月27日

SAR: Semantic Analysis for Recommendation

Arxiv

6+阅读 · 2017年12月2日

VIP会员