CLONeR：用于占据网格辅助的神经表示的相机-Lidar融合 (CLONeR: Camera-Lidar Fusion for Occupancy Grid-aided Neural Representations) - 专知论文

会员服务 ·

0

NeRF · LIDAR · 网格 · 稀疏 · 光流场 ·

2023 年 4 月 4 日

CLONeR: Camera-Lidar Fusion for Occupancy Grid-aided Neural Representations

翻译：CLONeR：用于占据网格辅助的神经表示的相机-Lidar融合

Alexandra Carlson,Manikandasriram Srinivasan Ramanagopal,Nathan Tseng,Matthew Johnson-Roberson,Ram Vasudevan,Katherine A. Skinner

from arxiv, first two authors equally contributed

Recent advances in neural radiance fields (NeRFs) achieve state-of-the-art novel view synthesis and facilitate dense estimation of scene properties. However, NeRFs often fail for large, unbounded scenes that are captured under very sparse views with the scene content concentrated far away from the camera, as is typical for field robotics applications. In particular, NeRF-style algorithms perform poorly: (1) when there are insufficient views with little pose diversity, (2) when scenes contain saturation and shadows, and (3) when finely sampling large unbounded scenes with fine structures becomes computationally intensive. This paper proposes CLONeR, which significantly improves upon NeRF by allowing it to model large outdoor driving scenes that are observed from sparse input sensor views. This is achieved by decoupling occupancy and color learning within the NeRF framework into separate Multi-Layer Perceptrons (MLPs) trained using LiDAR and camera data, respectively. In addition, this paper proposes a novel method to build differentiable 3D Occupancy Grid Maps (OGM) alongside the NeRF model, and leverage this occupancy grid for improved sampling of points along a ray for volumetric rendering in metric space. Through extensive quantitative and qualitative experiments on scenes from the KITTI dataset, this paper demonstrates that the proposed method outperforms state-of-the-art NeRF models on both novel view synthesis and dense depth prediction tasks when trained on sparse input data.

翻译：神经光流场（NeRFs）的最新进展实现了最先进的新视角合成，并促进了对场景属性的密集估计。然而，对于从稀疏视图捕获的场景内容集中在摄像机远处的大型，无界场景，NeRF经常失败，这是典型的领域机器人应用。特别是，当视图不足且姿态多样性不足时，当场景包含饱和和阴影时，以及当对大型无边界场景进行细粒度采样以获得细节结构变得计算密集时，类似NeRF的算法效果往往不佳。该论文提出了CLONeR，通过允许NeRF建模大型戶外驾驶场景，从而显着改进了NeRF。这是通过将NeRF框架中的占用和颜色学习解耦为分别使用LiDAR和相机数据训练的多层感知机（MLP）实现的。此外，本文提出了一种新的方法，在NeRF模型旁边构建可微分的三维占用网格映射（OGM），并利用此占用网格来改进度量空间中的体积渲染下沿射线采样的精度。通过对KITTI数据集中的场景进行广泛的定量和定性实验，本文证明了所提出的方法在从稀疏输入数据进行训练时在新视角合成和密集深度预测任务方面优于最先进的NeRF模型。

0

相关内容

NeRF

如何生成复杂逼真3D场景？CVPR2023英伟达等提出《分层潜在扩散模型》生成复杂的开放世界3D场景

如何生成复杂逼真3D场景？CVPR2023英伟达等提出《分层潜在扩散模型》生成复杂的开放世界3D场景

专知会员服务

48+阅读 · 2023年4月20日

【CVPR2022】端到端实时矢量边缘提取（E2EC）

【CVPR2022】端到端实时矢量边缘提取（E2EC）

专知会员服务

16+阅读 · 2022年4月14日

【CVPR 2022】基于实例深度估计的统一深度感知全景分割 PanopticDepth: Per-Instance Depth Estimation for Unified Depth-Aware Panoptic Segmentation

【CVPR 2022】基于实例深度估计的统一深度感知全景分割 PanopticDepth: Per-Instance Depth Estimation for Unified Depth-Aware Panoptic Segmentation

专知会员服务

18+阅读 · 2022年3月19日

【斯坦福CVPR2022】EG3D:高效的几何感知三维生成对抗网络，EG3D: Efficient Geometry-aware 3D Generative Adversarial Networks

【斯坦福CVPR2022】EG3D:高效的几何感知三维生成对抗网络，EG3D: Efficient Geometry-aware 3D Generative Adversarial Networks

专知会员服务

18+阅读 · 2022年3月15日

【南洋理工大学Chuanxia Zheng博士论文】基于深度生成学习的逼真图像合成，197页pdf，Synthesizing Photorealistic Images with Deep Generative Learning

【南洋理工大学Chuanxia Zheng博士论文】基于深度生成学习的逼真图像合成，197页pdf，Synthesizing Photorealistic Images with Deep Generative Learning

专知会员服务

20+阅读 · 2022年3月9日

【CVPR 2022】单目3D语义场景完成框架，MonoScene: Monocular 3D Semantic Scene Completion

【CVPR 2022】单目3D语义场景完成框架，MonoScene: Monocular 3D Semantic Scene Completion

专知会员服务

15+阅读 · 2022年3月3日

【CVPR2020】视觉导航的神经拓扑SLAM，56页ppt，Neural Topological SLAM for Visual Navigation

【CVPR2020】视觉导航的神经拓扑SLAM，56页ppt，Neural Topological SLAM for Visual Navigation

专知会员服务

14+阅读 · 2020年6月18日

【KDD2020】基于矩阵和张量因子分解的高效自动机器学习搜索，Efficient AutoML Pipeline Search with Matrix and Tensor Factorization

【KDD2020】基于矩阵和张量因子分解的高效自动机器学习搜索，Efficient AutoML Pipeline Search with Matrix and Tensor Factorization

专知会员服务

13+阅读 · 2020年6月10日

【ICLR2020】用实对二进制卷积训练二进制神经网络，Training Binary Neural Networks with Real-to-Binary Convolutions

【ICLR2020】用实对二进制卷积训练二进制神经网络，Training Binary Neural Networks with Real-to-Binary Convolutions

专知会员服务

26+阅读 · 2020年3月26日

Uber AI NeurIPS 2019《元学习meta-learning》教程，附92页PPT下载

Uber AI NeurIPS 2019《元学习meta-learning》教程，附92页PPT下载

专知会员服务

113+阅读 · 2019年12月13日

7 Papers & Radios | Meta「分割一切」AI模型；从T5到GPT-4盘点大语言模型

7 Papers & Radios | Meta「分割一切」AI模型；从T5到GPT-4盘点大语言模型

机器之心

4+阅读 · 2023年4月9日

GNN 新基准！Long Range Graph Benchmark

GNN 新基准！Long Range Graph Benchmark

图与推荐

0+阅读 · 2022年10月18日

CVPR 2022 | 大连理工提出自校准照明框架，用于现实场景的微光图像增强

CVPR 2022 | 大连理工提出自校准照明框架，用于现实场景的微光图像增强

PaperWeekly

4+阅读 · 2022年7月1日

【泡泡一分钟】用于视角可变重定位的语义地图构建

【泡泡一分钟】用于视角可变重定位的语义地图构建

泡泡机器人SLAM

19+阅读 · 2019年10月21日

【泡泡点云时空】基于分割方法的物体六维姿态估计

【泡泡点云时空】基于分割方法的物体六维姿态估计

泡泡机器人SLAM

18+阅读 · 2019年9月15日

Hierarchically Structured Meta-learning

Hierarchically Structured Meta-learning

CreateAMind

27+阅读 · 2019年5月22日

【泡泡一分钟】基于运动估计的激光雷达和相机标定方法

【泡泡一分钟】基于运动估计的激光雷达和相机标定方法

泡泡机器人SLAM

25+阅读 · 2019年1月17日

无监督元学习表示学习

无监督元学习表示学习

CreateAMind

27+阅读 · 2019年1月4日

【泡泡一分钟】Matterport3D: 从室内RGBD数据集中训练 (3dv-22)

【泡泡一分钟】Matterport3D: 从室内RGBD数据集中训练 (3dv-22)

泡泡机器人SLAM

16+阅读 · 2017年12月31日

【论文】变分推断（Variational inference)的总结

【论文】变分推断（Variational inference)的总结

机器学习研究会

39+阅读 · 2017年11月16日

GNSS仿真模型服务化共享关键技术研究

国家自然科学基金

9+阅读 · 2015年12月31日

基于计算机视觉的地面运动观测方法研究

国家自然科学基金

0+阅读 · 2014年12月31日

高精度实时水汽Raman激光雷达自标定方法研究

国家自然科学基金

1+阅读 · 2013年12月31日

无人机载和地面车载间多平台遥感影像的自动配准方法研究

国家自然科学基金

1+阅读 · 2013年12月31日

基于WorldView-3和OP-ELM的矿化蚀变提取方法研究

国家自然科学基金

0+阅读 · 2013年12月31日

面向服务机器人的3D场景理解方法研究

国家自然科学基金

1+阅读 · 2012年12月31日

车载激光扫描点云与全景影像的高精度配准方法

国家自然科学基金

0+阅读 · 2012年12月31日

基于超多视角成像的三维重建关键技术研究

国家自然科学基金

0+阅读 · 2011年12月31日

城市地区形变测量中的多源传感器四维SAR层析成像

国家自然科学基金

0+阅读 · 2011年12月31日

虚实混合环境中可视外壳实时建模与优化方法研究

国家自然科学基金

0+阅读 · 2009年12月31日

A Novel Sampling Scheme for Text- and Image-Conditional Image Synthesis in Quantized Latent Spaces

Arxiv

0+阅读 · 2023年5月23日

Synthesizing Diverse Human Motions in 3D Indoor Scenes

Arxiv

0+阅读 · 2023年5月23日

Fast Monocular Scene Reconstruction with Global-Sparse Local-Dense Grids

Arxiv

0+阅读 · 2023年5月22日

Registering Neural Radiance Fields as 3D Density Images

Arxiv

0+阅读 · 2023年5月22日

Beyond Flat GelSight Sensors: Simulation of Optical Tactile Sensors of Complex Morphologies for Sim2Real Learning

Arxiv

0+阅读 · 2023年5月21日

Zip-NeRF: Anti-Aliased Grid-Based Neural Radiance Fields

Arxiv

0+阅读 · 2023年5月21日

Deep Radar Inverse Sensor Models for Dynamic Occupancy Grid Maps

Arxiv

0+阅读 · 2023年5月21日

ComedicSpeech: Text To Speech For Stand-up Comedies in Low-Resource Scenarios

Arxiv

0+阅读 · 2023年5月20日

Brain-inspired learning in artificial neural networks: a review

Arxiv

0+阅读 · 2023年5月18日

Attention Bottlenecks for Multimodal Fusion

Arxiv

31+阅读 · 2021年6月30日

VIP会员

文章信息

相关主题

相关VIP内容

如何生成复杂逼真3D场景？CVPR2023英伟达等提出《分层潜在扩散模型》生成复杂的开放世界3D场景

如何生成复杂逼真3D场景？CVPR2023英伟达等提出《分层潜在扩散模型》生成复杂的开放世界3D场景

专知会员服务

48+阅读 · 2023年4月20日

【CVPR2022】端到端实时矢量边缘提取（E2EC）

【CVPR2022】端到端实时矢量边缘提取（E2EC）

专知会员服务

16+阅读 · 2022年4月14日

【CVPR 2022】基于实例深度估计的统一深度感知全景分割 PanopticDepth: Per-Instance Depth Estimation for Unified Depth-Aware Panoptic Segmentation

【CVPR 2022】基于实例深度估计的统一深度感知全景分割 PanopticDepth: Per-Instance Depth Estimation for Unified Depth-Aware Panoptic Segmentation

专知会员服务

18+阅读 · 2022年3月19日

【斯坦福CVPR2022】EG3D:高效的几何感知三维生成对抗网络，EG3D: Efficient Geometry-aware 3D Generative Adversarial Networks

【斯坦福CVPR2022】EG3D:高效的几何感知三维生成对抗网络，EG3D: Efficient Geometry-aware 3D Generative Adversarial Networks

专知会员服务

18+阅读 · 2022年3月15日

【南洋理工大学Chuanxia Zheng博士论文】基于深度生成学习的逼真图像合成，197页pdf，Synthesizing Photorealistic Images with Deep Generative Learning

【南洋理工大学Chuanxia Zheng博士论文】基于深度生成学习的逼真图像合成，197页pdf，Synthesizing Photorealistic Images with Deep Generative Learning

专知会员服务

20+阅读 · 2022年3月9日

【CVPR 2022】单目3D语义场景完成框架，MonoScene: Monocular 3D Semantic Scene Completion

【CVPR 2022】单目3D语义场景完成框架，MonoScene: Monocular 3D Semantic Scene Completion

专知会员服务

15+阅读 · 2022年3月3日

【CVPR2020】视觉导航的神经拓扑SLAM，56页ppt，Neural Topological SLAM for Visual Navigation

【CVPR2020】视觉导航的神经拓扑SLAM，56页ppt，Neural Topological SLAM for Visual Navigation

专知会员服务

14+阅读 · 2020年6月18日

【KDD2020】基于矩阵和张量因子分解的高效自动机器学习搜索，Efficient AutoML Pipeline Search with Matrix and Tensor Factorization

【KDD2020】基于矩阵和张量因子分解的高效自动机器学习搜索，Efficient AutoML Pipeline Search with Matrix and Tensor Factorization

专知会员服务

13+阅读 · 2020年6月10日

【ICLR2020】用实对二进制卷积训练二进制神经网络，Training Binary Neural Networks with Real-to-Binary Convolutions

【ICLR2020】用实对二进制卷积训练二进制神经网络，Training Binary Neural Networks with Real-to-Binary Convolutions

专知会员服务

26+阅读 · 2020年3月26日

Uber AI NeurIPS 2019《元学习meta-learning》教程，附92页PPT下载

Uber AI NeurIPS 2019《元学习meta-learning》教程，附92页PPT下载

专知会员服务

113+阅读 · 2019年12月13日

热门VIP内容

开通专知VIP会员享更多权益服务

《小型无人机系统侦测追踪技术：声学、计算机视觉与深度学习融合方案》最新98页

《"牧羊人网格"拦截策略：实现无人机集群可靠拦截的新范式》

光纤无人机：反无人机系统的重大挑战

《作战建模与仿真实证研究》

相关资讯

7 Papers & Radios | Meta「分割一切」AI模型；从T5到GPT-4盘点大语言模型

7 Papers & Radios | Meta「分割一切」AI模型；从T5到GPT-4盘点大语言模型

机器之心

4+阅读 · 2023年4月9日

GNN 新基准！Long Range Graph Benchmark

GNN 新基准！Long Range Graph Benchmark

图与推荐

0+阅读 · 2022年10月18日

CVPR 2022 | 大连理工提出自校准照明框架，用于现实场景的微光图像增强

CVPR 2022 | 大连理工提出自校准照明框架，用于现实场景的微光图像增强

PaperWeekly

4+阅读 · 2022年7月1日

【泡泡一分钟】用于视角可变重定位的语义地图构建

【泡泡一分钟】用于视角可变重定位的语义地图构建

泡泡机器人SLAM

19+阅读 · 2019年10月21日

【泡泡点云时空】基于分割方法的物体六维姿态估计

【泡泡点云时空】基于分割方法的物体六维姿态估计

泡泡机器人SLAM

18+阅读 · 2019年9月15日

Hierarchically Structured Meta-learning

Hierarchically Structured Meta-learning

CreateAMind

27+阅读 · 2019年5月22日

【泡泡一分钟】基于运动估计的激光雷达和相机标定方法

【泡泡一分钟】基于运动估计的激光雷达和相机标定方法

泡泡机器人SLAM

25+阅读 · 2019年1月17日

无监督元学习表示学习

无监督元学习表示学习

CreateAMind

27+阅读 · 2019年1月4日

【泡泡一分钟】Matterport3D: 从室内RGBD数据集中训练 (3dv-22)

【泡泡一分钟】Matterport3D: 从室内RGBD数据集中训练 (3dv-22)

泡泡机器人SLAM

16+阅读 · 2017年12月31日

【论文】变分推断（Variational inference)的总结

【论文】变分推断（Variational inference)的总结

机器学习研究会

39+阅读 · 2017年11月16日

相关论文

A Novel Sampling Scheme for Text- and Image-Conditional Image Synthesis in Quantized Latent Spaces

Arxiv

0+阅读 · 2023年5月23日

Synthesizing Diverse Human Motions in 3D Indoor Scenes

Arxiv

0+阅读 · 2023年5月23日

Fast Monocular Scene Reconstruction with Global-Sparse Local-Dense Grids

Arxiv

0+阅读 · 2023年5月22日

Registering Neural Radiance Fields as 3D Density Images

Arxiv

0+阅读 · 2023年5月22日

Beyond Flat GelSight Sensors: Simulation of Optical Tactile Sensors of Complex Morphologies for Sim2Real Learning

Arxiv

0+阅读 · 2023年5月21日

Zip-NeRF: Anti-Aliased Grid-Based Neural Radiance Fields

Arxiv

0+阅读 · 2023年5月21日

Deep Radar Inverse Sensor Models for Dynamic Occupancy Grid Maps

Arxiv

0+阅读 · 2023年5月21日

ComedicSpeech: Text To Speech For Stand-up Comedies in Low-Resource Scenarios

Arxiv

0+阅读 · 2023年5月20日

Brain-inspired learning in artificial neural networks: a review

Arxiv

0+阅读 · 2023年5月18日

Attention Bottlenecks for Multimodal Fusion

Arxiv

31+阅读 · 2021年6月30日

相关基金

GNSS仿真模型服务化共享关键技术研究

国家自然科学基金

9+阅读 · 2015年12月31日

基于计算机视觉的地面运动观测方法研究

国家自然科学基金

0+阅读 · 2014年12月31日

高精度实时水汽Raman激光雷达自标定方法研究

国家自然科学基金

1+阅读 · 2013年12月31日

无人机载和地面车载间多平台遥感影像的自动配准方法研究

国家自然科学基金

1+阅读 · 2013年12月31日

基于WorldView-3和OP-ELM的矿化蚀变提取方法研究

国家自然科学基金

0+阅读 · 2013年12月31日

面向服务机器人的3D场景理解方法研究

国家自然科学基金

1+阅读 · 2012年12月31日

车载激光扫描点云与全景影像的高精度配准方法

国家自然科学基金

0+阅读 · 2012年12月31日

基于超多视角成像的三维重建关键技术研究

国家自然科学基金

0+阅读 · 2011年12月31日

城市地区形变测量中的多源传感器四维SAR层析成像

国家自然科学基金

0+阅读 · 2011年12月31日

虚实混合环境中可视外壳实时建模与优化方法研究

国家自然科学基金

0+阅读 · 2009年12月31日

微信扫码咨询专知VIP会员