基于网格引导的神经辐射场用于大型城市场景 (Grid-guided Neural Radiance Fields for Large Urban Scenes) - 专知论文

会员服务 ·

0

网格 · 辐射场 · NeRF · 神经辐射场 · 网格表示 ·

2023 年 3 月 24 日

Grid-guided Neural Radiance Fields for Large Urban Scenes

翻译：基于网格引导的神经辐射场用于大型城市场景

Linning Xu,Yuanbo Xiangli,Sida Peng,Xingang Pan,Nanxuan Zhao,Christian Theobalt,Bo Dai,Dahua Lin

from arxiv, CVPR2023, Project page at https://city-super.github.io/gridnerf/

Purely MLP-based neural radiance fields (NeRF-based methods) often suffer from underfitting with blurred renderings on large-scale scenes due to limited model capacity. Recent approaches propose to geographically divide the scene and adopt multiple sub-NeRFs to model each region individually, leading to linear scale-up in training costs and the number of sub-NeRFs as the scene expands. An alternative solution is to use a feature grid representation, which is computationally efficient and can naturally scale to a large scene with increased grid resolutions. However, the feature grid tends to be less constrained and often reaches suboptimal solutions, producing noisy artifacts in renderings, especially in regions with complex geometry and texture. In this work, we present a new framework that realizes high-fidelity rendering on large urban scenes while being computationally efficient. We propose to use a compact multiresolution ground feature plane representation to coarsely capture the scene, and complement it with positional encoding inputs through another NeRF branch for rendering in a joint learning fashion. We show that such an integration can utilize the advantages of two alternative solutions: a light-weighted NeRF is sufficient, under the guidance of the feature grid representation, to render photorealistic novel views with fine details; and the jointly optimized ground feature planes, can meanwhile gain further refinements, forming a more accurate and compact feature space and output much more natural rendering results.

翻译：纯MLP-based的神经辐射场（NeRF-based方法）通常会因模型容量有限而出现欠拟合，在大规模场景中呈现模糊的渲染结果。近期的方法提出通过地理划分场景并采用多个子NeRFs单独建模每个区域，从而实现训练成本和NeRF子数的线性扩展随着场景扩大。另一种解决方案是使用特征网格表示，它具有计算效率高、可以自然扩展到大型场景的特点。然而，特征网格倾向于不受限制且经常达到次优解，导致渲染中出现噪点制品，特别是在具有复杂几何和纹理的区域。在本文中，我们提出了一个新的框架，可以在计算效率高的情况下实现大型城市场景的高保真渲染。我们建议使用一种多分辨率地面特征平面表示法来粗略地捕捉场景，并通过另一个NeRF分支的位置编码输入来补充渲染以进行联合学习。我们展示了这种整合可以利用两种替代方案的优势：在特征网格表示的指导下，轻量级的NeRF足以呈现具有细节的照片般逼真的新视图；与此同时，联合优化的地面特征平面可以获得进一步的细化，形成更准确紧凑的特征空间，并输出更自然的渲染结果。

0

相关内容

如何生成复杂逼真3D场景？CVPR2023英伟达等提出《分层潜在扩散模型》生成复杂的开放世界3D场景

如何生成复杂逼真3D场景？CVPR2023英伟达等提出《分层潜在扩散模型》生成复杂的开放世界3D场景

专知会员服务

48+阅读 · 2023年4月20日

【CVPR2022】多视图聚合的大规模三维语义分割

【CVPR2022】多视图聚合的大规模三维语义分割

专知会员服务

21+阅读 · 2022年4月20日

【MIla】一种意识启发规划的基于模型强化学习，A Consciousness-Inspired Planning Agent for Model-Based Reinforcement Learning

【MIla】一种意识启发规划的基于模型强化学习，A Consciousness-Inspired Planning Agent for Model-Based Reinforcement Learning

专知会员服务

23+阅读 · 2022年3月19日

高效可扩展图神经网络的研究进展，Recent Advances in Efficient and Scalable Graph Neural Networks

高效可扩展图神经网络的研究进展，Recent Advances in Efficient and Scalable Graph Neural Networks

专知会员服务

78+阅读 · 2022年3月15日

【斯坦福CVPR2022】EG3D:高效的几何感知三维生成对抗网络，EG3D: Efficient Geometry-aware 3D Generative Adversarial Networks

【斯坦福CVPR2022】EG3D:高效的几何感知三维生成对抗网络，EG3D: Efficient Geometry-aware 3D Generative Adversarial Networks

专知会员服务

18+阅读 · 2022年3月15日

【Google】神经辐射场，Neural Radiance Fields，74页ppt

专知会员服务

74+阅读 · 2021年5月28日

Google-EfficientNet v2来了！更快，更小，更强！

Google-EfficientNet v2来了！更快，更小，更强！

专知会员服务

19+阅读 · 2021年4月4日

【CVPR2020】用于图像超分辨率的深度展开网络，Deep Unfolding Network for Image Super-Resolution

【CVPR2020】用于图像超分辨率的深度展开网络，Deep Unfolding Network for Image Super-Resolution

专知会员服务

44+阅读 · 2020年3月26日

【CVPR2020-Oral-牛津-Facebook】从单个图像进行端到端的视图合成，SynSin-View Synthesis

【CVPR2020-Oral-牛津-Facebook】从单个图像进行端到端的视图合成，SynSin-View Synthesis

专知会员服务

29+阅读 · 2020年3月26日

【伯克利】用于文本推理的神经模块网络，Neural Module Networks for Reasoning over Text

【伯克利】用于文本推理的神经模块网络，Neural Module Networks for Reasoning over Text

专知会员服务

35+阅读 · 2019年12月10日

只需训练一次，即可生成3D新场景！谷歌「光场神经渲染」进化史

只需训练一次，即可生成3D新场景！谷歌「光场神经渲染」进化史

新智元

1+阅读 · 2022年9月29日

谷歌华人研究员发布MobileNeRF，渲染3D模型速度提升10倍

谷歌华人研究员发布MobileNeRF，渲染3D模型速度提升10倍

新智元

0+阅读 · 2022年8月7日

META微软等最新ACL2022教程《非自回归序列生成》，168页ppt

META微软等最新ACL2022教程《非自回归序列生成》，168页ppt

专知

2+阅读 · 2022年6月3日

【泡泡一分钟】用于视角可变重定位的语义地图构建

【泡泡一分钟】用于视角可变重定位的语义地图构建

泡泡机器人SLAM

19+阅读 · 2019年10月21日

【泡泡点云时空】DeepMapping: 来自多重点云的无监督地图估计

【泡泡点云时空】DeepMapping: 来自多重点云的无监督地图估计

泡泡机器人SLAM

29+阅读 · 2019年5月29日

深度卷积神经网络中的降采样

深度卷积神经网络中的降采样

极市平台

12+阅读 · 2019年5月24日

【泡泡一分钟】用于RGBD语义分割的三维图神经网络(ICCV2017-546)

【泡泡一分钟】用于RGBD语义分割的三维图神经网络(ICCV2017-546)

泡泡机器人SLAM

22+阅读 · 2018年12月4日

【泡泡点云时空】基于增量分割的3D点云定位方法（ICRA2018-4）

【泡泡点云时空】基于增量分割的3D点云定位方法（ICRA2018-4）

泡泡机器人SLAM

13+阅读 · 2018年10月7日

【论文推荐】最新七篇图像检索相关论文—草图、Tie-Aware、场景图解析、叠加跨注意力机制、深度哈希、人群估计

【论文推荐】最新七篇图像检索相关论文—草图、Tie-Aware、场景图解析、叠加跨注意力机制、深度哈希、人群估计

专知

10+阅读 · 2018年4月22日

【泡泡一分钟】使用深度神经网络提取局部特征的大规模图像检索算法(ICCV-2)

【泡泡一分钟】使用深度神经网络提取局部特征的大规模图像检索算法(ICCV-2)

泡泡机器人SLAM

16+阅读 · 2018年2月10日

基于关联分层条件随机场的高分辨率影像分类方法研究

国家自然科学基金

0+阅读 · 2013年12月31日

基于图像模型绘制的大规模场景自由可量测全景再现

国家自然科学基金

0+阅读 · 2013年12月31日

基于探地雷达技术的盐碱地地下分层导电特性无损探测方法研究

国家自然科学基金

0+阅读 · 2013年12月31日

基于地面激光扫描的大规模城市场景树木和建筑的三维重建

国家自然科学基金

2+阅读 · 2012年12月31日

复杂三维建筑物模型的LOD定量规划与自动简化方法

国家自然科学基金

0+阅读 · 2011年12月31日

基于三维差时投影法的超分辨率车辆重建算法研究

国家自然科学基金

0+阅读 · 2010年12月31日

基于融合的全向深度图像的生成及应用研究

国家自然科学基金

0+阅读 · 2010年12月31日

面向复杂建筑物部件的地面激光扫描点云与近景影像混合三维建模方法研究

国家自然科学基金

1+阅读 · 2009年12月31日

大气环境及目标特性对厘米级分辩率SAR成像的影响分析与处理研究

国家自然科学基金

0+阅读 · 2009年12月31日

基于多智能体与元胞自动机的区域生态安全优化模拟

国家自然科学基金

0+阅读 · 2008年12月31日

Tetra-NeRF: Representing Neural Radiance Fields Using Tetrahedra

Arxiv

0+阅读 · 2023年5月15日

Inverse Rendering of Translucent Objects using Physical and Neural Renderers

Arxiv

0+阅读 · 2023年5月15日

HumanRF: High-Fidelity Neural Radiance Fields for Humans in Motion

Arxiv

0+阅读 · 2023年5月11日

Single-view Neural Radiance Fields with Depth Teacher

Arxiv

0+阅读 · 2023年5月11日

NeRF: Neural Radiance Field in 3D Vision, A Comprehensive Review

Arxiv

0+阅读 · 2023年5月10日

NeRF$^\textbf{2}$: Neural Radio-Frequency Radiance Fields

Arxiv

0+阅读 · 2023年5月10日

Relightify: Relightable 3D Faces from a Single Image via Diffusion Models

Arxiv

1+阅读 · 2023年5月10日

NeuralField-LDM: Scene Generation with Hierarchical Latent Diffusion Models

Arxiv

42+阅读 · 2023年4月19日

Coupled Layer-wise Graph Convolution for Transportation Demand Prediction

Arxiv

12+阅读 · 2020年12月15日

Dynamic Graph Neural Networks

Arxiv

24+阅读 · 2018年10月24日

VIP会员

文章信息

相关主题

神经辐射场

相关VIP内容

如何生成复杂逼真3D场景？CVPR2023英伟达等提出《分层潜在扩散模型》生成复杂的开放世界3D场景

如何生成复杂逼真3D场景？CVPR2023英伟达等提出《分层潜在扩散模型》生成复杂的开放世界3D场景

专知会员服务

48+阅读 · 2023年4月20日

【CVPR2022】多视图聚合的大规模三维语义分割

【CVPR2022】多视图聚合的大规模三维语义分割

专知会员服务

21+阅读 · 2022年4月20日

【MIla】一种意识启发规划的基于模型强化学习，A Consciousness-Inspired Planning Agent for Model-Based Reinforcement Learning

【MIla】一种意识启发规划的基于模型强化学习，A Consciousness-Inspired Planning Agent for Model-Based Reinforcement Learning

专知会员服务

23+阅读 · 2022年3月19日

高效可扩展图神经网络的研究进展，Recent Advances in Efficient and Scalable Graph Neural Networks

高效可扩展图神经网络的研究进展，Recent Advances in Efficient and Scalable Graph Neural Networks

专知会员服务

78+阅读 · 2022年3月15日

【斯坦福CVPR2022】EG3D:高效的几何感知三维生成对抗网络，EG3D: Efficient Geometry-aware 3D Generative Adversarial Networks

【斯坦福CVPR2022】EG3D:高效的几何感知三维生成对抗网络，EG3D: Efficient Geometry-aware 3D Generative Adversarial Networks

专知会员服务

18+阅读 · 2022年3月15日

【Google】神经辐射场，Neural Radiance Fields，74页ppt

专知会员服务

74+阅读 · 2021年5月28日

Google-EfficientNet v2来了！更快，更小，更强！

Google-EfficientNet v2来了！更快，更小，更强！

专知会员服务

19+阅读 · 2021年4月4日

【CVPR2020】用于图像超分辨率的深度展开网络，Deep Unfolding Network for Image Super-Resolution

【CVPR2020】用于图像超分辨率的深度展开网络，Deep Unfolding Network for Image Super-Resolution

专知会员服务

44+阅读 · 2020年3月26日

【CVPR2020-Oral-牛津-Facebook】从单个图像进行端到端的视图合成，SynSin-View Synthesis

【CVPR2020-Oral-牛津-Facebook】从单个图像进行端到端的视图合成，SynSin-View Synthesis

专知会员服务

29+阅读 · 2020年3月26日

【伯克利】用于文本推理的神经模块网络，Neural Module Networks for Reasoning over Text

【伯克利】用于文本推理的神经模块网络，Neural Module Networks for Reasoning over Text

专知会员服务

35+阅读 · 2019年12月10日

热门VIP内容

开通专知VIP会员享更多权益服务

【牛津博士论文】零样本强化学习综述

《美军条令：陆军指挥官与规划人员地理空间指南》60页

战术边缘指挥控制：防务面临的核心挑战

迈向开放世界检测：综述

相关资讯

只需训练一次，即可生成3D新场景！谷歌「光场神经渲染」进化史

只需训练一次，即可生成3D新场景！谷歌「光场神经渲染」进化史

新智元

1+阅读 · 2022年9月29日

谷歌华人研究员发布MobileNeRF，渲染3D模型速度提升10倍

谷歌华人研究员发布MobileNeRF，渲染3D模型速度提升10倍

新智元

0+阅读 · 2022年8月7日

META微软等最新ACL2022教程《非自回归序列生成》，168页ppt

META微软等最新ACL2022教程《非自回归序列生成》，168页ppt

专知

2+阅读 · 2022年6月3日

【泡泡一分钟】用于视角可变重定位的语义地图构建

【泡泡一分钟】用于视角可变重定位的语义地图构建

泡泡机器人SLAM

19+阅读 · 2019年10月21日

【泡泡点云时空】DeepMapping: 来自多重点云的无监督地图估计

【泡泡点云时空】DeepMapping: 来自多重点云的无监督地图估计

泡泡机器人SLAM

29+阅读 · 2019年5月29日

深度卷积神经网络中的降采样

深度卷积神经网络中的降采样

极市平台

12+阅读 · 2019年5月24日

【泡泡一分钟】用于RGBD语义分割的三维图神经网络(ICCV2017-546)

【泡泡一分钟】用于RGBD语义分割的三维图神经网络(ICCV2017-546)

泡泡机器人SLAM

22+阅读 · 2018年12月4日

【泡泡点云时空】基于增量分割的3D点云定位方法（ICRA2018-4）

【泡泡点云时空】基于增量分割的3D点云定位方法（ICRA2018-4）

泡泡机器人SLAM

13+阅读 · 2018年10月7日

【论文推荐】最新七篇图像检索相关论文—草图、Tie-Aware、场景图解析、叠加跨注意力机制、深度哈希、人群估计

【论文推荐】最新七篇图像检索相关论文—草图、Tie-Aware、场景图解析、叠加跨注意力机制、深度哈希、人群估计

专知

10+阅读 · 2018年4月22日

【泡泡一分钟】使用深度神经网络提取局部特征的大规模图像检索算法(ICCV-2)

【泡泡一分钟】使用深度神经网络提取局部特征的大规模图像检索算法(ICCV-2)

泡泡机器人SLAM

16+阅读 · 2018年2月10日

相关论文

Tetra-NeRF: Representing Neural Radiance Fields Using Tetrahedra

Arxiv

0+阅读 · 2023年5月15日

Inverse Rendering of Translucent Objects using Physical and Neural Renderers

Arxiv

0+阅读 · 2023年5月15日

HumanRF: High-Fidelity Neural Radiance Fields for Humans in Motion

Arxiv

0+阅读 · 2023年5月11日

Single-view Neural Radiance Fields with Depth Teacher

Arxiv

0+阅读 · 2023年5月11日

NeRF: Neural Radiance Field in 3D Vision, A Comprehensive Review

Arxiv

0+阅读 · 2023年5月10日

NeRF$^\textbf{2}$: Neural Radio-Frequency Radiance Fields

Arxiv

0+阅读 · 2023年5月10日

Relightify: Relightable 3D Faces from a Single Image via Diffusion Models

Arxiv

1+阅读 · 2023年5月10日

NeuralField-LDM: Scene Generation with Hierarchical Latent Diffusion Models

Arxiv

42+阅读 · 2023年4月19日

Coupled Layer-wise Graph Convolution for Transportation Demand Prediction

Arxiv

12+阅读 · 2020年12月15日

Dynamic Graph Neural Networks

Arxiv

24+阅读 · 2018年10月24日

相关基金

基于关联分层条件随机场的高分辨率影像分类方法研究

国家自然科学基金

0+阅读 · 2013年12月31日

基于图像模型绘制的大规模场景自由可量测全景再现

国家自然科学基金

0+阅读 · 2013年12月31日

基于探地雷达技术的盐碱地地下分层导电特性无损探测方法研究

国家自然科学基金

0+阅读 · 2013年12月31日

基于地面激光扫描的大规模城市场景树木和建筑的三维重建

国家自然科学基金

2+阅读 · 2012年12月31日

复杂三维建筑物模型的LOD定量规划与自动简化方法

国家自然科学基金

0+阅读 · 2011年12月31日

基于三维差时投影法的超分辨率车辆重建算法研究

国家自然科学基金

0+阅读 · 2010年12月31日

基于融合的全向深度图像的生成及应用研究

国家自然科学基金

0+阅读 · 2010年12月31日

面向复杂建筑物部件的地面激光扫描点云与近景影像混合三维建模方法研究

国家自然科学基金

1+阅读 · 2009年12月31日

大气环境及目标特性对厘米级分辩率SAR成像的影响分析与处理研究

国家自然科学基金

0+阅读 · 2009年12月31日

基于多智能体与元胞自动机的区域生态安全优化模拟

国家自然科学基金

0+阅读 · 2008年12月31日

微信扫码咨询专知VIP会员