新颖的动态 MLP 场景表示法 (Representing Volumetric Videos as Dynamic MLP Maps) - 专知论文

会员服务 ·

0

场景表示 · 动态场景 · 动态预测 · 表示 · 存储 ·

2023 年 4 月 13 日

Representing Volumetric Videos as Dynamic MLP Maps

翻译：新颖的动态 MLP 场景表示法

Sida Peng,Yunzhi Yan,Qing Shuai,Hujun Bao,Xiaowei Zhou

from arxiv, Accepted to CVPR 2023. The first two authors contributed equally to this paper. Project page: https://zju3dv.github.io/mlp_maps/

This paper introduces a novel representation of volumetric videos for real-time view synthesis of dynamic scenes. Recent advances in neural scene representations demonstrate their remarkable capability to model and render complex static scenes, but extending them to represent dynamic scenes is not straightforward due to their slow rendering speed or high storage cost. To solve this problem, our key idea is to represent the radiance field of each frame as a set of shallow MLP networks whose parameters are stored in 2D grids, called MLP maps, and dynamically predicted by a 2D CNN decoder shared by all frames. Representing 3D scenes with shallow MLPs significantly improves the rendering speed, while dynamically predicting MLP parameters with a shared 2D CNN instead of explicitly storing them leads to low storage cost. Experiments show that the proposed approach achieves state-of-the-art rendering quality on the NHR and ZJU-MoCap datasets, while being efficient for real-time rendering with a speed of 41.7 fps for $512 \times 512$ images on an RTX 3090 GPU. The code is available at https://zju3dv.github.io/mlp_maps/.

翻译：本文提出了一种新颖的体积视频表示法，用于动态场景的实时视图合成。最近神经场景表示的进展展示了它们对建模和渲染复杂静态场景的显著能力，但将它们扩展到表示动态场景却并不简单，因为它们渲染速度慢或存储成本高。为了解决这个问题，本文的关键思路是通过一组浅 MLP 网络将每帧的辐射场表示为存储在 2D 网格中的一组参数，称为 MLP 地图，然后通过一个被所有帧共享的 2D CNN 解码器进行动态预测。通过使用浅 MLP 来表示 3D 场景，可以显著提高渲染速度，而通过使用共享的 2D CNN 来动态预测 MLP 参数，而非显式存储它们，可以降低存储成本。实验表明，所提出的方法在 NHR 和 ZJU-MoCap 数据集上实现了最先进的渲染质量，同时在 RTX 3090 GPU 上实时渲染 512x512 图像的速度为 41.7 fps。代码可在 https://zju3dv.github.io/mlp_maps/ 上获取。

0

相关内容

场景表示

【CVPR2023】学习神经双辐射场实时视图合成

【CVPR2023】学习神经双辐射场实时视图合成

专知会员服务

31+阅读 · 2023年4月23日

【CVPR2022】循环动态嵌入的视频目标分割

【CVPR2022】循环动态嵌入的视频目标分割

专知会员服务

19+阅读 · 2022年5月16日

【CVPR2022】多视图聚合的大规模三维语义分割

【CVPR2022】多视图聚合的大规模三维语义分割

专知会员服务

21+阅读 · 2022年4月20日

【CVPR 2022】基于时空解耦与重耦的RGB-D动作识别 Decoupling and Recoupling Spatiotemporal Representation for RGB-D-based Motion Recognition

【CVPR 2022】基于时空解耦与重耦的RGB-D动作识别 Decoupling and Recoupling Spatiotemporal Representation for RGB-D-based Motion Recognition

专知会员服务

14+阅读 · 2022年3月19日

【斯坦福CVPR2022】EG3D:高效的几何感知三维生成对抗网络，EG3D: Efficient Geometry-aware 3D Generative Adversarial Networks

【斯坦福CVPR2022】EG3D:高效的几何感知三维生成对抗网络，EG3D: Efficient Geometry-aware 3D Generative Adversarial Networks

专知会员服务

18+阅读 · 2022年3月15日

【MIT】自监督几何感知，22页ppt，Self-supervised Geometric Perception

【MIT】自监督几何感知，22页ppt，Self-supervised Geometric Perception

专知会员服务

23+阅读 · 2021年6月3日

【CVPR2021】动态区域注意卷积

专知会员服务

21+阅读 · 2021年4月2日

一文概览 CVPR2021 最新18篇 Oral 论文

专知会员服务

26+阅读 · 2021年3月7日

【CVPR2020-Oral-牛津-Facebook】从单个图像进行端到端的视图合成，SynSin-View Synthesis

【CVPR2020-Oral-牛津-Facebook】从单个图像进行端到端的视图合成，SynSin-View Synthesis

专知会员服务

29+阅读 · 2020年3月26日

【SIGGRAPH2019】TensorFlow 2.0深度学习计算机图形学应用

【SIGGRAPH2019】TensorFlow 2.0深度学习计算机图形学应用

专知会员服务

41+阅读 · 2019年10月9日

Multi-Task Learning的几篇综述文章

Multi-Task Learning的几篇综述文章

深度学习自然语言处理

15+阅读 · 2020年6月15日

【泡泡汇总】CVPR2019 SLAM Paperlist

【泡泡汇总】CVPR2019 SLAM Paperlist

泡泡机器人SLAM

14+阅读 · 2019年6月12日

CVPR2019 | 15篇论文速递（涵盖目标检测、语义分割和姿态估计等方向）

CVPR2019 | 15篇论文速递（涵盖目标检测、语义分割和姿态估计等方向）

AI研习社

15+阅读 · 2019年5月8日

深度自进化聚类：Deep Self-Evolution Clustering

深度自进化聚类：Deep Self-Evolution Clustering

我爱读PAMI

15+阅读 · 2019年4月13日

【泡泡一分钟】从三维流动中学习单目视觉里程计及三维稠密建图

【泡泡一分钟】从三维流动中学习单目视觉里程计及三维稠密建图

泡泡机器人SLAM

12+阅读 · 2019年2月12日

Unsupervised Learning via Meta-Learning

Unsupervised Learning via Meta-Learning

CreateAMind

43+阅读 · 2019年1月3日

【泡泡一分钟】Trifo-VIO：使用点和线的稳健且高效的双目视觉惯导里程计

【泡泡一分钟】Trifo-VIO：使用点和线的稳健且高效的双目视觉惯导里程计

泡泡机器人SLAM

13+阅读 · 2018年12月20日

vae 相关论文表示学习 1

vae 相关论文表示学习 1

CreateAMind

12+阅读 · 2018年9月6日

【泡泡点云时空】用于点云识别的注意力形状上下文网络（CVPR2018-1）

【泡泡点云时空】用于点云识别的注意力形状上下文网络（CVPR2018-1）

泡泡机器人SLAM

33+阅读 · 2018年8月6日

【泡泡一分钟】基于多视图卷积网络的草图三维重建技术(3dv-66)

【泡泡一分钟】基于多视图卷积网络的草图三维重建技术(3dv-66)

泡泡机器人SLAM

11+阅读 · 2018年3月31日

TCDD经SSeCKS/TRAF6通路诱导星形胶质细胞激活致神经毒性的机制研究

国家自然科学基金

0+阅读 · 2014年12月31日

风洞动态试验对象姿态的视频测量及其运动规律建模

国家自然科学基金

1+阅读 · 2014年12月31日

基于稀疏特征的遥感信息高效感知与压缩

国家自然科学基金

2+阅读 · 2013年12月31日

增强现实中的动态可见性计算研究

国家自然科学基金

1+阅读 · 2012年12月31日

超高长径比的超细贵金属单晶纳米线可控合成、生长机理及性能研究

国家自然科学基金

0+阅读 · 2012年12月31日

保持时空连续变化的三维纹理变形方法研究

国家自然科学基金

0+阅读 · 2012年12月31日

基于超图形XGML的图像半结构化研究

国家自然科学基金

0+阅读 · 2012年12月31日

全局轨迹解析的通用框架和推理方法，以及在智能视频监控中的应用

国家自然科学基金

1+阅读 · 2011年12月31日

稳定高效的膦手性PCP类Pincer型催化剂的合成及应用研究

国家自然科学基金

0+阅读 · 2011年12月31日

PIAS1在颞叶癫痫海马神经元凋亡中的作用及其机制

国家自然科学基金

0+阅读 · 2008年12月31日

Towards a Robust Framework for NeRF Evaluation

Arxiv

0+阅读 · 2023年5月31日

ZeroFlow: Fast Zero Label Scene Flow via Distillation

Arxiv

0+阅读 · 2023年5月31日

Conformal Regression in Calorie Prediction for Team Jumbo-Visma

Arxiv

0+阅读 · 2023年5月31日

Unsupervised Melody-to-Lyric Generation

Unsupervised Melody-to-Lyric Generation

Arxiv

0+阅读 · 2023年5月30日

PlaNeRF: SVD Unsupervised 3D Plane Regularization for NeRF Large-Scale Scene Reconstruction

Arxiv

0+阅读 · 2023年5月30日

Intrinsic shape analysis in archaeology: A case study on ancient sundials

Arxiv

0+阅读 · 2023年5月30日

Pre-training Contextualized World Models with In-the-wild Videos for Reinforcement Learning

Arxiv

0+阅读 · 2023年5月29日

Volume Feature Rendering for Fast Neural Radiance Field Reconstruction

Arxiv

0+阅读 · 2023年5月29日

FastMESH: Fast Surface Reconstruction by Hexagonal Mesh-based Neural Rendering

Arxiv

0+阅读 · 2023年5月29日

A 3D Coarse-to-Fine Framework for Volumetric Medical Image Segmentation

A 3D Coarse-to-Fine Framework for Volumetric Medical Image Segmentation

Arxiv

15+阅读 · 2018年8月2日

VIP会员

文章信息

相关主题

相关VIP内容

【CVPR2023】学习神经双辐射场实时视图合成

【CVPR2023】学习神经双辐射场实时视图合成

专知会员服务

31+阅读 · 2023年4月23日

【CVPR2022】循环动态嵌入的视频目标分割

【CVPR2022】循环动态嵌入的视频目标分割

专知会员服务

19+阅读 · 2022年5月16日

【CVPR2022】多视图聚合的大规模三维语义分割

【CVPR2022】多视图聚合的大规模三维语义分割

专知会员服务

21+阅读 · 2022年4月20日

【CVPR 2022】基于时空解耦与重耦的RGB-D动作识别 Decoupling and Recoupling Spatiotemporal Representation for RGB-D-based Motion Recognition

【CVPR 2022】基于时空解耦与重耦的RGB-D动作识别 Decoupling and Recoupling Spatiotemporal Representation for RGB-D-based Motion Recognition

专知会员服务

14+阅读 · 2022年3月19日

【斯坦福CVPR2022】EG3D:高效的几何感知三维生成对抗网络，EG3D: Efficient Geometry-aware 3D Generative Adversarial Networks

【斯坦福CVPR2022】EG3D:高效的几何感知三维生成对抗网络，EG3D: Efficient Geometry-aware 3D Generative Adversarial Networks

专知会员服务

18+阅读 · 2022年3月15日

【MIT】自监督几何感知，22页ppt，Self-supervised Geometric Perception

【MIT】自监督几何感知，22页ppt，Self-supervised Geometric Perception

专知会员服务

23+阅读 · 2021年6月3日

【CVPR2021】动态区域注意卷积

专知会员服务

21+阅读 · 2021年4月2日

一文概览 CVPR2021 最新18篇 Oral 论文

专知会员服务

26+阅读 · 2021年3月7日

【CVPR2020-Oral-牛津-Facebook】从单个图像进行端到端的视图合成，SynSin-View Synthesis

【CVPR2020-Oral-牛津-Facebook】从单个图像进行端到端的视图合成，SynSin-View Synthesis

专知会员服务

29+阅读 · 2020年3月26日

【SIGGRAPH2019】TensorFlow 2.0深度学习计算机图形学应用

【SIGGRAPH2019】TensorFlow 2.0深度学习计算机图形学应用

专知会员服务

41+阅读 · 2019年10月9日

热门VIP内容

开通专知VIP会员享更多权益服务

《基于大型语言模型的软件工程自动化研究》最新264页

《基于大型语言模型的信号处理管线研究：推进军事电子情报工作流程》最新76页

中文版 | 战争算法：生成式人工智能在战场的崛起

中文版《美国陆军：战术行为性远程医疗实施观察与建议》

相关资讯

Multi-Task Learning的几篇综述文章

Multi-Task Learning的几篇综述文章

深度学习自然语言处理

15+阅读 · 2020年6月15日

【泡泡汇总】CVPR2019 SLAM Paperlist

【泡泡汇总】CVPR2019 SLAM Paperlist

泡泡机器人SLAM

14+阅读 · 2019年6月12日

CVPR2019 | 15篇论文速递（涵盖目标检测、语义分割和姿态估计等方向）

CVPR2019 | 15篇论文速递（涵盖目标检测、语义分割和姿态估计等方向）

AI研习社

15+阅读 · 2019年5月8日

深度自进化聚类：Deep Self-Evolution Clustering

深度自进化聚类：Deep Self-Evolution Clustering

我爱读PAMI

15+阅读 · 2019年4月13日

【泡泡一分钟】从三维流动中学习单目视觉里程计及三维稠密建图

【泡泡一分钟】从三维流动中学习单目视觉里程计及三维稠密建图

泡泡机器人SLAM

12+阅读 · 2019年2月12日

Unsupervised Learning via Meta-Learning

Unsupervised Learning via Meta-Learning

CreateAMind

43+阅读 · 2019年1月3日

【泡泡一分钟】Trifo-VIO：使用点和线的稳健且高效的双目视觉惯导里程计

【泡泡一分钟】Trifo-VIO：使用点和线的稳健且高效的双目视觉惯导里程计

泡泡机器人SLAM

13+阅读 · 2018年12月20日

vae 相关论文表示学习 1

vae 相关论文表示学习 1

CreateAMind

12+阅读 · 2018年9月6日

【泡泡点云时空】用于点云识别的注意力形状上下文网络（CVPR2018-1）

【泡泡点云时空】用于点云识别的注意力形状上下文网络（CVPR2018-1）

泡泡机器人SLAM

33+阅读 · 2018年8月6日

【泡泡一分钟】基于多视图卷积网络的草图三维重建技术(3dv-66)

【泡泡一分钟】基于多视图卷积网络的草图三维重建技术(3dv-66)

泡泡机器人SLAM

11+阅读 · 2018年3月31日

相关论文

Towards a Robust Framework for NeRF Evaluation

Arxiv

0+阅读 · 2023年5月31日

ZeroFlow: Fast Zero Label Scene Flow via Distillation

Arxiv

0+阅读 · 2023年5月31日

Conformal Regression in Calorie Prediction for Team Jumbo-Visma

Arxiv

0+阅读 · 2023年5月31日

Unsupervised Melody-to-Lyric Generation

Unsupervised Melody-to-Lyric Generation

Arxiv

0+阅读 · 2023年5月30日

PlaNeRF: SVD Unsupervised 3D Plane Regularization for NeRF Large-Scale Scene Reconstruction

Arxiv

0+阅读 · 2023年5月30日

Intrinsic shape analysis in archaeology: A case study on ancient sundials

Arxiv

0+阅读 · 2023年5月30日

Pre-training Contextualized World Models with In-the-wild Videos for Reinforcement Learning

Arxiv

0+阅读 · 2023年5月29日

Volume Feature Rendering for Fast Neural Radiance Field Reconstruction

Arxiv

0+阅读 · 2023年5月29日

FastMESH: Fast Surface Reconstruction by Hexagonal Mesh-based Neural Rendering

Arxiv

0+阅读 · 2023年5月29日

A 3D Coarse-to-Fine Framework for Volumetric Medical Image Segmentation

A 3D Coarse-to-Fine Framework for Volumetric Medical Image Segmentation

Arxiv

15+阅读 · 2018年8月2日

相关基金

TCDD经SSeCKS/TRAF6通路诱导星形胶质细胞激活致神经毒性的机制研究

国家自然科学基金

0+阅读 · 2014年12月31日

风洞动态试验对象姿态的视频测量及其运动规律建模

国家自然科学基金

1+阅读 · 2014年12月31日

基于稀疏特征的遥感信息高效感知与压缩

国家自然科学基金

2+阅读 · 2013年12月31日

增强现实中的动态可见性计算研究

国家自然科学基金

1+阅读 · 2012年12月31日

超高长径比的超细贵金属单晶纳米线可控合成、生长机理及性能研究

国家自然科学基金

0+阅读 · 2012年12月31日

保持时空连续变化的三维纹理变形方法研究

国家自然科学基金

0+阅读 · 2012年12月31日

基于超图形XGML的图像半结构化研究

国家自然科学基金

0+阅读 · 2012年12月31日

全局轨迹解析的通用框架和推理方法，以及在智能视频监控中的应用

国家自然科学基金

1+阅读 · 2011年12月31日

稳定高效的膦手性PCP类Pincer型催化剂的合成及应用研究

国家自然科学基金

0+阅读 · 2011年12月31日

PIAS1在颞叶癫痫海马神经元凋亡中的作用及其机制

国家自然科学基金

0+阅读 · 2008年12月31日

微信扫码咨询专知VIP会员