NeRF-GAN蒸馏：卷积实现高效三维感知生成 (NeRF-GAN Distillation for Efficient 3D-Aware Generation with Convolutions) - 专知论文

会员服务 ·

0

卷积 · 3D · GANs · 蒸馏 · Networking ·

2023 年 3 月 22 日

NeRF-GAN Distillation for Efficient 3D-Aware Generation with Convolutions

翻译：NeRF-GAN蒸馏：卷积实现高效三维感知生成

Mohamad Shahbazi,Evangelos Ntavelis,Alessio Tonioni,Edo Collins,Danda Pani Paudel,Martin Danelljan,Luc Van Gool

Pose-conditioned convolutional generative models struggle with high-quality 3D-consistent image generation from single-view datasets, due to their lack of sufficient 3D priors. Recently, the integration of Neural Radiance Fields (NeRFs) and generative models, such as Generative Adversarial Networks (GANs), has transformed 3D-aware generation from single-view images. NeRF-GANs exploit the strong inductive bias of 3D neural representations and volumetric rendering at the cost of higher computational complexity. This study aims at revisiting pose-conditioned 2D GANs for efficient 3D-aware generation at inference time by distilling 3D knowledge from pretrained NeRF-GANS. We propose a simple and effective method, based on re-using the well-disentangled latent space of a pre-trained NeRF-GAN in a pose-conditioned convolutional network to directly generate 3D-consistent images corresponding to the underlying 3D representations. Experiments on several datasets demonstrate that the proposed method obtains results comparable with volumetric rendering in terms of quality and 3D consistency while benefiting from the superior computational advantage of convolutional networks. The code will be available at: https://github.com/mshahbazi72/NeRF-GAN-Distillation

翻译：对于从单视角数据集生成高质量三维连贯图像，姿态条件下的卷积生成模型存在困难，原因在于它们缺乏足够的三维先验知识。最近，Neural Radiance Fields(神经辐射场，简称NeRF)和生成式对抗网络(GAN)的集成，已经将从单视角图像感知三维生成进行了全面的转型。NeRF-GAN利用了三维神经表示和三维体素渲染的强归纳偏置，但是代价是更高的计算复杂度。本研究旨在通过从预训练的NeRF-GAN蒸馏三维知识，以实现卷积神经网络的姿态条件下高效的三维感知生成。我们提出了一种简单有效的方法，基于在姿态条件下的卷积网络中重复使用预先训练的NeRF-GAN的良好解缠结的潜空间，直接生成与底层三维表示相对应的三维连贯图像。在几个数据集上的实验表明，所提出的方法在质量和三维连贯性方面的表现可与体素渲染相媲美，同时也受益于卷积网络更优越的计算优势。代码可在https://github.com/mshahbazi72/NeRF-GAN-Distillation中获得。

0

相关内容

在数学（特别是功能分析）中，卷积是对两个函数（f和g）的数学运算，产生三个函数，表示第一个函数的形状如何被另一个函数修改。卷积一词既指结果函数，又指计算结果的过程。它定义为两个函数的乘积在一个函数反转和移位后的积分。并针对所有shift值评估积分，从而生成卷积函数。

【CVPR2023】SparseViT:重新审视高效高分辨率视觉Transformer的激活稀疏性

【CVPR2023】SparseViT:重新审视高效高分辨率视觉Transformer的激活稀疏性

专知会员服务

15+阅读 · 2023年4月2日

【斯坦福CVPR2022】EG3D:高效的几何感知三维生成对抗网络，EG3D: Efficient Geometry-aware 3D Generative Adversarial Networks

【斯坦福CVPR2022】EG3D:高效的几何感知三维生成对抗网络，EG3D: Efficient Geometry-aware 3D Generative Adversarial Networks

专知会员服务

18+阅读 · 2022年3月15日

【CVPR 2022】多模态视频字幕的端到端生成预训练，End-to-end Generative Pretraining for Multimodal Video Captioning

【CVPR 2022】多模态视频字幕的端到端生成预训练，End-to-end Generative Pretraining for Multimodal Video Captioning

专知会员服务

27+阅读 · 2022年3月3日

【ICCV 2021】HCFlow：使用一个统一的框架处理图像超分辨率和图像再缩放

专知会员服务

15+阅读 · 2021年10月4日

【CVPR2021】GAN人脸预训练模型

【CVPR2021】GAN人脸预训练模型

专知会员服务

24+阅读 · 2021年4月10日

【NeurIPS 2020】核基渐进蒸馏加法器神经网络

专知会员服务

18+阅读 · 2020年10月18日

【CVPR2020】通过自适应GANs生成不同的图像，Diverse Image Generation via Self-Conditioned GANs

【CVPR2020】通过自适应GANs生成不同的图像，Diverse Image Generation via Self-Conditioned GANs

专知会员服务

34+阅读 · 2020年6月19日

【ACL2020】用于生成深度问题的语义图，Semantic Graphs for Generating Deep Questions

【ACL2020】用于生成深度问题的语义图，Semantic Graphs for Generating Deep Questions

专知会员服务

26+阅读 · 2020年5月5日

必读的10篇 CVPR 2019【生成对抗网络】相关论文和代码

必读的10篇 CVPR 2019【生成对抗网络】相关论文和代码

专知会员服务

33+阅读 · 2020年1月10日

【ICCV2019最佳论文官方代码】Official pytorch implementation of the paper: "SinGAN: Learning a Generative Model from a Single Natural Image"(从单一自然图像中学习的无条件生成模型) 附PDF论文

【ICCV2019最佳论文官方代码】Official pytorch implementation of the paper: "SinGAN: Learning a Generative Model from a Single Natural Image"(从单一自然图像中学习的无条件生成模型) 附PDF论文

专知会员服务

22+阅读 · 2019年11月2日

ECCV 2022｜R2L: 用数据蒸馏加速NeRF

ECCV 2022｜R2L: 用数据蒸馏加速NeRF

机器之心

0+阅读 · 2022年8月1日

CVPR 2019 | 34篇 CVPR 2019 论文实现代码

CVPR 2019 | 34篇 CVPR 2019 论文实现代码

AI科技评论

21+阅读 · 2019年6月23日

CVPR 2019 | 重磅！34篇 CVPR2019 论文实现代码

CVPR 2019 | 重磅！34篇 CVPR2019 论文实现代码

AI研习社

11+阅读 · 2019年6月21日

【泡泡一分钟】FarSight：从户外图像中实现远距离深度估计

【泡泡一分钟】FarSight：从户外图像中实现远距离深度估计

泡泡机器人SLAM

11+阅读 · 2019年5月22日

vae 相关论文表示学习 1

vae 相关论文表示学习 1

CreateAMind

12+阅读 · 2018年9月6日

997篇-历史最全生成对抗网络（GAN）论文串烧

997篇-历史最全生成对抗网络（GAN）论文串烧

深度学习与NLP

16+阅读 · 2018年6月26日

【论文推荐】最新八篇生成对抗网络相关论文—条件翻译、RGB-D动作识别、量子生成对抗网络、语义对齐、视频摘要、视觉-文本注意力

【论文推荐】最新八篇生成对抗网络相关论文—条件翻译、RGB-D动作识别、量子生成对抗网络、语义对齐、视频摘要、视觉-文本注意力

专知

15+阅读 · 2018年5月15日

【论文推荐】最新5篇图像描述生成（Image Caption）相关论文—情感、注意力机制、遥感图像、序列到序列、深度神经结构

【论文推荐】最新5篇图像描述生成（Image Caption）相关论文—情感、注意力机制、遥感图像、序列到序列、深度神经结构

专知

66+阅读 · 2018年1月31日

【论文推荐】最新5篇图像分割相关论文—条件随机场和深度特征学习、移动端网络、长期视觉定位、主动学习、主动轮廓模型、生成对抗性网络

【论文推荐】最新5篇图像分割相关论文—条件随机场和深度特征学习、移动端网络、长期视觉定位、主动学习、主动轮廓模型、生成对抗性网络

专知

13+阅读 · 2018年1月23日

Generative Adversarial Text to Image Synthesis论文解读

Generative Adversarial Text to Image Synthesis论文解读

统计学习与视觉计算组

13+阅读 · 2017年6月9日

基于碳纳米管薄膜和钙钛矿型材料的高效、红外可透太阳电池的研究

国家自然科学基金

0+阅读 · 2014年12月31日

基于多信息局部相关模型的视频标注研究

国家自然科学基金

0+阅读 · 2013年12月31日

多视照片全局约束下的Kinect在线室内三维测图技术研究

国家自然科学基金

0+阅读 · 2013年12月31日

基于深度学习的时序3D深度图动作语义理解

国家自然科学基金

2+阅读 · 2013年12月31日

基于轻量模型的立体视频转换生成与编码技术研究

国家自然科学基金

0+阅读 · 2012年12月31日

混合存储结构感知的并行文件系统关键技术

国家自然科学基金

1+阅读 · 2011年12月31日

超精度视频内容三维重建

国家自然科学基金

0+阅读 · 2011年12月31日

基于量子点光诱导电子转移机制的可见光控制抗癌药物靶向释放的纳米载药体系

国家自然科学基金

0+阅读 · 2011年12月31日

立体图模型结构下的自然图像理解研究

国家自然科学基金

0+阅读 · 2009年12月31日

深部巷道围岩分区破裂机理的大规模科学计算与物理试验研究

国家自然科学基金

0+阅读 · 2008年12月31日

MV-Map: Offboard HD-Map Generation with Multi-view Consistency

Arxiv

0+阅读 · 2023年5月15日

Zero3D: Semantic-Driven Multi-Category 3D Shape Generation

Arxiv

0+阅读 · 2023年5月15日

SSD-MonoDTR: Supervised Scale-constrained Deformable Transformer for Monocular 3D Object Detection

Arxiv

0+阅读 · 2023年5月12日

T-former: An Efficient Transformer for Image Inpainting

Arxiv

0+阅读 · 2023年5月12日

Single-view Neural Radiance Fields with Depth Teacher

Arxiv

0+阅读 · 2023年5月11日

MagicVideo: Efficient Video Generation With Latent Diffusion Models

Arxiv

0+阅读 · 2023年5月11日

DaGAN++: Depth-Aware Generative Adversarial Network for Talking Head Video Generation

Arxiv

0+阅读 · 2023年5月10日

NeuralField-LDM: Scene Generation with Hierarchical Latent Diffusion Models

Arxiv

42+阅读 · 2023年4月19日

RandLA-Net: Efficient Semantic Segmentation of Large-Scale Point Clouds

Arxiv

11+阅读 · 2019年11月25日

Text Generation from Knowledge Graphs with Graph Transformers

Arxiv

35+阅读 · 2019年4月4日

VIP会员

文章信息

相关主题

相关VIP内容

【CVPR2023】SparseViT:重新审视高效高分辨率视觉Transformer的激活稀疏性

【CVPR2023】SparseViT:重新审视高效高分辨率视觉Transformer的激活稀疏性

专知会员服务

15+阅读 · 2023年4月2日

【斯坦福CVPR2022】EG3D:高效的几何感知三维生成对抗网络，EG3D: Efficient Geometry-aware 3D Generative Adversarial Networks

【斯坦福CVPR2022】EG3D:高效的几何感知三维生成对抗网络，EG3D: Efficient Geometry-aware 3D Generative Adversarial Networks

专知会员服务

18+阅读 · 2022年3月15日

【CVPR 2022】多模态视频字幕的端到端生成预训练，End-to-end Generative Pretraining for Multimodal Video Captioning

【CVPR 2022】多模态视频字幕的端到端生成预训练，End-to-end Generative Pretraining for Multimodal Video Captioning

专知会员服务

27+阅读 · 2022年3月3日

【ICCV 2021】HCFlow：使用一个统一的框架处理图像超分辨率和图像再缩放

专知会员服务

15+阅读 · 2021年10月4日

【CVPR2021】GAN人脸预训练模型

【CVPR2021】GAN人脸预训练模型

专知会员服务

24+阅读 · 2021年4月10日

【NeurIPS 2020】核基渐进蒸馏加法器神经网络

专知会员服务

18+阅读 · 2020年10月18日

【CVPR2020】通过自适应GANs生成不同的图像，Diverse Image Generation via Self-Conditioned GANs

【CVPR2020】通过自适应GANs生成不同的图像，Diverse Image Generation via Self-Conditioned GANs

专知会员服务

34+阅读 · 2020年6月19日

【ACL2020】用于生成深度问题的语义图，Semantic Graphs for Generating Deep Questions

【ACL2020】用于生成深度问题的语义图，Semantic Graphs for Generating Deep Questions

专知会员服务

26+阅读 · 2020年5月5日

必读的10篇 CVPR 2019【生成对抗网络】相关论文和代码

必读的10篇 CVPR 2019【生成对抗网络】相关论文和代码

专知会员服务

33+阅读 · 2020年1月10日

【ICCV2019最佳论文官方代码】Official pytorch implementation of the paper: "SinGAN: Learning a Generative Model from a Single Natural Image"(从单一自然图像中学习的无条件生成模型) 附PDF论文

【ICCV2019最佳论文官方代码】Official pytorch implementation of the paper: "SinGAN: Learning a Generative Model from a Single Natural Image"(从单一自然图像中学习的无条件生成模型) 附PDF论文

专知会员服务

22+阅读 · 2019年11月2日

热门VIP内容

开通专知VIP会员享更多权益服务

【博士论文】低维与高维空间中潜在表征的分析、建模与变换

《生态建模密码破译：建模与编程实践》美陆军最新报告

大模型解决方案白皮书：社交陪伴场景全流程落地指南

面向具身操作的视觉-语言-动作模型综述

相关资讯

ECCV 2022｜R2L: 用数据蒸馏加速NeRF

ECCV 2022｜R2L: 用数据蒸馏加速NeRF

机器之心

0+阅读 · 2022年8月1日

CVPR 2019 | 34篇 CVPR 2019 论文实现代码

CVPR 2019 | 34篇 CVPR 2019 论文实现代码

AI科技评论

21+阅读 · 2019年6月23日

CVPR 2019 | 重磅！34篇 CVPR2019 论文实现代码

CVPR 2019 | 重磅！34篇 CVPR2019 论文实现代码

AI研习社

11+阅读 · 2019年6月21日

【泡泡一分钟】FarSight：从户外图像中实现远距离深度估计

【泡泡一分钟】FarSight：从户外图像中实现远距离深度估计

泡泡机器人SLAM

11+阅读 · 2019年5月22日

vae 相关论文表示学习 1

vae 相关论文表示学习 1

CreateAMind

12+阅读 · 2018年9月6日

997篇-历史最全生成对抗网络（GAN）论文串烧

997篇-历史最全生成对抗网络（GAN）论文串烧

深度学习与NLP

16+阅读 · 2018年6月26日

【论文推荐】最新八篇生成对抗网络相关论文—条件翻译、RGB-D动作识别、量子生成对抗网络、语义对齐、视频摘要、视觉-文本注意力

【论文推荐】最新八篇生成对抗网络相关论文—条件翻译、RGB-D动作识别、量子生成对抗网络、语义对齐、视频摘要、视觉-文本注意力

专知

15+阅读 · 2018年5月15日

【论文推荐】最新5篇图像描述生成（Image Caption）相关论文—情感、注意力机制、遥感图像、序列到序列、深度神经结构

【论文推荐】最新5篇图像描述生成（Image Caption）相关论文—情感、注意力机制、遥感图像、序列到序列、深度神经结构

专知

66+阅读 · 2018年1月31日

【论文推荐】最新5篇图像分割相关论文—条件随机场和深度特征学习、移动端网络、长期视觉定位、主动学习、主动轮廓模型、生成对抗性网络

【论文推荐】最新5篇图像分割相关论文—条件随机场和深度特征学习、移动端网络、长期视觉定位、主动学习、主动轮廓模型、生成对抗性网络

专知

13+阅读 · 2018年1月23日

Generative Adversarial Text to Image Synthesis论文解读

Generative Adversarial Text to Image Synthesis论文解读

统计学习与视觉计算组

13+阅读 · 2017年6月9日

相关论文

MV-Map: Offboard HD-Map Generation with Multi-view Consistency

Arxiv

0+阅读 · 2023年5月15日

Zero3D: Semantic-Driven Multi-Category 3D Shape Generation

Arxiv

0+阅读 · 2023年5月15日

SSD-MonoDTR: Supervised Scale-constrained Deformable Transformer for Monocular 3D Object Detection

Arxiv

0+阅读 · 2023年5月12日

T-former: An Efficient Transformer for Image Inpainting

Arxiv

0+阅读 · 2023年5月12日

Single-view Neural Radiance Fields with Depth Teacher

Arxiv

0+阅读 · 2023年5月11日

MagicVideo: Efficient Video Generation With Latent Diffusion Models

Arxiv

0+阅读 · 2023年5月11日

DaGAN++: Depth-Aware Generative Adversarial Network for Talking Head Video Generation

Arxiv

0+阅读 · 2023年5月10日

NeuralField-LDM: Scene Generation with Hierarchical Latent Diffusion Models

Arxiv

42+阅读 · 2023年4月19日

RandLA-Net: Efficient Semantic Segmentation of Large-Scale Point Clouds

Arxiv

11+阅读 · 2019年11月25日

Text Generation from Knowledge Graphs with Graph Transformers

Arxiv

35+阅读 · 2019年4月4日

相关基金

基于碳纳米管薄膜和钙钛矿型材料的高效、红外可透太阳电池的研究

国家自然科学基金

0+阅读 · 2014年12月31日

基于多信息局部相关模型的视频标注研究

国家自然科学基金

0+阅读 · 2013年12月31日

多视照片全局约束下的Kinect在线室内三维测图技术研究

国家自然科学基金

0+阅读 · 2013年12月31日

基于深度学习的时序3D深度图动作语义理解

国家自然科学基金

2+阅读 · 2013年12月31日

基于轻量模型的立体视频转换生成与编码技术研究

国家自然科学基金

0+阅读 · 2012年12月31日

混合存储结构感知的并行文件系统关键技术

国家自然科学基金

1+阅读 · 2011年12月31日

超精度视频内容三维重建

国家自然科学基金

0+阅读 · 2011年12月31日

基于量子点光诱导电子转移机制的可见光控制抗癌药物靶向释放的纳米载药体系

国家自然科学基金

0+阅读 · 2011年12月31日

立体图模型结构下的自然图像理解研究

国家自然科学基金

0+阅读 · 2009年12月31日

深部巷道围岩分区破裂机理的大规模科学计算与物理试验研究

国家自然科学基金

0+阅读 · 2008年12月31日

微信扫码咨询专知VIP会员