Recent advances in 3D scene generation produce visually appealing output, but current representations hinder artists' workflows that require modifiable 3D textured mesh scenes for visual effects and game development. Despite significant advances, current textured mesh scene reconstruction methods are far from artist ready, suffering from incorrect object decomposition, inaccurate spatial relationships, and missing backgrounds. We present 3D-RE-GEN, a compositional framework that reconstructs a single image into textured 3D objects and a background. We show that combining state of the art models from specific domains achieves state of the art scene reconstruction performance, addressing artists' requirements. Our reconstruction pipeline integrates models for asset detection, reconstruction, and placement, pushing certain models beyond their originally intended domains. Obtaining occluded objects is treated as an image editing task with generative models to infer and reconstruct with scene level reasoning under consistent lighting and geometry. Unlike current methods, 3D-RE-GEN generates a comprehensive background that spatially constrains objects during optimization and provides a foundation for realistic lighting and simulation tasks in visual effects and games. To obtain physically realistic layouts, we employ a novel 4-DoF differentiable optimization that aligns reconstructed objects with the estimated ground plane. 3D-RE-GEN~achieves state of the art performance in single image 3D scene reconstruction, producing coherent, modifiable scenes through compositional generation guided by precise camera recovery and spatial optimization.


翻译:近年来,三维场景生成技术取得了显著进展,能够产生视觉上吸引人的输出,但当前的表示形式阻碍了艺术家的工作流程,后者需要可修改的带纹理三维网格场景以用于视觉效果和游戏开发。尽管已有重大进展,但当前的带纹理网格场景重建方法远未达到艺术家可用的程度,存在物体分解错误、空间关系不准确以及背景缺失等问题。我们提出了3D-RE-GEN,一个组合式框架,可将单张图像重建为带纹理的三维物体和背景。我们证明,结合特定领域的最先进模型可以实现最先进的场景重建性能,满足艺术家的需求。我们的重建流程集成了用于资产检测、重建和放置的模型,并将某些模型的应用范围推至其最初设计领域之外。获取被遮挡物体被视为一项图像编辑任务,利用生成式模型在一致的照明和几何条件下,通过场景级推理进行推断和重建。与现有方法不同,3D-RE-GEN生成了一个全面的背景,该背景在优化过程中对物体施加空间约束,并为视觉效果和游戏中的真实感照明与仿真任务提供了基础。为了获得物理上合理的布局,我们采用了一种新颖的4自由度可微分优化方法,将重建物体与估计的地平面对齐。3D-RE-GEN在单图像三维场景重建中实现了最先进的性能,通过精确相机恢复和空间优化引导的组合式生成,产生了连贯、可修改的场景。

0
下载
关闭预览

相关内容

专知会员服务
22+阅读 · 2021年8月20日
Python图像处理,366页pdf,Image Operators Image Processing in Python
CVPR 2019 | 无监督领域特定单图像去模糊
PaperWeekly
14+阅读 · 2019年3月20日
LibRec 每周算法:LDA主题模型
LibRec智能推荐
29+阅读 · 2017年12月4日
国家自然科学基金
1+阅读 · 2015年12月31日
国家自然科学基金
3+阅读 · 2015年12月31日
国家自然科学基金
0+阅读 · 2015年12月31日
国家自然科学基金
0+阅读 · 2014年12月31日
国家自然科学基金
0+阅读 · 2014年12月31日
VIP会员
相关基金
国家自然科学基金
1+阅读 · 2015年12月31日
国家自然科学基金
3+阅读 · 2015年12月31日
国家自然科学基金
0+阅读 · 2015年12月31日
国家自然科学基金
0+阅读 · 2014年12月31日
国家自然科学基金
0+阅读 · 2014年12月31日
Top
微信扫码咨询专知VIP会员