靠网上晒的景点照就能还原3D建模，浙大团队这是要带我们云旅游？｜SIGGRAPH 2022

会员服务 ·

靠网上晒的景点照就能还原3D建模，浙大团队这是要带我们云旅游？｜SIGGRAPH 2022

2022 年 5 月 27 日 量子位

梦晨发自凹非寺
量子位 | 公众号 QbitAI

以NeRF为代表的神经渲染技术高速发展，学界已经不满足合成几个新视角让照片动起来了。

接下来要挑战的是根据照片直接输出3D模型，可以直接导入到电影、游戏和VR等图形生产线里的那种。

所用照片不是出自高质量数据库，就是直接从网上搜集游客拍摄的各大景点，设备、天气、距离角度等都会不一致。

生成的结果远看结构完整，近看细节丰富，如果你有VR设备也可以在Demo中直接预览3D版。

这项最新突破由浙江大学和康奈尔大学团队合作完成，登上图形学顶会SIGGRAPH 2022。

而在这之前，同类技术生成的3D模型连形状完整都做不到。

看到这里，网友纷纷表示这个领域的进展比人们想象的要快。

“慢点学，等等我”。

那么，这项研究靠什么取得了突破？

融合两种采样方式

具体来说，这项研究的基本框架借鉴了NeurIPS 2021上的NeuS，一种把隐式神经标准和体积渲染结合起来的方法。

但是NeuS使用基于球体的采样（Sphere-based sampling）方法，对于近景、小物体来说还算适合。

用于结构复杂的大型建筑物的话会有大量采样点采在空白区域，增加大量不必要的计算压力。

为解决这个问题，研究人员提出体素引导（Voxel-guided）和表面引导（Surface-guided）混合的新采样方法。

体素引导可以避免不必要的浪费，训练时所需射线（Traning ray）可以减少30%。

再结合表面引导增加真实曲面周围的采样密度，帮助神经网络更好拟合，避免丢失细节。

在消融实验中可以看到，仅使用体素引导方法收敛的比基于球体的方法快，但不如混合方法细节丰富。

与之前同类研究对比，新方法生成模型的完整性和细节方面更出色。

训练速度上也有明显优势，特别是在大型场景墨西哥城美术宫（PBA）。

△Ours为完全收敛结果，带小人图标的是训练过程中一个检查点

当然，新方法也不是完全没有缺点。

一个继承自NeRF的局限性是，如果相机位置校准有偏差会影响最终结果。

还有一个难以解决的问题，就是照片拍不到的建筑物背面和内部就无法精确重建了。

One More Thing

最后再补充一点，浙大团队中一些成员，之前还研究了神经3D人体重建。

可应用于为体育比赛提供自由视角的视频重放。

也是666了。

论文地址：
https://arxiv.org/abs/2205.12955

GitHub仓库：
https://zju3dv.github.io/neuralrecon-w/

参考链接：
[1]https://zju3dv.github.io/neuralbody/

— 完 —

「人工智能」、「智能汽车」微信社群邀你加入！

欢迎关注人工智能、智能汽车的小伙伴们加入我们，与AI从业者交流、切磋，不错过最新行业发展&技术进展。

ps.加好友请务必备注您的姓名-公司-职位哦~

点这里👇关注我，记得标星哦～

一键三连「分享」、「点赞」和「在看」

科技前沿进展日日相见~

登录查看更多

相关内容

SIGGRAPH 2022

关注 2

计算机图形学顶会SIGGRAPH 2022最佳论文奖出炉！英伟达等五篇论文斩获！

专知会员服务

22+阅读 · 2022年7月7日

【CVPR 2022】单目3D语义场景完成框架，MonoScene: Monocular 3D Semantic Scene Completion

专知会员服务

15+阅读 · 2022年3月3日

CVPR2021-单目实时全身捕捉的方法

专知会员服务

20+阅读 · 2021年3月18日

Query2box: 使用盒嵌入对向量空间中的知识图谱进行推理，Query2box: Reasoning over Knowledge Graphs in Vector Space Using Box Embeddings

专知会员服务

46+阅读 · 2020年5月11日

【上海交大-ICASSP2020】Transformer端到端的多说话人语音识别

专知会员服务

51+阅读 · 2020年2月16日

浙大提出神经3D重建新工作！收录图形学顶会SIGGRAPH 2022

CVer

1+阅读 · 2022年5月28日

买不起手办就用AI渲染一个！用网上随便搜的图就能合成，已有网友开炒游戏NFT

量子位

0+阅读 · 2022年2月20日

3D模型“换皮肤”有多简单？也就一句话的事

量子位

0+阅读 · 2021年12月29日

虚拟在左，真实在右：德国学者用AI合成一亿像素逼真3D图像，可任意旋转

THU数据派

0+阅读 · 2021年10月19日

头像神器！照片一键秒转简笔画，清华刘永进等CVPR 19 Oral研究 | 在线可玩

量子位

18+阅读 · 2019年6月16日

基于3D稀疏表示的多模态神经导航关键技术研究

国家自然科学基金

0+阅读 · 2015年12月31日

数据驱动的人体图像语义分割研究

国家自然科学基金

4+阅读 · 2014年12月31日

采用单个手持RGB-D 像机的无标记人体运动捕获方法研究

国家自然科学基金

0+阅读 · 2013年12月31日

基于随机回归森林与多源数据融合的高精度三维动态形状获取

国家自然科学基金

0+阅读 · 2012年12月31日

基于2D视频视觉关注度的3D重建方法研究

国家自然科学基金

0+阅读 · 2009年12月31日

Transplantation of Conversational Speaking Style with Interjections in Sequence-to-Sequence Speech Synthesis

Arxiv

0+阅读 · 2022年7月25日

NeurAR: Neural Uncertainty for Autonomous 3D Reconstruction

Arxiv

0+阅读 · 2022年7月22日

Neural Collaborative Reasoning

Arxiv

13+阅读 · 2021年5月3日

Dynamic Neural Networks: A Survey

Arxiv

37+阅读 · 2021年2月10日

Differentiable Reasoning on Large Knowledge Bases and Natural Language

Arxiv

12+阅读 · 2019年12月17日

VIP会员