从稀疏且无姿态的观测中推断3D结构是一个具有挑战性的任务,因为其本质上是不受约束的。近年来,一些方法提出直接从无姿态的输入中以数据驱动的方式预测隐式表示,取得了令人鼓舞的结果。然而,这些方法未能利用几何先验,也无法推测未见区域的外观,因此在重建精细的几何和纹理细节时面临困难。为了解决这一挑战,我们的核心思想是将这个病态问题重新表述为条件新视图合成,旨在通过有限的输入视图生成完整的观测,以促进重建过程。在生成完整观测后,可以轻松恢复输入视图的姿态,并进一步优化重建的对象。 为此,我们提出了一种新颖的管线——Pragmatist。首先,我们通过一个多视图条件扩散模型生成对象的完整观测。然后,我们利用一个前馈式的大型重建模型获得重建的网格。为了进一步提高重建质量,我们通过反演得到的3D表示恢复输入视图的姿态,并利用细节丰富的输入视图进一步优化纹理。与以往方法不同,我们的管线通过高效利用无姿态输入和生成先验,绕开了直接求解高度病态问题的困难。大量实验证明,我们的方法在多个基准上实现了令人满意的性能表现。 https://www.zhuanzhi.ai/paper/1a3a5e6819188894542bfbf467335b13

成为VIP会员查看完整内容
4

相关内容

【ICML2024】双曲几何潜在扩散模型用于图生成
专知会员服务
41+阅读 · 5月8日
【AAAI2023】用于复杂场景图像合成的特征金字塔扩散模型
【CVPR2022】多视图聚合的大规模三维语义分割
专知会员服务
20+阅读 · 2022年4月20日
【AAAI2022】基于图神经网络的统一离群点异常检测方法
专知会员服务
27+阅读 · 2022年2月12日
【SIGIR2021】基于嵌入的增量式时序知识图谱补全框架
专知会员服务
61+阅读 · 2021年4月21日
专知会员服务
18+阅读 · 2020年9月11日
【AAAI2023】用于图对比学习的谱特征增强
专知
18+阅读 · 2022年12月11日
【CVPR2021】跨模态检索的概率嵌入
专知
17+阅读 · 2021年3月2日
【NeurIPS2019】图变换网络:Graph Transformer Network
国家自然科学基金
2+阅读 · 2015年12月31日
国家自然科学基金
0+阅读 · 2015年12月31日
国家自然科学基金
0+阅读 · 2015年12月31日
国家自然科学基金
1+阅读 · 2015年12月31日
国家自然科学基金
0+阅读 · 2014年12月31日
国家自然科学基金
0+阅读 · 2014年12月31日
国家自然科学基金
3+阅读 · 2014年12月31日
国家自然科学基金
0+阅读 · 2014年12月31日
Arxiv
158+阅读 · 2023年4月20日
A Survey of Large Language Models
Arxiv
404+阅读 · 2023年3月31日
VIP会员
相关VIP内容
相关基金
国家自然科学基金
2+阅读 · 2015年12月31日
国家自然科学基金
0+阅读 · 2015年12月31日
国家自然科学基金
0+阅读 · 2015年12月31日
国家自然科学基金
1+阅读 · 2015年12月31日
国家自然科学基金
0+阅读 · 2014年12月31日
国家自然科学基金
0+阅读 · 2014年12月31日
国家自然科学基金
3+阅读 · 2014年12月31日
国家自然科学基金
0+阅读 · 2014年12月31日
微信扫码咨询专知VIP会员