Novel View Synthesis (NVS) has traditionally relied on models with explicit 3D inductive biases combined with known camera parameters from Structure-from-Motion (SfM) beforehand. Recent vision foundation models like VGGT take an orthogonal approach -- 3D knowledge is gained implicitly through training data and loss objectives, enabling feed-forward prediction of both camera parameters and 3D representations directly from a set of uncalibrated images. While flexible, VGGT features lack explicit multi-view geometric consistency, and we find that improving such 3D feature consistency benefits both NVS and pose estimation tasks. We introduce Selfi, a self-improving 3D reconstruction pipeline via feature alignment, transforming a VGGT backbone into a high-fidelity 3D reconstruction engine by leveraging its own outputs as pseudo-ground-truth. Specifically, we train a lightweight feature adapter using a reprojection-based consistency loss, which distills VGGT outputs into a new geometrically-aligned feature space that captures spatial proximity in 3D. This enables state-of-the-art performance in both NVS and camera pose estimation, demonstrating that feature alignment is a highly beneficial step for downstream 3D reasoning.


翻译:传统的新视角合成方法通常依赖于具有显式三维归纳偏置的模型,并结合预先通过运动恢复结构技术获取的已知相机参数。近期如VGGT等视觉基础模型采取了正交的研究路径——三维知识通过训练数据和损失目标隐式获取,从而能够直接从一组未标定图像中前馈预测相机参数与三维表征。尽管VGGT具备灵活性,但其特征缺乏显式的多视角几何一致性,我们发现提升此类三维特征一致性对新视角合成与姿态估计任务均有裨益。本文提出Selfi——一种通过特征对齐实现自改进的三维重建流程,该方法将VGGT主干网络转化为高保真三维重建引擎,其核心机制是利用自身输出作为伪真值进行迭代优化。具体而言,我们通过基于重投影的一致性损失训练轻量级特征适配器,将VGGT输出蒸馏至能够捕捉三维空间邻近关系的新几何对齐特征空间。该方法在新视角合成与相机姿态估计任务中均实现了最先进的性能,证明特征对齐对于下游三维推理是极具价值的关键步骤。

0
下载
关闭预览

相关内容

【AAAI2022】基于双流更新的视觉Transformer动态加速方法
专知会员服务
24+阅读 · 2021年12月11日
图机器学习 2.2-2.4 Properties of Networks, Random Graph
图与推荐
10+阅读 · 2020年3月28日
【NeurIPS2019】图变换网络:Graph Transformer Network
国家自然科学基金
1+阅读 · 2015年12月31日
国家自然科学基金
3+阅读 · 2015年12月31日
国家自然科学基金
0+阅读 · 2015年12月31日
国家自然科学基金
2+阅读 · 2015年12月31日
国家自然科学基金
0+阅读 · 2014年12月31日
VIP会员
相关基金
国家自然科学基金
1+阅读 · 2015年12月31日
国家自然科学基金
3+阅读 · 2015年12月31日
国家自然科学基金
0+阅读 · 2015年12月31日
国家自然科学基金
2+阅读 · 2015年12月31日
国家自然科学基金
0+阅读 · 2014年12月31日
Top
微信扫码咨询专知VIP会员