人类在理解和推理我们的三维视觉世界方面具有非凡的能力。通过仅仅几次随意的观察,我们就能把握周围环境的三维结构和外观,并在心中想象各种“如果”情景。相比之下,现有的三维系统做不到这一点。它们缺乏对世界的结构性理解,并且当被转移到不受限制的、部分观察到的、嘈杂的环境中时常常会出问题。为了缓解这一挑战,本论文专注于开发能够有效感知、建模和模拟三维世界的鲁棒计算工具,从不受约束的感官数据中出发。我们研究了动态三维世界理解的全谱:从机器人定位到识别,从静态三维重建到动态运动估计,以及从闭环仿真到三维生成。通过不仅在受控环境中,而且在稀疏、嘈杂,有时甚至是极端的现实世界环境中检查这些任务,我们旨在回答以下两个问题:(i)如何鲁棒地建模和推理我们所看到的可见世界;以及(ii)如何幻想未见之物,并以现实的方式想象新颖的场景。

成为VIP会员查看完整内容
31

相关内容

计算机视觉是一门研究如何使机器“看”的科学,更进一步的说,就是是指用摄影机和电脑代替人眼对目标进行识别、跟踪和测量等机器视觉,并进一步做图形处理,使电脑处理成为更适合人眼观察或传送给仪器检测的图像。作为一个科学学科,计算机视觉研究相关的理论和技术,试图建立能够从图像或者多维数据中获取‘信息’的人工智能系统。

知识荟萃

精品入门和进阶教程、论文和代码整理等

更多

查看相关VIP内容、论文、资讯等
【博士论文】大规模多模态表示学习,329页pdf
专知会员服务
65+阅读 · 1月27日
【悉尼大学博士论文】深度3D信息预测与理解,184页pdf
专知会员服务
40+阅读 · 2022年12月27日
【CMU博士论文】无人工监督的视觉表示与识别,126页pdf
专知会员服务
34+阅读 · 2022年12月14日
【NUS博士论文】学习视觉场景的结构化表示,137页pdf
专知会员服务
37+阅读 · 2022年7月15日
【MIT博士论文】数据高效强化学习,176页pdf
国家自然科学基金
5+阅读 · 2017年12月31日
国家自然科学基金
0+阅读 · 2015年12月31日
国家自然科学基金
1+阅读 · 2015年12月31日
国家自然科学基金
2+阅读 · 2015年12月31日
国家自然科学基金
2+阅读 · 2015年12月31日
国家自然科学基金
4+阅读 · 2015年12月31日
国家自然科学基金
2+阅读 · 2015年12月31日
国家自然科学基金
2+阅读 · 2014年12月31日
Arxiv
158+阅读 · 2023年4月20日
A Survey of Large Language Models
Arxiv
408+阅读 · 2023年3月31日
Arxiv
68+阅读 · 2023年3月26日
Arxiv
147+阅读 · 2023年3月24日
Arxiv
21+阅读 · 2023年3月17日
VIP会员
相关基金
国家自然科学基金
5+阅读 · 2017年12月31日
国家自然科学基金
0+阅读 · 2015年12月31日
国家自然科学基金
1+阅读 · 2015年12月31日
国家自然科学基金
2+阅读 · 2015年12月31日
国家自然科学基金
2+阅读 · 2015年12月31日
国家自然科学基金
4+阅读 · 2015年12月31日
国家自然科学基金
2+阅读 · 2015年12月31日
国家自然科学基金
2+阅读 · 2014年12月31日
微信扫码咨询专知VIP会员