报告主题:Holistic 3D Reconstruction: Learning to Reconstruct Holistic 3D Structures from Sensorial Data
报告摘要:整体场景结构的感知,即场景中的有序,规则,对称或重复的模式和关系,在人类视觉中起着至关重要的作用。在办公楼等人造环境中行走时,人们可以立即识别平行线,矩形,长方体,旋转对称性,重复性图案以及许多其他类型的结构,并利用它们进行准确而强大的3D定位,定向和导航。在计算机视觉中,从各种传感器(例如单眼和双目视觉,LiDAR和RGB-D传感器)获取的数据中,使用此类整体结构元素对物理环境(尤其是人造环境)进行3D建模已有很长的历史。 。这些方法在创建高保真3D模型,提高3D视觉系统的准确性,鲁棒性和可靠性,以及为现代3D应用程序提供高级,紧凑且语义丰富的场景表示方面显示出巨大的成功和潜力。
在这种情况下,此次报告旨在汇集当前的研究进展,并讨论结构化场景的3D建模及其应用中的最新方法。报告将回顾3D结构的多视图几何学的基本理论;分析利用整体3D结构的传统和最新几何方法;当前概述了基于学习的方法和基于几何的方法的融合。最后,我们讨论了在人造环境的3D建模中结合重构和识别的未来可能的方向。
邀请嘉宾:马毅, 1995年获得中国清华大学自动化与应用数学博士学位,并获得硕士学位。 1997年获得EECS学位,2000年获得数学硕士学位。 于2000年从UC Berkeley获得EECS学位。 从2000年至2011年,他在伊利诺伊大学厄本那香槟分校的ECE系任教。从2009年至2013年,他是视觉计算小组的经理和微软研究院在亚洲的首席研究员。 2014年至2017年担任上海科技大学信息科学与技术学院教授和执行院长。他于2018年加入加州大学伯克利分校EECS系。
Zihan Zhou 是宾夕法尼亚州立大学信息科学与技术学院的教职员工。 在加入宾夕法尼亚州立大学之前,在伊利诺伊大学厄本那-香槟分校获得了电气和计算机工程博士学位。 分别于2007年和2007年从中国清华大学获得自动化学士学位,并于2010年从UIUC获得了ECE硕士学位。 其研究兴趣在于计算机视觉,机器学习,信号处理和应用数据科学的广泛领域。 特别关注3D Vision, 具体来说,曾开发了新颖的计算工具来对来自大型视觉数据的3D环境进行建模和分析,并将其应用于解决VR/AR,基于视觉的导航,建筑设计和工程,社交媒体等方面的现实世界难题。
Yasutaka Furukawa,西蒙弗雷泽大学计算机科学系的副教授, 曾是圣路易斯华盛顿大学的助理教授,Google的软件工程师。 在加入Google之前,是华盛顿大学的博士后研究员。 曾与华盛顿大学的Seitz教授和Curless教授以及Facebook的Rick Szeliski一起(曾在Microsoft Research工作)。