在自动驾驶、机器人、数字城市、以及虚拟/混合现实等应用的驱动下,三维视觉在近年来得到了广泛的关注。三维视觉研究主要围绕深度图像获取、视觉定位与制图、三维建模及三维理解等任务而展开。本文围绕上述三维视觉任务,对国内外研究进展进行了详细地综合评述和对比分析。首先,针对深度图像获取任务,本文从非端到端立体匹配、端到端立体匹配及无监督立体匹配三个方面对立体匹配研究进展进行了回顾,从深度回归网络和深度补全网络两个方面对单目深度估计研究进展进行了回顾。其次,针对视觉定位与制图任务,本文从端到端视觉定位和非端到端视觉定位两个方面对大场景下的视觉定位研究进展进行了回顾,并从视觉同步定位与地图构建和融合其它传感器的同步定位与地图构建两个方面对同步定位与地图构建的研究进展进行了回顾。再次,针对三维建模任务,本文从深度三维表征学习、深度三维生成模型、结构化表征学习与生成模型、以及基于深度学习的三维重建等四个方面对三维几何建模研究进展进行了回顾,并从多视RGB重建、单深度相机和多深度相机方法、以及单视图RGB方法等三个方面对人体动态建模研究进展进行了回顾。最后,针对三维理解任务,本文从点云语义分割和点云实例分割两个方面对点云语义理解研究进展进行了回顾。在此基础上,本文给出了三维视觉研究的未来发展趋势,旨在为相关研究者提供参考。
http://www.cjig.cn/jig/ch/reader/view_abstract.aspx?flag=2&file_no=202101210000002&journal_id=jig