项目名称: 基于深度与图像信息融合的场景理解及应用

项目编号: No.61203279

项目类型: 青年科学基金项目

立项/批准年度: 2013

项目学科: 自动化学科

项目作者: 王海波

作者单位: 山东大学

项目金额: 24万元

中文摘要: 场景理解是一个在数字城市构建、机器人导航、无人驾驶和虚拟现实等诸多领域有着广泛应用的重要研究方向。虽然有着多年的研究,但由于三维重建技术的不成熟,解析复杂的场景仍是一个难点问题。为此,本项目提出了一种基于深度和图像信息融合的三维场景理解的新方法。利用深度图像与可见光图像的互补性,定义了判别性高且对光照变化、遮挡等干扰信号鲁棒的三维低层基元特征;在匹配过程中,加入了中层语义信息和可变先验模型约束,并通过求解一个有约束的二次规划问题实现三维场景匹配和姿态估计,最终实现完整的场景重建。在此基础上,利用分类学习的方法识别地形、根据几何信息的推理检测障碍物和匹配三维场景实现场景识别,有效地解决了四足机器人平稳落足点的选择、群机器人的自主避障和移动机器人的自主导航和定位等难点问题。

中文关键词: 深度信息修复;三维头部跟踪;跌倒检测;运动去模糊;RGB深度信息融合

英文摘要: Scene understanding has wide applications in many fields, ranging from digital city construction, robot navigation, autonomous driving to virtual reality. In spite of numerous efforts in the past decade, understanding complex scenes remains an unsolved challenge due to lacking efficient 3D reconstruction method. This project proposes a new method towards understanding full 3D natural scenes in real time. It relies essentially on fusing depth and visual image cues. We first extract basic features that are discriminative and highly robust to lighting and occlusions to match with each other. During the course of matching, we integrate middle-level contexts and adaptive priors to improve the matching rate. By viewing feature matching as a constrained quadratic programming problem, natural scenes are efficiently registered and 3D pose is correctly estimated. Following the results, we utilize machine learning tools to recognize terrain, rely on 3D geometry inference to detect obstacles and recognize scenes via 3D scene registration, which can effectively solve the challenging problems of foothold selection in a walking robot, obstacle avoiding in swarm robotics and SLAM in a mobile robot.

英文关键词: depth inpainting;3D head tracking;fall detection;motion deblurrng;RGB and depth fusion

成为VIP会员查看完整内容
0

相关内容

【博士论文】基于深度学习的单目场景深度估计方法研究
基于RGB-D图像的语义场景补全研究进展综述
专知会员服务
28+阅读 · 2021年11月8日
面向行人重识别的局部特征研究进展、挑战与展望
专知会员服务
26+阅读 · 2021年10月13日
专知会员服务
62+阅读 · 2021年4月16日
专知会员服务
55+阅读 · 2021年3月5日
「深度图像检索: 2012到2020」大综述论文,21页pdf
专知会员服务
41+阅读 · 2021年1月30日
专知会员服务
69+阅读 · 2021年1月16日
基于视觉的三维重建关键技术研究综述
专知会员服务
160+阅读 · 2020年5月1日
【泡泡一分钟】用于视角可变重定位的语义地图构建
泡泡机器人SLAM
19+阅读 · 2019年10月21日
【泡泡图灵智库】LIMO: LiDAR-单目相机视觉里程计(arXiv)
泡泡机器人SLAM
48+阅读 · 2019年5月14日
计算机视觉方向简介 | 基于单目视觉的三维重建算法
计算机视觉life
30+阅读 · 2019年4月9日
视觉SLAM技术综述
计算机视觉life
25+阅读 · 2019年1月4日
【深度】行人检测算法
GAN生成式对抗网络
29+阅读 · 2018年6月3日
国家自然科学基金
1+阅读 · 2015年12月31日
国家自然科学基金
1+阅读 · 2015年12月31日
国家自然科学基金
1+阅读 · 2014年12月31日
国家自然科学基金
1+阅读 · 2014年12月31日
国家自然科学基金
12+阅读 · 2014年12月31日
国家自然科学基金
1+阅读 · 2013年12月31日
国家自然科学基金
4+阅读 · 2013年12月31日
国家自然科学基金
0+阅读 · 2013年12月31日
国家自然科学基金
0+阅读 · 2012年12月31日
国家自然科学基金
0+阅读 · 2012年12月31日
Arxiv
0+阅读 · 2022年4月20日
Arxiv
0+阅读 · 2022年4月20日
Arxiv
0+阅读 · 2022年4月19日
Arxiv
3+阅读 · 2022年4月19日
Arxiv
0+阅读 · 2022年4月19日
Arxiv
22+阅读 · 2018年8月30日
小贴士
相关VIP内容
【博士论文】基于深度学习的单目场景深度估计方法研究
基于RGB-D图像的语义场景补全研究进展综述
专知会员服务
28+阅读 · 2021年11月8日
面向行人重识别的局部特征研究进展、挑战与展望
专知会员服务
26+阅读 · 2021年10月13日
专知会员服务
62+阅读 · 2021年4月16日
专知会员服务
55+阅读 · 2021年3月5日
「深度图像检索: 2012到2020」大综述论文,21页pdf
专知会员服务
41+阅读 · 2021年1月30日
专知会员服务
69+阅读 · 2021年1月16日
基于视觉的三维重建关键技术研究综述
专知会员服务
160+阅读 · 2020年5月1日
相关资讯
【泡泡一分钟】用于视角可变重定位的语义地图构建
泡泡机器人SLAM
19+阅读 · 2019年10月21日
【泡泡图灵智库】LIMO: LiDAR-单目相机视觉里程计(arXiv)
泡泡机器人SLAM
48+阅读 · 2019年5月14日
计算机视觉方向简介 | 基于单目视觉的三维重建算法
计算机视觉life
30+阅读 · 2019年4月9日
视觉SLAM技术综述
计算机视觉life
25+阅读 · 2019年1月4日
【深度】行人检测算法
GAN生成式对抗网络
29+阅读 · 2018年6月3日
相关基金
国家自然科学基金
1+阅读 · 2015年12月31日
国家自然科学基金
1+阅读 · 2015年12月31日
国家自然科学基金
1+阅读 · 2014年12月31日
国家自然科学基金
1+阅读 · 2014年12月31日
国家自然科学基金
12+阅读 · 2014年12月31日
国家自然科学基金
1+阅读 · 2013年12月31日
国家自然科学基金
4+阅读 · 2013年12月31日
国家自然科学基金
0+阅读 · 2013年12月31日
国家自然科学基金
0+阅读 · 2012年12月31日
国家自然科学基金
0+阅读 · 2012年12月31日
相关论文
Arxiv
0+阅读 · 2022年4月20日
Arxiv
0+阅读 · 2022年4月20日
Arxiv
0+阅读 · 2022年4月19日
Arxiv
3+阅读 · 2022年4月19日
Arxiv
0+阅读 · 2022年4月19日
Arxiv
22+阅读 · 2018年8月30日
微信扫码咨询专知VIP会员