基于深度与图像信息融合的场景理解及应用 - 专知基金

会员服务 ·

0

深度信息修复 · 三维头部跟踪 · 跌倒检测 · 运动去模糊 · RGB深度信息融合 ·

2012 年 12 月 31 日

基于深度与图像信息融合的场景理解及应用

国家自然科学基金

国家自然科学基金委员会

项目名称： 基于深度与图像信息融合的场景理解及应用

项目编号： No.61203279

项目类型： 青年科学基金项目

立项/批准年度： 2013

项目学科： 自动化学科

项目作者： 王海波

作者单位： 山东大学

项目金额： 24万元

中文摘要： 场景理解是一个在数字城市构建、机器人导航、无人驾驶和虚拟现实等诸多领域有着广泛应用的重要研究方向。虽然有着多年的研究，但由于三维重建技术的不成熟，解析复杂的场景仍是一个难点问题。为此，本项目提出了一种基于深度和图像信息融合的三维场景理解的新方法。利用深度图像与可见光图像的互补性，定义了判别性高且对光照变化、遮挡等干扰信号鲁棒的三维低层基元特征；在匹配过程中，加入了中层语义信息和可变先验模型约束，并通过求解一个有约束的二次规划问题实现三维场景匹配和姿态估计，最终实现完整的场景重建。在此基础上，利用分类学习的方法识别地形、根据几何信息的推理检测障碍物和匹配三维场景实现场景识别，有效地解决了四足机器人平稳落足点的选择、群机器人的自主避障和移动机器人的自主导航和定位等难点问题。

中文关键词： 深度信息修复；三维头部跟踪；跌倒检测；运动去模糊；RGB深度信息融合

英文摘要： Scene understanding has wide applications in many fields, ranging from digital city construction, robot navigation, autonomous driving to virtual reality. In spite of numerous efforts in the past decade, understanding complex scenes remains an unsolved challenge due to lacking efficient 3D reconstruction method. This project proposes a new method towards understanding full 3D natural scenes in real time. It relies essentially on fusing depth and visual image cues. We first extract basic features that are discriminative and highly robust to lighting and occlusions to match with each other. During the course of matching, we integrate middle-level contexts and adaptive priors to improve the matching rate. By viewing feature matching as a constrained quadratic programming problem, natural scenes are efficiently registered and 3D pose is correctly estimated. Following the results, we utilize machine learning tools to recognize terrain, rely on 3D geometry inference to detect obstacles and recognize scenes via 3D scene registration, which can effectively solve the challenging problems of foothold selection in a walking robot, obstacle avoiding in swarm robotics and SLAM in a mobile robot.

英文关键词： depth inpainting；3D head tracking；fall detection；motion deblurrng；RGB and depth fusion

成为VIP会员查看完整内容

0

相关内容

深度信息修复

深度信息修复

【博士论文】基于深度学习的单目场景深度估计方法研究

【博士论文】基于深度学习的单目场景深度估计方法研究

专知会员服务

56+阅读 · 2021年12月8日

基于RGB-D图像的语义场景补全研究进展综述

基于RGB-D图像的语义场景补全研究进展综述

专知会员服务

29+阅读 · 2021年11月8日

面向行人重识别的局部特征研究进展、挑战与展望

面向行人重识别的局部特征研究进展、挑战与展望

专知会员服务

27+阅读 · 2021年10月13日

人工智能与法律结合的现状及发展趋势

专知会员服务

63+阅读 · 2021年4月16日

深度人脸表情识别研究进展

专知会员服务

56+阅读 · 2021年3月5日

「深度图像检索: 2012到2020」大综述论文，21页pdf

「深度图像检索: 2012到2020」大综述论文，21页pdf

专知会员服务

43+阅读 · 2021年1月30日

基于深度学习的点云语义分割研究综述

专知会员服务

73+阅读 · 2021年1月16日

【浙大博士论文】面向复杂场景理解的视觉内容识别、检测与推理方法研究

【浙大博士论文】面向复杂场景理解的视觉内容识别、检测与推理方法研究

专知会员服务

147+阅读 · 2020年7月26日

基于视觉的三维重建关键技术研究综述

基于视觉的三维重建关键技术研究综述

专知会员服务

166+阅读 · 2020年5月1日

CVPR 2020 | MetaFuse：用于人体姿态估计的预训练信息融合模型

CVPR 2020 | MetaFuse：用于人体姿态估计的预训练信息融合模型

专知会员服务

25+阅读 · 2020年4月2日

【博士论文】基于深度学习的单目场景深度估计方法研究

【博士论文】基于深度学习的单目场景深度估计方法研究

专知

0+阅读 · 2021年12月8日

【泡泡一分钟】用于视角可变重定位的语义地图构建

【泡泡一分钟】用于视角可变重定位的语义地图构建

泡泡机器人SLAM

19+阅读 · 2019年10月21日

【泡泡图灵智库】多传感器深度连续融合的三维目标检测方法

【泡泡图灵智库】多传感器深度连续融合的三维目标检测方法

泡泡机器人SLAM

23+阅读 · 2019年9月7日

【泡泡图灵智库】DenseFusion:基于迭代密集融合的6D目标姿态估计

【泡泡图灵智库】DenseFusion:基于迭代密集融合的6D目标姿态估计

泡泡机器人SLAM

16+阅读 · 2019年9月3日

【泡泡图灵智库】LIMO: LiDAR-单目相机视觉里程计（arXiv）

【泡泡图灵智库】LIMO: LiDAR-单目相机视觉里程计（arXiv）

泡泡机器人SLAM

48+阅读 · 2019年5月14日

计算机视觉方向简介 | 基于单目视觉的三维重建算法

计算机视觉方向简介 | 基于单目视觉的三维重建算法

计算机视觉life

31+阅读 · 2019年4月9日

视觉SLAM技术综述

视觉SLAM技术综述

计算机视觉life

25+阅读 · 2019年1月4日

【泡泡点云时空】利用超点图的大场景点云语义分割(CVPR2018-5)

【泡泡点云时空】利用超点图的大场景点云语义分割(CVPR2018-5)

泡泡机器人SLAM

29+阅读 · 2018年8月14日

【深度】行人检测算法

【深度】行人检测算法

GAN生成式对抗网络

29+阅读 · 2018年6月3日

【ICCV 目标跟踪性能最优】首个应用残差学习的深度目标跟踪算法

【ICCV 目标跟踪性能最优】首个应用残差学习的深度目标跟踪算法

新智元

35+阅读 · 2017年9月10日

基于分层与或图模型的光学遥感图像场景理解方法研究

国家自然科学基金

1+阅读 · 2015年12月31日

场景深度关系下的视频遮挡目标检测

国家自然科学基金

1+阅读 · 2015年12月31日

基于深度信息和显著计算的手势交互技术研究及应用

国家自然科学基金

1+阅读 · 2014年12月31日

基于距离图像局部特征的三维形变目标识别技术

国家自然科学基金

1+阅读 · 2014年12月31日

基于深度学习的特征融合在移动机器人视觉中的场景理解及研究

国家自然科学基金

12+阅读 · 2014年12月31日

基于结构化低秩表示的运动目标分割研究

国家自然科学基金

1+阅读 · 2013年12月31日

基于深度信息和深度学习的车载视觉行人检测方法研究

国家自然科学基金

4+阅读 · 2013年12月31日

仿视觉感知机制的图像场景语义分类研究

国家自然科学基金

1+阅读 · 2013年12月31日

基于弱监督学习和深度信息的目标跟踪算法研究

国家自然科学基金

0+阅读 · 2012年12月31日

基于多层上下文关系的图像目标识别关键技术研究

国家自然科学基金

0+阅读 · 2012年12月31日

SPTS: Single-Point Text Spotting

Arxiv

0+阅读 · 2022年4月20日

Situational Perception Guided Image Matting

Arxiv

0+阅读 · 2022年4月20日

An Energy-Based Prior for Generative Saliency

Arxiv

0+阅读 · 2022年4月19日

Multimodal Token Fusion for Vision Transformers

Arxiv

3+阅读 · 2022年4月19日

NAFSSR: Stereo Image Super-Resolution Using NAFNet

Arxiv

0+阅读 · 2022年4月19日

Caption Feature Space Regularization for Audio Captioning

Arxiv

0+阅读 · 2022年4月18日

TASTEset -- Recipe Dataset and Food Entities Recognition Benchmark

Arxiv

0+阅读 · 2022年4月16日

Image-to-Image Retrieval by Learning Similarity between Scene Graphs

Arxiv

21+阅读 · 2020年12月29日

Notes on Deep Learning for NLP

Arxiv

22+阅读 · 2018年8月30日

NDDR-CNN: Layer-wise Feature Fusing in Multi-Task CNN by Neural Discriminative Dimensionality Reduction

Arxiv

15+阅读 · 2018年1月25日

阅读: 0 点赞: 0

小贴士

登录享主题订阅及个性化推荐

相关主题

深度信息修复

三维头部跟踪

运动去模糊

RGB深度信息融合

热门VIP内容

开通专知VIP会员享更多权益服务

《战场能源实战化最佳实践：大规模作战中的发电、储能与配电体系》美陆军最新报告

《大西洋决心行动及涉乌克兰美国政府活动报告》最新120页

战术边缘计算：加速军事情报周期革命

《现代环境不确定性下的多域作战：小国防御体系构建》

相关VIP内容

【博士论文】基于深度学习的单目场景深度估计方法研究

【博士论文】基于深度学习的单目场景深度估计方法研究

专知会员服务

56+阅读 · 2021年12月8日

基于RGB-D图像的语义场景补全研究进展综述

基于RGB-D图像的语义场景补全研究进展综述

专知会员服务

29+阅读 · 2021年11月8日

面向行人重识别的局部特征研究进展、挑战与展望

面向行人重识别的局部特征研究进展、挑战与展望

专知会员服务

27+阅读 · 2021年10月13日

人工智能与法律结合的现状及发展趋势

专知会员服务

63+阅读 · 2021年4月16日

深度人脸表情识别研究进展

专知会员服务

56+阅读 · 2021年3月5日

「深度图像检索: 2012到2020」大综述论文，21页pdf

「深度图像检索: 2012到2020」大综述论文，21页pdf

专知会员服务

43+阅读 · 2021年1月30日

基于深度学习的点云语义分割研究综述

专知会员服务

73+阅读 · 2021年1月16日

【浙大博士论文】面向复杂场景理解的视觉内容识别、检测与推理方法研究

【浙大博士论文】面向复杂场景理解的视觉内容识别、检测与推理方法研究

专知会员服务

147+阅读 · 2020年7月26日

基于视觉的三维重建关键技术研究综述

基于视觉的三维重建关键技术研究综述

专知会员服务

166+阅读 · 2020年5月1日

CVPR 2020 | MetaFuse：用于人体姿态估计的预训练信息融合模型

CVPR 2020 | MetaFuse：用于人体姿态估计的预训练信息融合模型

专知会员服务

25+阅读 · 2020年4月2日

相关资讯

【博士论文】基于深度学习的单目场景深度估计方法研究

【博士论文】基于深度学习的单目场景深度估计方法研究

专知

0+阅读 · 2021年12月8日

【泡泡一分钟】用于视角可变重定位的语义地图构建

【泡泡一分钟】用于视角可变重定位的语义地图构建

泡泡机器人SLAM

19+阅读 · 2019年10月21日

【泡泡图灵智库】多传感器深度连续融合的三维目标检测方法

【泡泡图灵智库】多传感器深度连续融合的三维目标检测方法

泡泡机器人SLAM

23+阅读 · 2019年9月7日

【泡泡图灵智库】DenseFusion:基于迭代密集融合的6D目标姿态估计

【泡泡图灵智库】DenseFusion:基于迭代密集融合的6D目标姿态估计

泡泡机器人SLAM

16+阅读 · 2019年9月3日

【泡泡图灵智库】LIMO: LiDAR-单目相机视觉里程计（arXiv）

【泡泡图灵智库】LIMO: LiDAR-单目相机视觉里程计（arXiv）

泡泡机器人SLAM

48+阅读 · 2019年5月14日

计算机视觉方向简介 | 基于单目视觉的三维重建算法

计算机视觉方向简介 | 基于单目视觉的三维重建算法

计算机视觉life

31+阅读 · 2019年4月9日

视觉SLAM技术综述

视觉SLAM技术综述

计算机视觉life

25+阅读 · 2019年1月4日

【泡泡点云时空】利用超点图的大场景点云语义分割(CVPR2018-5)

【泡泡点云时空】利用超点图的大场景点云语义分割(CVPR2018-5)

泡泡机器人SLAM

29+阅读 · 2018年8月14日

【深度】行人检测算法

【深度】行人检测算法

GAN生成式对抗网络

29+阅读 · 2018年6月3日

【ICCV 目标跟踪性能最优】首个应用残差学习的深度目标跟踪算法

【ICCV 目标跟踪性能最优】首个应用残差学习的深度目标跟踪算法

新智元

35+阅读 · 2017年9月10日

相关基金

基于分层与或图模型的光学遥感图像场景理解方法研究

国家自然科学基金

1+阅读 · 2015年12月31日

场景深度关系下的视频遮挡目标检测

国家自然科学基金

1+阅读 · 2015年12月31日

基于深度信息和显著计算的手势交互技术研究及应用

国家自然科学基金

1+阅读 · 2014年12月31日

基于距离图像局部特征的三维形变目标识别技术

国家自然科学基金

1+阅读 · 2014年12月31日

基于深度学习的特征融合在移动机器人视觉中的场景理解及研究

国家自然科学基金

12+阅读 · 2014年12月31日

基于结构化低秩表示的运动目标分割研究

国家自然科学基金

1+阅读 · 2013年12月31日

基于深度信息和深度学习的车载视觉行人检测方法研究

国家自然科学基金

4+阅读 · 2013年12月31日

仿视觉感知机制的图像场景语义分类研究

国家自然科学基金

1+阅读 · 2013年12月31日

基于弱监督学习和深度信息的目标跟踪算法研究

国家自然科学基金

0+阅读 · 2012年12月31日

基于多层上下文关系的图像目标识别关键技术研究

国家自然科学基金

0+阅读 · 2012年12月31日

相关论文

SPTS: Single-Point Text Spotting

Arxiv

0+阅读 · 2022年4月20日

Situational Perception Guided Image Matting

Arxiv

0+阅读 · 2022年4月20日

An Energy-Based Prior for Generative Saliency

Arxiv

0+阅读 · 2022年4月19日

Multimodal Token Fusion for Vision Transformers

Arxiv

3+阅读 · 2022年4月19日

NAFSSR: Stereo Image Super-Resolution Using NAFNet

Arxiv

0+阅读 · 2022年4月19日

Caption Feature Space Regularization for Audio Captioning

Arxiv

0+阅读 · 2022年4月18日

TASTEset -- Recipe Dataset and Food Entities Recognition Benchmark

Arxiv

0+阅读 · 2022年4月16日

Image-to-Image Retrieval by Learning Similarity between Scene Graphs

Arxiv

21+阅读 · 2020年12月29日

Notes on Deep Learning for NLP

Arxiv

22+阅读 · 2018年8月30日

NDDR-CNN: Layer-wise Feature Fusing in Multi-Task CNN by Neural Discriminative Dimensionality Reduction

Arxiv

15+阅读 · 2018年1月25日

微信扫码咨询专知VIP会员