项目名称: 具有3D空间辨识力的视觉显著计算模型研究

项目编号: No.61472380

项目类型: 面上项目

立项/批准年度: 2015

项目学科: 计算机科学学科

项目作者: 曹洋

作者单位: 中国科学技术大学

项目金额: 83万元

中文摘要: 本项目面向3D图像内容,针对现有视觉显著性计算方法的不足,依据目标-场景的3D空间关系,提出具有3D空间辨识力的视觉显著计算模型,并对由此引出的如下科学问题和关键技术开展研究:1)以多尺度图像分割区域作为基元,基于协同优化的思想,融合基于单眼线索和基于立体匹配的深度估计方法,提高自然场景深度估计的精度和鲁棒性。2)利用积木世界模型描述3D场景,通过将图像的各个分割区域模化为带有几何和物理属性的积木实体,基于几何空间约束和物理稳定性约束,采用组合优化策略建立目标与场景间的3D空间关系。3)基于摄影构图的基本规则,寻求从目标-场景的3D空间布局中估计出摄影者想表征的事物或主题,并通过心理学实验获取其视觉显著性的表示方法。4)将3D显著性检测和立体图像分类结合起来,通过设计一个互为上下文关系的迭代框架,采用交替渐进优化的方法,一方面增强显著性区域的3D空间辨识性,另一方面提高图像分类问题的效果。

中文关键词: 显著性;空间辨识力;图像分类;立体匹配;3D场景表示

英文摘要: In this project, a novel discriminative 3D spatial saliency computational model is proposed by using the spatial relations between objects and scene. Most of the state-of-the-art 3D saliency detection methods only take the depth information as the low-level feature, but this ignores the influence of depth information on 3D scene representation. To overcome this, there are four main issues to be addressed in this project: 1). A robust stereo matching algorithm that incorporates the monocular cues contained in the image is presented. The proposed algorithm uses multi-scale image segmented regions as matching primitives and exploits a cooperative optimization procedure to minimize the matching costs of all regions by introducing the cooperative and competitive mechanism between regions. 2). Based on the block world model, a qualitative physical representation of an outdoor scene is presented, where objects have volume and mass, and relationships describe 3D structure and mechanical configurations. Then a novel combinatorial optimization approach is proposed to build up a physically-plausible 3D interpretation of the scene. 3). Inspired by the basic photographic composition rules, a novel saliency computational model is presented, which utilizes the knowledge of photographic composition as priors to express the scenario of photographer. 4)A contextualizing framework, which iteratively and mutually boosts stereo image classification and 3D salient object detection by taking the outputs from one task as the context of the other one, is presented. The proposed solution is supposed to be superior over the existing methods.

英文关键词: Saliency;Discriminative Spatial;Image Classification;Stereo Matching;3D Scence Representation

成为VIP会员查看完整内容
2

相关内容

【AAAI2022】用于视觉常识推理的场景图增强图像-文本学习
专知会员服务
48+阅读 · 2021年12月20日
【博士论文】基于深度学习的单目场景深度估计方法研究
【博士论文】多视光场光线空间几何模型研究
专知会员服务
22+阅读 · 2021年12月6日
【博士论文】视觉语言交互中的视觉推理研究
专知会员服务
62+阅读 · 2021年12月1日
专知会员服务
18+阅读 · 2021年9月13日
专知会员服务
66+阅读 · 2021年5月21日
专知会员服务
16+阅读 · 2021年4月27日
【CVPR2021】显著目标和伪装目标的不确定性感知联合检测
【CVPR2021】群体协同学习在共显著目标检测中的应用
专知会员服务
17+阅读 · 2021年4月6日
【NeurIPS 2020】视觉和语言表示学习的大规模对抗性训练
专知会员服务
14+阅读 · 2020年10月27日
【动态】第二届CSIG图像图形技术挑战赛冠军团队介绍
中国图象图形学学会CSIG
0+阅读 · 2022年1月12日
计算机视觉方向简介 | 多视角立体视觉MVS
计算机视觉life
14+阅读 · 2019年10月10日
【泡泡点云时空】FlowNet3D:学习三维点云中的场景流
泡泡机器人SLAM
41+阅读 · 2019年5月19日
红外弱小目标处理研究获进展
中科院之声
17+阅读 · 2017年11月19日
国家自然科学基金
2+阅读 · 2015年12月31日
国家自然科学基金
0+阅读 · 2014年12月31日
国家自然科学基金
4+阅读 · 2013年12月31日
国家自然科学基金
0+阅读 · 2013年12月31日
国家自然科学基金
2+阅读 · 2013年12月31日
国家自然科学基金
3+阅读 · 2013年12月31日
国家自然科学基金
0+阅读 · 2013年12月31日
国家自然科学基金
0+阅读 · 2012年12月31日
国家自然科学基金
0+阅读 · 2011年12月31日
Arxiv
0+阅读 · 2022年4月20日
Arxiv
2+阅读 · 2022年4月19日
Arxiv
0+阅读 · 2022年4月16日
Arxiv
54+阅读 · 2022年1月1日
Deformable Style Transfer
Arxiv
14+阅读 · 2020年3月24日
小贴士
相关VIP内容
【AAAI2022】用于视觉常识推理的场景图增强图像-文本学习
专知会员服务
48+阅读 · 2021年12月20日
【博士论文】基于深度学习的单目场景深度估计方法研究
【博士论文】多视光场光线空间几何模型研究
专知会员服务
22+阅读 · 2021年12月6日
【博士论文】视觉语言交互中的视觉推理研究
专知会员服务
62+阅读 · 2021年12月1日
专知会员服务
18+阅读 · 2021年9月13日
专知会员服务
66+阅读 · 2021年5月21日
专知会员服务
16+阅读 · 2021年4月27日
【CVPR2021】显著目标和伪装目标的不确定性感知联合检测
【CVPR2021】群体协同学习在共显著目标检测中的应用
专知会员服务
17+阅读 · 2021年4月6日
【NeurIPS 2020】视觉和语言表示学习的大规模对抗性训练
专知会员服务
14+阅读 · 2020年10月27日
相关基金
国家自然科学基金
2+阅读 · 2015年12月31日
国家自然科学基金
0+阅读 · 2014年12月31日
国家自然科学基金
4+阅读 · 2013年12月31日
国家自然科学基金
0+阅读 · 2013年12月31日
国家自然科学基金
2+阅读 · 2013年12月31日
国家自然科学基金
3+阅读 · 2013年12月31日
国家自然科学基金
0+阅读 · 2013年12月31日
国家自然科学基金
0+阅读 · 2012年12月31日
国家自然科学基金
0+阅读 · 2011年12月31日
微信扫码咨询专知VIP会员