项目名称: 基于场景分析和视觉注意力的目标搜索

项目编号: No.61075018

项目类型: 面上项目

立项/批准年度: 2011

项目学科: 环境科学、安全科学

项目作者: 胡小鹏

作者单位: 大连理工大学

项目金额: 10万元

中文摘要: 本课题探索将视觉注意力选择机制与全面细致的场景分析相结合,提高复杂自然场景条件下的计算机视觉搜索能力。理论意义和实用价值在于:(1)充分的场景分析是感知复杂并且不确定自然环境的前提,学习和利用人类视觉注意力选择机制是优化分配视觉资源的有效途径,两者的紧密结合可提高计算机视觉系统在复杂自然场景条件下搜索目标的能力;(2)现有视觉注意力选择机制不能有效地解决自然场景中高复杂度和不确定性难题,他们在工程领域的应用受到了限制,因而,有必要研究新理论和新方法。本项目提出了一种基于贝叶斯推理的视觉搜索理论框架:(1)通过特征域及空间域的场景分析和对相关经验知识的利用,建立全局和局部场景表达;(2)通过特征评估及选择,提高视觉描述和注意力选择机制的效率。该框架的主要特点在于:视觉注意力选择被视为是面向搜索目标和面向场景背景两类搜索活动的综合结果,这两类搜索活动分别是基于自顶向下和自底向上的信息综合。

中文关键词: 视觉搜索;视觉注意力选择;特征评估和选择;贝叶斯推理

英文摘要: This research is to investigate the way to improve the visual search capability of computer vision in complex natural environments by integrating detailed scene analysis into a visual attention selection mechanism. The theoretical and practical value lies on the facts that (1) detailed scene analysis is necessary for understanding complex and ambiguous natural senses and, as a result, the combination of it with visual attention mechanisms provides a possibility to improve the efficiency of visual search in natural environments; (2) current computational attention selection mechanisms are not able to cope with the complexities and ambiguities of natural scenes and, accordingly, have found limited practical applications. This project presents a novel theoretical visual search framework based on Bayesian inference. In the framework, the global and local representations of the visual scene are generated through feature-space and spatial-domain scene analysis by utilizing relevant knowledge and experience. The efficiency of the visual description and attention mechanism is improved through visual feature evaluation and selection. One of the key elements of the proposed framework is that visual attention selection is regarded as the consequence of the integration of both target and background visual search activities, each of which results from the integration of both top-down and bottom-up information.

英文关键词: Visual Search; Visual Attention Selection; Feature Evalutation and Selection; Bayesian Inference

成为VIP会员查看完整内容
0

相关内容

【CVPR2022】整合少样本学习的分类和分割
专知会员服务
26+阅读 · 2022年3月31日
【CVPR2022】基于序列对比学习的长视频帧方向动作表示
专知会员服务
9+阅读 · 2022年3月29日
从视频到语言: 视频标题生成与描述研究综述
专知会员服务
19+阅读 · 2022年1月8日
【博士论文】视觉语言交互中的视觉推理研究
专知会员服务
61+阅读 · 2021年12月1日
专知会员服务
91+阅读 · 2021年8月29日
专知会员服务
69+阅读 · 2021年3月29日
【CVPR2021】面向视频动作分割的高效网络结构搜索
专知会员服务
13+阅读 · 2021年3月14日
【NeurIPS 2020】视觉注意力神经编码
专知会员服务
40+阅读 · 2020年10月4日
18篇CVPR 2022 中科院自动化所新作速览!
专知
4+阅读 · 2022年3月20日
基于多目标优化的推荐系统综述
机器学习与推荐算法
6+阅读 · 2021年12月27日
论文浅尝 | 面向视觉常识推理的层次语义增强方向图网络
图像描述生成研究进展
专知
1+阅读 · 2021年3月29日
CVPR 2020 | 深度视觉推理2.0:组合式目标指代理解
AI科技评论
15+阅读 · 2020年3月20日
国家自然科学基金
0+阅读 · 2014年12月31日
国家自然科学基金
4+阅读 · 2013年12月31日
国家自然科学基金
0+阅读 · 2013年12月31日
国家自然科学基金
1+阅读 · 2012年12月31日
国家自然科学基金
0+阅读 · 2012年12月31日
国家自然科学基金
2+阅读 · 2011年12月31日
国家自然科学基金
0+阅读 · 2011年12月31日
国家自然科学基金
0+阅读 · 2011年12月31日
国家自然科学基金
0+阅读 · 2009年12月31日
国家自然科学基金
1+阅读 · 2009年12月31日
Arxiv
0+阅读 · 2022年4月15日
Arxiv
28+阅读 · 2022年3月28日
Arxiv
20+阅读 · 2020年6月8日
小贴士
相关VIP内容
【CVPR2022】整合少样本学习的分类和分割
专知会员服务
26+阅读 · 2022年3月31日
【CVPR2022】基于序列对比学习的长视频帧方向动作表示
专知会员服务
9+阅读 · 2022年3月29日
从视频到语言: 视频标题生成与描述研究综述
专知会员服务
19+阅读 · 2022年1月8日
【博士论文】视觉语言交互中的视觉推理研究
专知会员服务
61+阅读 · 2021年12月1日
专知会员服务
91+阅读 · 2021年8月29日
专知会员服务
69+阅读 · 2021年3月29日
【CVPR2021】面向视频动作分割的高效网络结构搜索
专知会员服务
13+阅读 · 2021年3月14日
【NeurIPS 2020】视觉注意力神经编码
专知会员服务
40+阅读 · 2020年10月4日
相关基金
国家自然科学基金
0+阅读 · 2014年12月31日
国家自然科学基金
4+阅读 · 2013年12月31日
国家自然科学基金
0+阅读 · 2013年12月31日
国家自然科学基金
1+阅读 · 2012年12月31日
国家自然科学基金
0+阅读 · 2012年12月31日
国家自然科学基金
2+阅读 · 2011年12月31日
国家自然科学基金
0+阅读 · 2011年12月31日
国家自然科学基金
0+阅读 · 2011年12月31日
国家自然科学基金
0+阅读 · 2009年12月31日
国家自然科学基金
1+阅读 · 2009年12月31日
微信扫码咨询专知VIP会员