项目名称: 基于多示例学习的视觉注意建模及应用研究

项目编号: No.61272317

项目类型: 面上项目

立项/批准年度: 2013

项目学科: 自动化技术、计算机技术

项目作者: 万寿红

作者单位: 中国科学技术大学

项目金额: 80万元

中文摘要: 本课题是针对目前视觉注意模型与人类感知的高层语义以及用户主观意向之间存在鸿沟的问题,面向多样例图像,利用多示例学习方法,提出一种基于多示例学习的视觉注意模型。从人类视觉感知特性出发,在现有视觉注意模型研究成果的基础上,研究基于多示例学习的视觉特征选择与提取方法、基于关注度的特征融合模式、基于兴趣对象的视点转移模拟,构建基于多示例学习的视觉注意计算模型,并将其应用于图像检索领域以提高查准率、验证模型的有效性,为图像分析与理解提供理论基础和模型参考。本课题的研究旨在有效表达多样例图像的高层语义及用户主观意向,缩小语义鸿沟,使图像分析与理解过程更接近人类的感知。因此,本课题的研究具有十分重要的理论研究意义和实用价值。

中文关键词: 视觉注意模型;多示例学习;特征融合;多样例图像;视觉显著性

英文摘要: The topic focuses on the gap between current visual attention models and high-level semantics of human perception and the user intent, proposes a visual attention model on multi-example images using the multiple-instance learning method. Based on human visual perception and existing research achievement of visual attention models, we study the selection and extraction of visual features, prominent feature fusion pattern and focus of attention shift, construct a visual attention computation model based on multiple-instance learning, apply it in the field of image retrieval to improve the precision rate and verify effectiveness of the model, which provides theoretical principle and model reference of image analysis and understanding. This topic aims at expressing high-level semantics of multi-example images and true user intent efficiently, reducing the semantic gap and make image analysis and understanding more close to human perception. Therefore, researching on this topic has significant theoretical meaning and practical value.

英文关键词: Visual attention model;Multiple-instance learning;Feature fusion;Multi-example images;Visual saliency

成为VIP会员查看完整内容
1

相关内容

【博士论文】视觉语言交互中的视觉推理研究
专知会员服务
58+阅读 · 2021年12月1日
基于RGB-D图像的语义场景补全研究进展综述
专知会员服务
27+阅读 · 2021年11月8日
专知会员服务
84+阅读 · 2021年9月4日
专知会员服务
92+阅读 · 2021年6月23日
专知会员服务
69+阅读 · 2021年3月29日
专知会员服务
58+阅读 · 2021年3月25日
多模态视觉语言表征学习研究综述
专知会员服务
186+阅读 · 2020年12月3日
论文浅尝 | 基于多模态特征的视觉实体链接
开放知识图谱
1+阅读 · 2022年1月7日
图像描述生成研究进展
专知
1+阅读 · 2021年3月29日
图像检索研究进展:浅层、深层特征及特征融合
中国计算机学会
122+阅读 · 2018年3月26日
国家自然科学基金
3+阅读 · 2013年12月31日
国家自然科学基金
0+阅读 · 2013年12月31日
国家自然科学基金
3+阅读 · 2013年12月31日
国家自然科学基金
1+阅读 · 2012年12月31日
国家自然科学基金
0+阅读 · 2012年12月31日
国家自然科学基金
0+阅读 · 2012年12月31日
国家自然科学基金
0+阅读 · 2011年12月31日
国家自然科学基金
0+阅读 · 2009年12月31日
国家自然科学基金
1+阅读 · 2009年12月31日
国家自然科学基金
1+阅读 · 2009年12月31日
Transformers in Medical Image Analysis: A Review
Arxiv
39+阅读 · 2022年2月24日
Arxiv
10+阅读 · 2020年11月26日
Arxiv
34+阅读 · 2020年1月2日
小贴士
相关VIP内容
【博士论文】视觉语言交互中的视觉推理研究
专知会员服务
58+阅读 · 2021年12月1日
基于RGB-D图像的语义场景补全研究进展综述
专知会员服务
27+阅读 · 2021年11月8日
专知会员服务
84+阅读 · 2021年9月4日
专知会员服务
92+阅读 · 2021年6月23日
专知会员服务
69+阅读 · 2021年3月29日
专知会员服务
58+阅读 · 2021年3月25日
多模态视觉语言表征学习研究综述
专知会员服务
186+阅读 · 2020年12月3日
相关基金
国家自然科学基金
3+阅读 · 2013年12月31日
国家自然科学基金
0+阅读 · 2013年12月31日
国家自然科学基金
3+阅读 · 2013年12月31日
国家自然科学基金
1+阅读 · 2012年12月31日
国家自然科学基金
0+阅读 · 2012年12月31日
国家自然科学基金
0+阅读 · 2012年12月31日
国家自然科学基金
0+阅读 · 2011年12月31日
国家自然科学基金
0+阅读 · 2009年12月31日
国家自然科学基金
1+阅读 · 2009年12月31日
国家自然科学基金
1+阅读 · 2009年12月31日
微信扫码咨询专知VIP会员