项目名称: 深度学习框架下基于情境线索的视觉注意研究

项目编号: No.61502311

项目类型: 青年科学基金项目

立项/批准年度: 2016

项目学科: 计算机科学学科

项目作者: 钟圣华

作者单位: 深圳大学

项目金额: 20万元

中文摘要: 视觉注意是视觉系统的门户,对视觉注意系统进行建模是一个重要而具有挑战的跨学科课题,对于计算科学、心理学、认知神经科学和其他相关领域都有重要影响。为了实现准确、高效、完备的视觉注意建模,本项目组以眼动轨迹预测作为突破口,提出完善的视觉注意计算的任务框架,并将情境线索加入影响因素体系,提出深度学习框架下基于情境线索的视觉注意模型。该模型能够对深度学习与情境线索深度融合,通过深度学习得到情境线索的多语义层次表征,并且将情境线索作为深度学习的规则化因子并指导深度学习,最终建立包含多语义层次的视觉注意计算方法。本项目将丰富和发展视觉注意计算的理论体系,提高计算机的特征提取、表征、理解与鉴别能力。本项目探索视觉系统注意机制的模式与成因,将为脑科学、特别是视觉科学基础理论的研究提供算法支持,在多媒体内容分析、虚拟现实、机器人、病理检测、金融、广告等领域都有着重要的应用价值。

中文关键词: 视觉注意建模;情境线索;深度学习

英文摘要: Visual attention serves as a gatekeeper of the human visual system. Building computational models of the visual attention system is a challenging but important problem in interdisciplinary research including computer science, psychology, cognitive neuroscience, and many other related areas. In order to accurately and efficiently capture the properties of the human visual attention system, our research group started with predicting human eye-movement scanpaths, and then proposed a complete framework on computational models of visual attention. More importantly, we incorporated contextual cues into the pool of impacting factors, and built a model that successfully combined deep learning algorithm and contextual cue information. This model uses deep learning algorithm to generate a multi-layer semantic representation of the context cues, which then turns back to serve as a regularization factor to guide the deep learning process. On the long run, the model will be able to generate a computational visual attention algorithm that includes multi-layer semantic information. This project will contribute to the development of the theoretical framework of computational models on visual attention, and improve computer's ability to extract, represent, understand, and recognize important visual features. By exploring the algorithm and mechanism of human visual system, this project will provide support to brain science, especially visual cognitive science, at the algorithm level. It will have significant impact on the application of multimedia content analysis, virtual reality, robotics, pathology, financial science, and advertisement.

英文关键词: Visual attention modeling;Context cueing;Deep learning

成为VIP会员查看完整内容
2

相关内容

《深度学习中神经注意力模型》综述论文
专知会员服务
112+阅读 · 2021年12月15日
【博士论文】基于深度学习的单目场景深度估计方法研究
【博士论文】视觉语言交互中的视觉推理研究
专知会员服务
58+阅读 · 2021年12月1日
混合增强视觉认知架构及其关键技术进展
专知会员服务
37+阅读 · 2021年11月20日
专知会员服务
29+阅读 · 2021年10月11日
专知会员服务
64+阅读 · 2021年5月21日
混合增强视觉认知架构及其关键技术进展
专知
2+阅读 · 2021年11月20日
VALSE 短教程 第03期:视觉与语言智能
VALSE
0+阅读 · 2021年9月18日
计算机视觉方向简介 | 多视角立体视觉MVS
计算机视觉life
14+阅读 · 2019年10月10日
基于虚拟现实环境的深度学习模型构建
MOOC
23+阅读 · 2019年9月28日
计算机视觉方向简介 | 三维重建技术概述
计算机视觉life
25+阅读 · 2019年6月13日
深度学习中的注意力机制
人工智能头条
16+阅读 · 2017年11月2日
国家自然科学基金
5+阅读 · 2014年12月31日
国家自然科学基金
7+阅读 · 2013年12月31日
国家自然科学基金
1+阅读 · 2012年12月31日
国家自然科学基金
1+阅读 · 2012年12月31日
国家自然科学基金
0+阅读 · 2012年12月31日
国家自然科学基金
1+阅读 · 2012年12月31日
国家自然科学基金
0+阅读 · 2012年12月31日
国家自然科学基金
1+阅读 · 2012年12月31日
国家自然科学基金
0+阅读 · 2009年12月31日
国家自然科学基金
0+阅读 · 2009年12月31日
Arxiv
0+阅读 · 2022年4月20日
Arxiv
0+阅读 · 2022年4月19日
Arxiv
20+阅读 · 2021年2月28日
Arxiv
27+阅读 · 2021年2月17日
Arxiv
10+阅读 · 2020年11月26日
Arxiv
15+阅读 · 2018年6月23日
Arxiv
19+阅读 · 2018年3月28日
小贴士
相关VIP内容
《深度学习中神经注意力模型》综述论文
专知会员服务
112+阅读 · 2021年12月15日
【博士论文】基于深度学习的单目场景深度估计方法研究
【博士论文】视觉语言交互中的视觉推理研究
专知会员服务
58+阅读 · 2021年12月1日
混合增强视觉认知架构及其关键技术进展
专知会员服务
37+阅读 · 2021年11月20日
专知会员服务
29+阅读 · 2021年10月11日
专知会员服务
64+阅读 · 2021年5月21日
相关资讯
混合增强视觉认知架构及其关键技术进展
专知
2+阅读 · 2021年11月20日
VALSE 短教程 第03期:视觉与语言智能
VALSE
0+阅读 · 2021年9月18日
计算机视觉方向简介 | 多视角立体视觉MVS
计算机视觉life
14+阅读 · 2019年10月10日
基于虚拟现实环境的深度学习模型构建
MOOC
23+阅读 · 2019年9月28日
计算机视觉方向简介 | 三维重建技术概述
计算机视觉life
25+阅读 · 2019年6月13日
深度学习中的注意力机制
人工智能头条
16+阅读 · 2017年11月2日
相关基金
国家自然科学基金
5+阅读 · 2014年12月31日
国家自然科学基金
7+阅读 · 2013年12月31日
国家自然科学基金
1+阅读 · 2012年12月31日
国家自然科学基金
1+阅读 · 2012年12月31日
国家自然科学基金
0+阅读 · 2012年12月31日
国家自然科学基金
1+阅读 · 2012年12月31日
国家自然科学基金
0+阅读 · 2012年12月31日
国家自然科学基金
1+阅读 · 2012年12月31日
国家自然科学基金
0+阅读 · 2009年12月31日
国家自然科学基金
0+阅读 · 2009年12月31日
相关论文
微信扫码咨询专知VIP会员