项目名称: 主动视觉注意的语义认知计算模型研究

项目编号: No.60975015

项目类型: 面上项目

立项/批准年度: 2010

项目学科: 自动化技术、计算机技术

项目作者: 杨丹

作者单位: 重庆大学

项目金额: 30万元

中文摘要: 计算机模仿人类视觉认知机理,实现对视觉信息的主动获取和理解是一个极具挑战的课题。本项目以揭示在人类视觉选择注意机制下对视觉图像认知的规律为目标,研究视觉信息认知计算中多特征融合的视觉特征的特性和表征,探讨采用流形学习和聚类技术构造出能更好反映图像语义的高效视觉单词本;通过潜在统计结构学习、聚类和鲁棒参数估计等方法,探寻图像、图像主题和视觉单词之间双向推理学习的内在机理;建立具有较强鲁棒性的图像语义认知计算模型;最后结合人类视觉选择性注意特性,实现以高层语义知识为驱动的选择性注意对象主动认知模型,从而发展基于空间观点的视觉注意模型,丰富基于物体对象的视觉注意感知研究。项目成果将为图像理解、目标跟踪和海量图像信息检索等研究提供新的理论方法和技术手段。

中文关键词: 多特征视觉基元;图像语义;主动感知;视觉选择性注意;

英文摘要:

英文关键词: multi-feature vision primitive;image semantic;active cognition;selective visual attention;

成为VIP会员查看完整内容
0

相关内容

【博士论文】视觉语言交互中的视觉推理研究
专知会员服务
58+阅读 · 2021年12月1日
[ACM MM 2021]结合文字识别结果的鲁棒和精确文本视觉问答
专知会员服务
15+阅读 · 2021年11月14日
专知会员服务
11+阅读 · 2021年7月6日
专知会员服务
69+阅读 · 2021年3月29日
专知会员服务
31+阅读 · 2021年3月17日
基于视觉的三维重建关键技术研究综述
专知会员服务
154+阅读 · 2020年5月1日
 图像内容自动描述技术综述
专知会员服务
84+阅读 · 2019年11月17日
首个视觉-语言预训练综述来了!
夕小瑶的卖萌屋
6+阅读 · 2022年3月29日
微软亚洲研究院多模态模型NÜWA:以自然语言创造视觉内容
微软研究院AI头条
0+阅读 · 2022年3月3日
论文浅尝 | 基于多模态特征的视觉实体链接
开放知识图谱
1+阅读 · 2022年1月7日
论文浅尝 | 面向视觉常识推理的层次语义增强方向图网络
图像描述生成研究进展
专知
1+阅读 · 2021年3月29日
计算机视觉方向简介 | 多视角立体视觉MVS
计算机视觉life
14+阅读 · 2019年10月10日
综述 | SLAM回环检测方法
计算机视觉life
14+阅读 · 2019年8月19日
国家自然科学基金
5+阅读 · 2014年12月31日
国家自然科学基金
3+阅读 · 2013年12月31日
国家自然科学基金
0+阅读 · 2013年12月31日
国家自然科学基金
0+阅读 · 2013年12月31日
国家自然科学基金
1+阅读 · 2012年12月31日
国家自然科学基金
1+阅读 · 2012年12月31日
国家自然科学基金
0+阅读 · 2012年12月31日
国家自然科学基金
1+阅读 · 2012年12月31日
国家自然科学基金
2+阅读 · 2009年12月31日
Vision-and-Language Pretrained Models: A Survey
Arxiv
3+阅读 · 2022年4月15日
Arxiv
32+阅读 · 2022年2月15日
Arxiv
15+阅读 · 2021年11月19日
Arxiv
20+阅读 · 2021年9月21日
Arxiv
102+阅读 · 2021年6月8日
Arxiv
19+阅读 · 2020年12月23日
小贴士
相关VIP内容
【博士论文】视觉语言交互中的视觉推理研究
专知会员服务
58+阅读 · 2021年12月1日
[ACM MM 2021]结合文字识别结果的鲁棒和精确文本视觉问答
专知会员服务
15+阅读 · 2021年11月14日
专知会员服务
11+阅读 · 2021年7月6日
专知会员服务
69+阅读 · 2021年3月29日
专知会员服务
31+阅读 · 2021年3月17日
基于视觉的三维重建关键技术研究综述
专知会员服务
154+阅读 · 2020年5月1日
 图像内容自动描述技术综述
专知会员服务
84+阅读 · 2019年11月17日
相关资讯
首个视觉-语言预训练综述来了!
夕小瑶的卖萌屋
6+阅读 · 2022年3月29日
微软亚洲研究院多模态模型NÜWA:以自然语言创造视觉内容
微软研究院AI头条
0+阅读 · 2022年3月3日
论文浅尝 | 基于多模态特征的视觉实体链接
开放知识图谱
1+阅读 · 2022年1月7日
论文浅尝 | 面向视觉常识推理的层次语义增强方向图网络
图像描述生成研究进展
专知
1+阅读 · 2021年3月29日
计算机视觉方向简介 | 多视角立体视觉MVS
计算机视觉life
14+阅读 · 2019年10月10日
综述 | SLAM回环检测方法
计算机视觉life
14+阅读 · 2019年8月19日
相关基金
国家自然科学基金
5+阅读 · 2014年12月31日
国家自然科学基金
3+阅读 · 2013年12月31日
国家自然科学基金
0+阅读 · 2013年12月31日
国家自然科学基金
0+阅读 · 2013年12月31日
国家自然科学基金
1+阅读 · 2012年12月31日
国家自然科学基金
1+阅读 · 2012年12月31日
国家自然科学基金
0+阅读 · 2012年12月31日
国家自然科学基金
1+阅读 · 2012年12月31日
国家自然科学基金
2+阅读 · 2009年12月31日
相关论文
Vision-and-Language Pretrained Models: A Survey
Arxiv
3+阅读 · 2022年4月15日
Arxiv
32+阅读 · 2022年2月15日
Arxiv
15+阅读 · 2021年11月19日
Arxiv
20+阅读 · 2021年9月21日
Arxiv
102+阅读 · 2021年6月8日
Arxiv
19+阅读 · 2020年12月23日
微信扫码咨询专知VIP会员