基于感受野空间属性的视觉计算模型及图像检索研究 - 专知基金

会员服务 ·

0

视觉注意 · 图像检索 · 感受野 · 视觉词汇 ·

2014 年 12 月 31 日

基于感受野空间属性的视觉计算模型及图像检索研究

国家自然科学基金

国家自然科学基金委员会

项目名称： 基于感受野空间属性的视觉计算模型及图像检索研究

项目编号： No.61463008

项目类型： 地区科学基金项目

立项/批准年度： 2015

项目学科： 其他

项目作者： 刘广海

作者单位： 广西师范大学

项目金额： 45万元

中文摘要： 基于视觉信息处理机制的计算模型已成为研究热点。本项目以视觉计算模型和图像检索为研究对象，主要研究内容包括视觉显著图的计算，整合特征显著图以及结构共生词汇模型等, 依据模式识别和神经生理学等领域的最新研究成果，提出一种基于感受野空间属性的视觉计算模型，在此基础上进一步提出结构共生词汇模型，并应用于图像检索。拟解决两个关键科学问题：（1）如何建立视觉特征整合模型，使其更加符合视觉信息处理机制；（2）如何在视觉词汇中融入先验知识，以便于缩小视觉词汇的歧义性。本项目提出的视觉计算模型是Itti视觉注意模型的重大改进，结构共生词汇模型则是对视觉词汇包模型的升华。它们能够为建立更符合视觉信息处理机制的视觉计算模型以及缩小视觉词汇的歧义性提供新思路。

中文关键词： 视觉注意；图像检索；感受野；视觉词汇

英文摘要： Visual attention model based on the mechanisms of visual information processing has become a hot topic. The research objects are visual computational model and image retrieval.The main works include the computation of saliency maps, the integration of feature saliency maps and the visual words model of structure co-occurrence. We adopt the recent achievements of pattern recognition and neurophysiology, and present a visual computational model based on the spatial properties of receptive fields, and further put forward the visual words model of structure co-occurrence on this basis, and use it to image retrieval.There are two key scientific problems need to be solved, one is how to build the feature integration model, and makes it more akin to the human's mechanisms of visual information processing, the other is how to reduce the ambiguity of visual words by embedding priori knowledge into visual words. The proposed visual computational model is the significant improvement of Itti visual attention model, in addition，the proposed visual words model of structure co-occurrence is the significant improvement of bag-of-visual words. They can provide new ideas on how to build a visual computational model that more akin to the mechanisms of visual information processing and on how to reduce the ambiguity of visual words.

英文关键词： visual attention;image retrieval;receptive field;visual words

成为VIP会员查看完整内容

0

相关内容

视觉注意

【ICLR2022】Vision Transformer 模型工作机制的最新理论

【ICLR2022】Vision Transformer 模型工作机制的最新理论

专知会员服务

43+阅读 · 2022年2月19日

中科院计算所最新「视觉Transformer」综述论文，带你全面了解最新CV分类、检测/分割方法

中科院计算所最新「视觉Transformer」综述论文，带你全面了解最新CV分类、检测/分割方法

专知会员服务

99+阅读 · 2021年11月16日

【ICCV 2021 】Vision Transformer中的相对位置编码

专知会员服务

30+阅读 · 2021年7月30日

图像描述生成研究进展

专知会员服务

71+阅读 · 2021年3月29日

【CVPR2021】基于相似性分布距离的无监督人脸图像质量评价

专知会员服务

32+阅读 · 2021年3月19日

【SIGIR 2020】基于协同注意力机制的知识增强推荐模型

【SIGIR 2020】基于协同注意力机制的知识增强推荐模型

专知会员服务

91+阅读 · 2020年7月23日

基于改进卷积神经网络的短文本分类模型

基于改进卷积神经网络的短文本分类模型

专知会员服务

26+阅读 · 2020年7月22日

基于几何深度学习的知识图谱关键技术研究进展

专知会员服务

131+阅读 · 2020年7月10日

基于视觉的三维重建关键技术研究综述

基于视觉的三维重建关键技术研究综述

专知会员服务

166+阅读 · 2020年5月1日

【CVPR 2020-人大】基于层次图推理的细粒度文本视频跨模态检索

【CVPR 2020-人大】基于层次图推理的细粒度文本视频跨模态检索

专知会员服务

67+阅读 · 2020年4月5日

CVPR 2022｜快手联合中科院自动化所提出基于Transformer的图像风格化方法

CVPR 2022｜快手联合中科院自动化所提出基于Transformer的图像风格化方法

机器之心

1+阅读 · 2022年4月5日

Swin-Transformer应该如何更好地引入全局信息？MoA-Transformer:一种多分辨率重叠注意模块

Swin-Transformer应该如何更好地引入全局信息？MoA-Transformer:一种多分辨率重叠注意模块

极市平台

0+阅读 · 2022年2月8日

MM2020 | 基于对抗学习的个性化标签推荐

MM2020 | 基于对抗学习的个性化标签推荐

机器学习与推荐算法

0+阅读 · 2021年10月18日

图像描述生成研究进展

图像描述生成研究进展

专知

1+阅读 · 2021年3月29日

【学科发展报告】计算机视觉

【学科发展报告】计算机视觉

中国自动化学会

43+阅读 · 2018年10月12日

CVPR 2018 | 商汤科技论文详解：基于空间特征调制的图像超分辨率

CVPR 2018 | 商汤科技论文详解：基于空间特征调制的图像超分辨率

商汤科技

16+阅读 · 2018年5月27日

【论文推荐】最新八篇图像检索相关论文—三元组、深度特征图、判别式、卷积特征聚合、视觉-关系知识图谱、大规模图像检索

【论文推荐】最新八篇图像检索相关论文—三元组、深度特征图、判别式、卷积特征聚合、视觉-关系知识图谱、大规模图像检索

专知

33+阅读 · 2018年4月23日

图像检索研究进展：浅层、深层特征及特征融合

图像检索研究进展：浅层、深层特征及特征融合

中国计算机学会

123+阅读 · 2018年3月26日

【干货】基于属性学习和额外知识库的图像描述生成和视觉问答

【干货】基于属性学习和额外知识库的图像描述生成和视觉问答

专知

18+阅读 · 2017年12月25日

图像中复杂形变物体的外轮廓搜索方法研究

国家自然科学基金

0+阅读 · 2013年12月31日

视觉注意模型及其在显著目标检测中的应用研究

国家自然科学基金

3+阅读 · 2013年12月31日

基于视觉显著性结构的特征提取和图像检索

国家自然科学基金

0+阅读 · 2012年12月31日

基于多层上下文关系的图像目标识别关键技术研究

国家自然科学基金

0+阅读 · 2012年12月31日

基于多示例学习的视觉注意建模及应用研究

国家自然科学基金

1+阅读 · 2012年12月31日

基于贝叶斯推理的视觉注意计算模型及应用研究

国家自然科学基金

0+阅读 · 2011年12月31日

基于语义的图像合成

国家自然科学基金

0+阅读 · 2011年12月31日

基于视感知的图像视频语义获取关键技术研究

国家自然科学基金

0+阅读 · 2009年12月31日

基于目标的注意模型及在图像分割和目标检测中的应用

国家自然科学基金

1+阅读 · 2009年12月31日

面向语义概念和上下文关系的图像检索关键技术研究

国家自然科学基金

1+阅读 · 2008年12月31日

Simple and Effective Unsupervised Speech Synthesis

Simple and Effective Unsupervised Speech Synthesis

Arxiv

2+阅读 · 2022年4月20日

Convergence of a continuous Galerkin method for mixed hyperbolic-parabolic systems

Arxiv

0+阅读 · 2022年4月17日

Unsupervised Cross-Task Generalization via Retrieval Augmentation

Arxiv

0+阅读 · 2022年4月17日

Cross-Modal Coherence for Text-to-Image Retrieval

Arxiv

0+阅读 · 2022年4月15日

Image Captioning In the Transformer Age

Arxiv

1+阅读 · 2022年4月15日

A Large-Scale Study on Unsupervised Spatiotemporal Representation Learning

Arxiv

11+阅读 · 2021年4月29日

UNITER: Learning UNiversal Image-TExt Representations

UNITER: Learning UNiversal Image-TExt Representations

Arxiv

23+阅读 · 2019年9月25日

Cross-Modal Self-Attention Network for Referring Image Segmentation

Cross-Modal Self-Attention Network for Referring Image Segmentation

Arxiv

18+阅读 · 2019年4月9日

Multimodal Sentiment Analysis using Hierarchical Fusion with Context Modeling

Arxiv

11+阅读 · 2018年6月16日

Strong Baselines for Simple Question Answering over Knowledge Graphs with and without Neural Networks

Arxiv

17+阅读 · 2018年6月5日

阅读: 0 点赞: 0

小贴士

登录享主题订阅及个性化推荐

相关主题

热门VIP内容

开通专知VIP会员享更多权益服务

【书籍】从零开始构建文本生成图像生成器：基于 Transformers 与扩散模型

人工智能与未来指挥

【伯克利博士论文】将大语言模型绑定至虚拟人格：实现人类行为模拟

稀疏自编码器综述：解释大语言模型的内部机制

相关VIP内容

【ICLR2022】Vision Transformer 模型工作机制的最新理论

【ICLR2022】Vision Transformer 模型工作机制的最新理论

专知会员服务

43+阅读 · 2022年2月19日

中科院计算所最新「视觉Transformer」综述论文，带你全面了解最新CV分类、检测/分割方法

中科院计算所最新「视觉Transformer」综述论文，带你全面了解最新CV分类、检测/分割方法

专知会员服务

99+阅读 · 2021年11月16日

【ICCV 2021 】Vision Transformer中的相对位置编码

专知会员服务

30+阅读 · 2021年7月30日

图像描述生成研究进展

专知会员服务

71+阅读 · 2021年3月29日

【CVPR2021】基于相似性分布距离的无监督人脸图像质量评价

专知会员服务

32+阅读 · 2021年3月19日

【SIGIR 2020】基于协同注意力机制的知识增强推荐模型

【SIGIR 2020】基于协同注意力机制的知识增强推荐模型

专知会员服务

91+阅读 · 2020年7月23日

基于改进卷积神经网络的短文本分类模型

基于改进卷积神经网络的短文本分类模型

专知会员服务

26+阅读 · 2020年7月22日

基于几何深度学习的知识图谱关键技术研究进展

专知会员服务

131+阅读 · 2020年7月10日

基于视觉的三维重建关键技术研究综述

基于视觉的三维重建关键技术研究综述

专知会员服务

166+阅读 · 2020年5月1日

【CVPR 2020-人大】基于层次图推理的细粒度文本视频跨模态检索

【CVPR 2020-人大】基于层次图推理的细粒度文本视频跨模态检索

专知会员服务

67+阅读 · 2020年4月5日

相关资讯

CVPR 2022｜快手联合中科院自动化所提出基于Transformer的图像风格化方法

CVPR 2022｜快手联合中科院自动化所提出基于Transformer的图像风格化方法

机器之心

1+阅读 · 2022年4月5日

Swin-Transformer应该如何更好地引入全局信息？MoA-Transformer:一种多分辨率重叠注意模块

Swin-Transformer应该如何更好地引入全局信息？MoA-Transformer:一种多分辨率重叠注意模块

极市平台

0+阅读 · 2022年2月8日

MM2020 | 基于对抗学习的个性化标签推荐

MM2020 | 基于对抗学习的个性化标签推荐

机器学习与推荐算法

0+阅读 · 2021年10月18日

图像描述生成研究进展

图像描述生成研究进展

专知

1+阅读 · 2021年3月29日

【学科发展报告】计算机视觉

【学科发展报告】计算机视觉

中国自动化学会

43+阅读 · 2018年10月12日

CVPR 2018 | 商汤科技论文详解：基于空间特征调制的图像超分辨率

CVPR 2018 | 商汤科技论文详解：基于空间特征调制的图像超分辨率

商汤科技

16+阅读 · 2018年5月27日

【论文推荐】最新八篇图像检索相关论文—三元组、深度特征图、判别式、卷积特征聚合、视觉-关系知识图谱、大规模图像检索

【论文推荐】最新八篇图像检索相关论文—三元组、深度特征图、判别式、卷积特征聚合、视觉-关系知识图谱、大规模图像检索

专知

33+阅读 · 2018年4月23日

图像检索研究进展：浅层、深层特征及特征融合

图像检索研究进展：浅层、深层特征及特征融合

中国计算机学会

123+阅读 · 2018年3月26日

【干货】基于属性学习和额外知识库的图像描述生成和视觉问答

【干货】基于属性学习和额外知识库的图像描述生成和视觉问答

专知

18+阅读 · 2017年12月25日

相关基金

图像中复杂形变物体的外轮廓搜索方法研究

国家自然科学基金

0+阅读 · 2013年12月31日

视觉注意模型及其在显著目标检测中的应用研究

国家自然科学基金

3+阅读 · 2013年12月31日

基于视觉显著性结构的特征提取和图像检索

国家自然科学基金

0+阅读 · 2012年12月31日

基于多层上下文关系的图像目标识别关键技术研究

国家自然科学基金

0+阅读 · 2012年12月31日

基于多示例学习的视觉注意建模及应用研究

国家自然科学基金

1+阅读 · 2012年12月31日

基于贝叶斯推理的视觉注意计算模型及应用研究

国家自然科学基金

0+阅读 · 2011年12月31日

基于语义的图像合成

国家自然科学基金

0+阅读 · 2011年12月31日

基于视感知的图像视频语义获取关键技术研究

国家自然科学基金

0+阅读 · 2009年12月31日

基于目标的注意模型及在图像分割和目标检测中的应用

国家自然科学基金

1+阅读 · 2009年12月31日

面向语义概念和上下文关系的图像检索关键技术研究

国家自然科学基金

1+阅读 · 2008年12月31日

相关论文

Simple and Effective Unsupervised Speech Synthesis

Simple and Effective Unsupervised Speech Synthesis

Arxiv

2+阅读 · 2022年4月20日

Convergence of a continuous Galerkin method for mixed hyperbolic-parabolic systems

Arxiv

0+阅读 · 2022年4月17日

Unsupervised Cross-Task Generalization via Retrieval Augmentation

Arxiv

0+阅读 · 2022年4月17日

Cross-Modal Coherence for Text-to-Image Retrieval

Arxiv

0+阅读 · 2022年4月15日

Image Captioning In the Transformer Age

Arxiv

1+阅读 · 2022年4月15日

A Large-Scale Study on Unsupervised Spatiotemporal Representation Learning

Arxiv

11+阅读 · 2021年4月29日

UNITER: Learning UNiversal Image-TExt Representations

UNITER: Learning UNiversal Image-TExt Representations

Arxiv

23+阅读 · 2019年9月25日

Cross-Modal Self-Attention Network for Referring Image Segmentation

Cross-Modal Self-Attention Network for Referring Image Segmentation

Arxiv

18+阅读 · 2019年4月9日

Multimodal Sentiment Analysis using Hierarchical Fusion with Context Modeling

Arxiv

11+阅读 · 2018年6月16日

Strong Baselines for Simple Question Answering over Knowledge Graphs with and without Neural Networks

Arxiv

17+阅读 · 2018年6月5日

微信扫码咨询专知VIP会员