项目名称: 基于无视觉码本框架的大规模图像检索研究

项目编号: No.61472378

项目类型: 面上项目

立项/批准年度: 2015

项目学科: 计算机科学学科

项目作者: 周文罡

作者单位: 中国科学技术大学

项目金额: 84万元

中文摘要: 现有基于内容的图像检索借鉴文本检索思想,采用视觉词袋模型,其核心技术之一是利用视觉码本将图像局部特征量化为视觉单词。然而,基于码本的量化本质上是一种面向数据压缩的矢量量化,并不完全适用于面向视觉内容识别的大规模图像检索。本项目拟研究的关键科学问题是:面向视觉内容相关度保持的局部视觉特征量化方法。本项目创新性地提出研究无视觉码本的图像检索框架,避免训练视觉码本的约束,可对任意图像数据库自适应地生成量化器,对局部特征进行快速量化和索引,实现可扩展的大规模图像检索。此外,为完善无码本检索框架,本项目还拟研究量化前的视觉特征采样方法和量化后的基于图像上下文分析的检索重排序法方法,以进一步提高检索精度。本项目预期在局部视觉特征的量化理论上有所突破,在基于内容的大规模图像检索技术方法上取得重大创新,尝试探索面向大数据处理与分析的数据压缩理论,为大规模图像检索技术的理论化、实用化奠定基础。

中文关键词: 图像检索;局部特征采样;视觉特征量化;图像索引;检索重排序

英文摘要: Currently, most content-based image retrieval (CBIR) algorithms and techniques adopt the Bag-of-Visual-Words model using the idea from information retrieval, and make use of the visual codebook to perform quantization on image local features. However, such codebook-based feature quantization in many existing CBIR methods is essentially a kind of data-compression-oriented vector quantization, which is not fully applicable to the large-scale image retrieval which targets at visual content identification. With awareness of this problem, this project proposed to research the visual content similarity-preserving quantization on local visual features. We propose a novel codebook-free image retrieval framework, which avoids the constraint of training visual codebook and can be flexibly adapted to any diverse image dataset for efficient quantization and indexing for scalable image search. Moreover, to enhance the codebook-free framework, we propose to research the visual feature sampling method before feature quantization and the search re-ranking method with image context analysis after feature quantization to further boost the retrieval performance. This project is to make a breakthrough in the quantization theory on local visual feature and make significant novelty contributions in techniques and methods for large-scale image retrieval. Besides, it will also explore the data compression theory for large-scale content data processing and analysis to lay the foundation for theoretical and practical large-scale image retrieval techniques.

英文关键词: image retrieval;local feature sampling;visual feature quantization;image indexing;search reranking

成为VIP会员查看完整内容
0

相关内容

从20世纪70年代开始,有关图像检索的研究就已开始,当时主要是基于文本的图像检索技术(Text-based Image Retrieval,简称TBIR),利用文本描述的方式描述图像的特征,如绘画作品的作者、年代、流派、尺寸等。到90年代以后,出现了对图像的内容语义,如图像的颜色、纹理、布局等进行分析和检索的图像检索技术,即基于内容的图像检索(Content-based Image Retrieval,简称CBIR)技术。CBIR属于基于内容检索(Content-based Retrieval,简称CBR)的一种,CBR中还包括对动态视频、音频等其它形式多媒体信息的检索技术。

知识荟萃

精品入门和进阶教程、论文和代码整理等

更多

查看相关VIP内容、论文、资讯等
专知会员服务
31+阅读 · 2021年8月7日
专知会员服务
45+阅读 · 2021年6月20日
专知会员服务
22+阅读 · 2021年5月1日
专知会员服务
60+阅读 · 2021年3月25日
专知会员服务
31+阅读 · 2021年3月17日
【NeurIPS 2020】视觉和语言表示学习的大规模对抗性训练
专知会员服务
14+阅读 · 2020年10月27日
基于二进制哈希编码快速学习的快速图像检索
极市平台
12+阅读 · 2018年5月17日
基于图片内容的深度学习图片检索(一)
七月在线实验室
20+阅读 · 2017年10月1日
国家自然科学基金
2+阅读 · 2014年12月31日
国家自然科学基金
2+阅读 · 2014年12月31日
国家自然科学基金
0+阅读 · 2013年12月31日
国家自然科学基金
0+阅读 · 2013年12月31日
国家自然科学基金
0+阅读 · 2012年12月31日
国家自然科学基金
0+阅读 · 2012年12月31日
国家自然科学基金
0+阅读 · 2012年12月31日
国家自然科学基金
1+阅读 · 2012年12月31日
国家自然科学基金
1+阅读 · 2011年12月31日
国家自然科学基金
0+阅读 · 2011年12月31日
Arxiv
0+阅读 · 2022年4月20日
Arxiv
0+阅读 · 2022年4月18日
Chinese Idiom Paraphrasing
Arxiv
0+阅读 · 2022年4月15日
小贴士
相关VIP内容
专知会员服务
31+阅读 · 2021年8月7日
专知会员服务
45+阅读 · 2021年6月20日
专知会员服务
22+阅读 · 2021年5月1日
专知会员服务
60+阅读 · 2021年3月25日
专知会员服务
31+阅读 · 2021年3月17日
【NeurIPS 2020】视觉和语言表示学习的大规模对抗性训练
专知会员服务
14+阅读 · 2020年10月27日
相关基金
国家自然科学基金
2+阅读 · 2014年12月31日
国家自然科学基金
2+阅读 · 2014年12月31日
国家自然科学基金
0+阅读 · 2013年12月31日
国家自然科学基金
0+阅读 · 2013年12月31日
国家自然科学基金
0+阅读 · 2012年12月31日
国家自然科学基金
0+阅读 · 2012年12月31日
国家自然科学基金
0+阅读 · 2012年12月31日
国家自然科学基金
1+阅读 · 2012年12月31日
国家自然科学基金
1+阅读 · 2011年12月31日
国家自然科学基金
0+阅读 · 2011年12月31日
微信扫码咨询专知VIP会员