项目名称: 基于位置敏感哈希的图像语义检索技术研究

项目编号: No.61301232

项目类型: 青年科学基金项目

立项/批准年度: 2014

项目学科: 无线电电子学、电信技术

项目作者: 彭天强

作者单位: 河南工程学院

项目金额: 24万元

中文摘要: 视觉词典法是图像语义检索的主流算法,采用K-Means聚类产生视觉词典的方法虽然获得了较为优越的性能。但是存在同义性、多义性、计算效率低、不支持动态扩展、相似性度量效果差等缺点,因此还很难满足实际应用所提出的准确性、鲁棒性和速度要求。位置敏感哈希由于在高维向量搜索的优良性能被作为一种新型的视觉语义检索模型。本项目主要研究基于位置敏感哈希的图像语义检索技术,搭建面向真实网络数据集的图像语义检索原型平台,具体包括:位置敏感哈希的拓展与改进,学习式度量、视觉语言模型等视觉语义检索算法。一方面通过位置敏感哈希的拓展和改进,使得视觉词典区分性更强、识别率更高、具有可扩展性;另一方面将视觉语言模型和学习式度量等多种方法整合到随机映射中,提高模型和算法的鲁棒性,使得视觉语义搜索系统在复杂情况下仍然能够保持良好的性能,为图像语义检索技术的整体发展提供新的研究思路和研究方法。

中文关键词: 视觉词典;位置敏感哈希;图像语义检索;空间金字塔;深度学习

英文摘要: BoVW(Bag-of-Visual-Words) is the state-of-the-art algorithm in the semantic-based visual retrieval domain. So far, visual words generated by K-Means and similarity measure based on Euclidean distance have achieved advantageouos performance. However, K-Means clustering algorithm has some deficiencies, such as visual word synonymy, polysemy, high computational cost and not supportive of scalability, the maximum and minimum Euclidean distance between any two points tend to be equal in high-dimensional space, which suppress the performance. Locality Sensitive Hash(LSH) is adopted as a new semantic-based visual retrieval model for its good performance in high-dimensional space retrieval task. This project mainly study on semantic-based image retrieval based on LSH, including: development and improvement of LSH, distance metric learning, and visual language model,etc. On one hand, the distinctness of visual words is enhanced and recognition rate and scalability are improved by LSH; On the other hand, the robustness of the model and algorithm is boosted by integrating spatial structure similarity matching and distance metric learning into LSH, resulting in good performance in complicated situation. Research of above technologies brings new vigor into the semantic-based visual retrieval development.

英文关键词: visual dictionary;locality sensitive hash;image semantic retrieval;space pyramid;deep learning

成为VIP会员查看完整内容
0

相关内容

军事知识图谱构建技术
专知会员服务
115+阅读 · 2022年4月8日
【WWW2022】TaxoEnrich:通过结构语义表示的自监督分类法补全
专知会员服务
15+阅读 · 2021年8月13日
专知会员服务
17+阅读 · 2021年5月16日
专知会员服务
38+阅读 · 2021年3月29日
专知会员服务
59+阅读 · 2021年3月9日
专知会员服务
58+阅读 · 2021年3月6日
【AAAI2021】协同挖掘:用于稀疏注释目标检测的自监督学习
深度学习目标检测方法综述
专知会员服务
259+阅读 · 2020年8月1日
深度学习下的京东搜索召回技术
专知
1+阅读 · 2022年3月11日
对比学习在NLP和多模态领域的应用
RUC AI Box
2+阅读 · 2022年2月25日
将对比学习扩展到监督式场景
TensorFlow
1+阅读 · 2021年7月20日
光学遥感图像目标检测算法综述
专知
7+阅读 · 2021年3月23日
图像修复研究进展综述
专知
16+阅读 · 2021年3月9日
面向云端融合的分布式计算技术研究进展与趋势
中国计算机学会
18+阅读 · 2018年11月27日
基于二进制哈希编码快速学习的快速图像检索
极市平台
12+阅读 · 2018年5月17日
一文读懂图像压缩算法
七月在线实验室
15+阅读 · 2018年5月2日
如何设计基于深度学习的图像压缩算法
论智
40+阅读 · 2018年4月26日
国家自然科学基金
0+阅读 · 2013年12月31日
国家自然科学基金
0+阅读 · 2013年12月31日
国家自然科学基金
0+阅读 · 2012年12月31日
国家自然科学基金
0+阅读 · 2012年12月31日
国家自然科学基金
2+阅读 · 2012年12月31日
国家自然科学基金
0+阅读 · 2012年12月31日
国家自然科学基金
0+阅读 · 2011年12月31日
国家自然科学基金
0+阅读 · 2011年12月31日
国家自然科学基金
0+阅读 · 2010年12月31日
国家自然科学基金
0+阅读 · 2009年12月31日
Arxiv
10+阅读 · 2018年4月19日
小贴士
相关VIP内容
军事知识图谱构建技术
专知会员服务
115+阅读 · 2022年4月8日
【WWW2022】TaxoEnrich:通过结构语义表示的自监督分类法补全
专知会员服务
15+阅读 · 2021年8月13日
专知会员服务
17+阅读 · 2021年5月16日
专知会员服务
38+阅读 · 2021年3月29日
专知会员服务
59+阅读 · 2021年3月9日
专知会员服务
58+阅读 · 2021年3月6日
【AAAI2021】协同挖掘:用于稀疏注释目标检测的自监督学习
深度学习目标检测方法综述
专知会员服务
259+阅读 · 2020年8月1日
相关资讯
深度学习下的京东搜索召回技术
专知
1+阅读 · 2022年3月11日
对比学习在NLP和多模态领域的应用
RUC AI Box
2+阅读 · 2022年2月25日
将对比学习扩展到监督式场景
TensorFlow
1+阅读 · 2021年7月20日
光学遥感图像目标检测算法综述
专知
7+阅读 · 2021年3月23日
图像修复研究进展综述
专知
16+阅读 · 2021年3月9日
面向云端融合的分布式计算技术研究进展与趋势
中国计算机学会
18+阅读 · 2018年11月27日
基于二进制哈希编码快速学习的快速图像检索
极市平台
12+阅读 · 2018年5月17日
一文读懂图像压缩算法
七月在线实验室
15+阅读 · 2018年5月2日
如何设计基于深度学习的图像压缩算法
论智
40+阅读 · 2018年4月26日
相关基金
国家自然科学基金
0+阅读 · 2013年12月31日
国家自然科学基金
0+阅读 · 2013年12月31日
国家自然科学基金
0+阅读 · 2012年12月31日
国家自然科学基金
0+阅读 · 2012年12月31日
国家自然科学基金
2+阅读 · 2012年12月31日
国家自然科学基金
0+阅读 · 2012年12月31日
国家自然科学基金
0+阅读 · 2011年12月31日
国家自然科学基金
0+阅读 · 2011年12月31日
国家自然科学基金
0+阅读 · 2010年12月31日
国家自然科学基金
0+阅读 · 2009年12月31日
微信扫码咨询专知VIP会员