项目名称: 面向点击与视觉特征融合的结构化图像排序方法研究

项目编号: No.61472110

项目类型: 面上项目

立项/批准年度: 2015

项目学科: 计算机科学学科

项目作者: 俞俊

作者单位: 杭州电子科技大学

项目金额: 80万元

中文摘要: 近年来,将用户点击数据应用于排序模型已受到越来越多的研究和关注。如何有效利用点击数据已成为包括网页检索、图像检索、视频检索等应用的重要研究内容。本项目研究目标是针对图像检索中存在点击数据稀疏、单一视觉特征无法有效描述图像内容、图像点击特征与视觉特征无法有效融合等问题,利用图像的多模态视觉特征,进行互补性分析,用以有效描述图像之间的相似性;依靠超图模型中的超边设计,实现基于图像视觉特征的流形构建;依据稀疏表达和超图模型,采用符号检索技术及交替优化技术实现对用户点击数据的预测;利用结构化排序学习模型实现图像点击特征和视觉特征在图像检索中的融合利用,并采用交替线性优化算法实现高效的图像检索。项目组具有良好的多模态特征分析、稀疏表示、图像排序算法方面的研究工作基础。本项目将为用户点击数据分析及其在图像检索中的相关应用提供坚实的理论成果、算法基础和实现技术。

中文关键词: 图像检索;稀疏表示;点击数据;多模态学习;排序学习

英文摘要: Recently, click data analysis and its applications in learning to rank model have received extensive research and attentions. How to efficiently utilize click data is one of the key issue in web page retrieval, image retrieval, video retrieval, etc. The aim of this project is to study an efficient click data based image retrieval approach. In this project, we first study effective multimodal visual feature extraction methods and analyze their complementary characteristics. Afterwards, we study hypergraph learning to describe the manifold of image distribution. Then, we adopt alternating optimization and sign search algorithm to predict click data. Finally, we integrate click data and visual features by proposing a novel structured learning to rank model and solve the objective function by using fast alternating linearization method. The project team has a good foundation in multimodal feature analysis, sparse coding and image ranking. This project will bring further improvement to click data analyis and its application in image retrieval.

英文关键词: Image Retrieval;Sparse Coding;Click Data;Multimodal Learning;Learning to Rank

成为VIP会员查看完整内容
2

相关内容

从20世纪70年代开始,有关图像检索的研究就已开始,当时主要是基于文本的图像检索技术(Text-based Image Retrieval,简称TBIR),利用文本描述的方式描述图像的特征,如绘画作品的作者、年代、流派、尺寸等。到90年代以后,出现了对图像的内容语义,如图像的颜色、纹理、布局等进行分析和检索的图像检索技术,即基于内容的图像检索(Content-based Image Retrieval,简称CBIR)技术。CBIR属于基于内容检索(Content-based Retrieval,简称CBR)的一种,CBR中还包括对动态视频、音频等其它形式多媒体信息的检索技术。

知识荟萃

精品入门和进阶教程、论文和代码整理等

更多

查看相关VIP内容、论文、资讯等
面向行人重识别的局部特征研究进展、挑战与展望
专知会员服务
26+阅读 · 2021年10月13日
专知会员服务
188+阅读 · 2020年10月14日
基于知识图谱的推荐系统总结
机器学习与推荐算法
3+阅读 · 2021年11月11日
图像描述生成研究进展
专知
1+阅读 · 2021年3月29日
基于二进制哈希编码快速学习的快速图像检索
极市平台
12+阅读 · 2018年5月17日
图像检索研究进展:浅层、深层特征及特征融合
中国计算机学会
122+阅读 · 2018年3月26日
基于图片内容的深度学习图片检索(一)
七月在线实验室
20+阅读 · 2017年10月1日
关系推理:基于表示学习和语义要素
计算机研究与发展
18+阅读 · 2017年8月22日
国家自然科学基金
2+阅读 · 2015年12月31日
国家自然科学基金
1+阅读 · 2015年12月31日
国家自然科学基金
0+阅读 · 2012年12月31日
国家自然科学基金
1+阅读 · 2012年12月31日
国家自然科学基金
0+阅读 · 2012年12月31日
国家自然科学基金
0+阅读 · 2012年12月31日
国家自然科学基金
1+阅读 · 2009年12月31日
国家自然科学基金
1+阅读 · 2008年12月31日
国家自然科学基金
0+阅读 · 2008年12月31日
Arxiv
0+阅读 · 2022年4月20日
UNITER: Learning UNiversal Image-TExt Representations
Arxiv
23+阅读 · 2019年9月25日
小贴士
相关资讯
基于知识图谱的推荐系统总结
机器学习与推荐算法
3+阅读 · 2021年11月11日
图像描述生成研究进展
专知
1+阅读 · 2021年3月29日
基于二进制哈希编码快速学习的快速图像检索
极市平台
12+阅读 · 2018年5月17日
图像检索研究进展:浅层、深层特征及特征融合
中国计算机学会
122+阅读 · 2018年3月26日
基于图片内容的深度学习图片检索(一)
七月在线实验室
20+阅读 · 2017年10月1日
关系推理:基于表示学习和语义要素
计算机研究与发展
18+阅读 · 2017年8月22日
相关基金
国家自然科学基金
2+阅读 · 2015年12月31日
国家自然科学基金
1+阅读 · 2015年12月31日
国家自然科学基金
0+阅读 · 2012年12月31日
国家自然科学基金
1+阅读 · 2012年12月31日
国家自然科学基金
0+阅读 · 2012年12月31日
国家自然科学基金
0+阅读 · 2012年12月31日
国家自然科学基金
1+阅读 · 2009年12月31日
国家自然科学基金
1+阅读 · 2008年12月31日
国家自然科学基金
0+阅读 · 2008年12月31日
微信扫码咨询专知VIP会员