项目名称: 跨语图像检索中融合视觉信息的多语翻译与集成方法研究

项目编号: No.61300077

项目类型: 青年科学基金项目

立项/批准年度: 2014

项目学科: 自动化技术、计算机技术

项目作者: 黄永刚

作者单位: 北京理工大学

项目金额: 23万元

中文摘要: 跨语言图像检索可以使用户检索到与查询采用不同语言标注的图像,具有重要的研究和应用价值。针对跨语言图像检索中文本信息上下文缺乏的难题,本项目采用以图像视觉信息作为上下文以辅助多语翻译和集成的思想,研究一种融合图像视觉信息的多语翻译和集成新方法。首先,研究一种基于图像集合视觉相似性的查询翻译机制,提高查询翻译的准确率,从而改善目标语言图像检索的准确性。其次,在此基础上,研究一种基于检索性能预测和重排序的结果集成机制,实现对多个单语言检索结果的高效集成。最后,在结果集成之后,研究一种基于图像层次式聚类的图像标注翻译算法,提高对检索结果中图像标注的翻译准确率。项目将在中文标注图像集和英文标注图像集上验证方法的有效性。本项目的研究成果,对于跨语言图像检索、机器翻译等具有重要的理论和应用价值。

中文关键词: 查询翻译;图像检索;跨语检索;图像包;

英文摘要: Cross-Language Image Retrieval (CLIR) enables the users to retrieval the images annotated in different languages with the query. However, the lack of text information remains a challenge for multilingual translation and integration in CLIR. In order to address this issue, based on the idea of using the visual information as supplementary information, this project proposes a new method for multilingual translation and integration using visual information in CLIR. In the new method, firstly, a new query translation mechanism based on visual similarity of image sets is employed. The aim of the mechanism is to improve the accuracy of query translation and enhance the image retrieval performance in target languages. Secondly, in order to effectively integrate the image retrieval results in different languages, a new result integration mechanism based on prediction of the retrieval performance and re-ranking is adopted. Finally, a new algorithm for image annotation translation based on image hierarchical clustering is used, the goal of which is to enhance the performance of image annotation translation. The effectiveness of the proposed method will be demonstrated on the image sets annotated in Chinese and English. The achievements of this project have significant value in theory and practice for CLIR and Machine Tran

英文关键词: Query translation;Image retrieval;Cross language information retrieval;Image bag;

成为VIP会员查看完整内容
2

相关内容

【CVPR2022】语言引导与基于视觉的深度度量学习的集成
专知会员服务
15+阅读 · 2022年3月17日
自然语言处理中的文本表示研究
专知会员服务
56+阅读 · 2022年1月10日
【博士论文】视觉语言交互中的视觉推理研究
专知会员服务
62+阅读 · 2021年12月1日
专知会员服务
31+阅读 · 2021年3月17日
专知会员服务
47+阅读 · 2020年10月20日
专知会员服务
142+阅读 · 2020年9月6日
【ACL2020】基于图神经网络的文本分类新方法
专知会员服务
68+阅读 · 2020年7月12日
基于多头注意力胶囊网络的文本分类模型
专知会员服务
77+阅读 · 2020年5月24日
多模态深度学习综述,18页pdf
专知会员服务
214+阅读 · 2020年3月29日
跨语言的多模态、多任务检索模型MURAL解读
AI前线
4+阅读 · 2021年12月24日
误差反向传播——RNN
统计学习与视觉计算组
18+阅读 · 2018年9月6日
基于二进制哈希编码快速学习的快速图像检索
极市平台
12+阅读 · 2018年5月17日
国家自然科学基金
2+阅读 · 2015年12月31日
国家自然科学基金
0+阅读 · 2013年12月31日
国家自然科学基金
2+阅读 · 2013年12月31日
国家自然科学基金
1+阅读 · 2012年12月31日
国家自然科学基金
0+阅读 · 2012年12月31日
国家自然科学基金
1+阅读 · 2012年12月31日
国家自然科学基金
0+阅读 · 2011年12月31日
国家自然科学基金
2+阅读 · 2009年12月31日
国家自然科学基金
4+阅读 · 2009年12月31日
国家自然科学基金
1+阅读 · 2008年12月31日
Arxiv
0+阅读 · 2022年4月20日
Arxiv
0+阅读 · 2022年4月15日
Arxiv
0+阅读 · 2022年4月15日
Arxiv
31+阅读 · 2020年9月21日
小贴士
相关VIP内容
【CVPR2022】语言引导与基于视觉的深度度量学习的集成
专知会员服务
15+阅读 · 2022年3月17日
自然语言处理中的文本表示研究
专知会员服务
56+阅读 · 2022年1月10日
【博士论文】视觉语言交互中的视觉推理研究
专知会员服务
62+阅读 · 2021年12月1日
专知会员服务
31+阅读 · 2021年3月17日
专知会员服务
47+阅读 · 2020年10月20日
专知会员服务
142+阅读 · 2020年9月6日
【ACL2020】基于图神经网络的文本分类新方法
专知会员服务
68+阅读 · 2020年7月12日
基于多头注意力胶囊网络的文本分类模型
专知会员服务
77+阅读 · 2020年5月24日
多模态深度学习综述,18页pdf
专知会员服务
214+阅读 · 2020年3月29日
相关基金
国家自然科学基金
2+阅读 · 2015年12月31日
国家自然科学基金
0+阅读 · 2013年12月31日
国家自然科学基金
2+阅读 · 2013年12月31日
国家自然科学基金
1+阅读 · 2012年12月31日
国家自然科学基金
0+阅读 · 2012年12月31日
国家自然科学基金
1+阅读 · 2012年12月31日
国家自然科学基金
0+阅读 · 2011年12月31日
国家自然科学基金
2+阅读 · 2009年12月31日
国家自然科学基金
4+阅读 · 2009年12月31日
国家自然科学基金
1+阅读 · 2008年12月31日
微信扫码咨询专知VIP会员