基于跨媒体语义关联模型的图像检索技术研究 - 专知基金

会员服务 ·

1

跨媒体检索 · 主题相关模型 · 主题模型 ·

2013 年 12 月 31 日

基于跨媒体语义关联模型的图像检索技术研究

国家自然科学基金

国家自然科学基金委员会

项目名称： 基于跨媒体语义关联模型的图像检索技术研究

项目编号： No.61305047

项目类型： 青年科学基金项目

立项/批准年度： 2014

项目学科： 自动化技术、计算机技术

项目作者： 秦曾昌

作者单位： 北京航空航天大学

项目金额： 25万元

中文摘要： 如何能更好的利用图像附带的文本与标签信息来帮助改善基于内容的图像检索是本项目重点研究的问题。本项目利用"特征包模型"和"主题模型"，分别对图像及其周围文本或标签进行建模，挖掘图像特征与关联文本语义之间的联系。同时提出自动的语义标注模型，获取图像在语义主题上的分布情况。使得在用户提供越多信息的情况下，越能够得到更加准确的检索结果。在此基础上我们提出了一种新的非参数贝叶斯模型来对语义关联中的"众包"特性进行建模。把属于不同媒体的信息的语义关联用一个完整和系统的概率生成模型表达，并给出了该模型的变分推理方法。该模型的重要意义在于可以应用到任何跨媒体的信息关联的建模中，并不只局限于图像和文本。

中文关键词： 跨媒体检索；主题相关模型；主题模型；；

英文摘要： How to use the information of associated texts or tags to a given image for content-based image retrieval task is investigated in the proposal.Bag-of-features model and topic models are used to model the image and its associated texts or tags, respectively. The corrleation between these two high-level semantic representations will be studied. Automatic learned topic distributions will be used to label images， that is referred to as semantic annotation. More textual words or tags are provided, more precise semantic representations we can obtain for the given image, as well as improved search quality. Based on such a correlation, we propose a new nonparametric Bayesian model by considering the crowdsoucing effects of the tags. We use a systematic probabilistic generative model to describe such cross-modal semantic correlations. The variational method is used and the updating equations are deduced. The significance of this new correlation model is not only limited to image-text modality, it can be applied to study any cross-modal information correlations.

英文关键词： Cross-modal retrieval；Topic correlation model；Topic model；；

成为VIP会员查看完整内容

1

相关内容

跨媒体检索

跨媒体检索

【博士论文】视觉语言交互中的视觉推理研究

【博士论文】视觉语言交互中的视觉推理研究

专知会员服务

64+阅读 · 2021年12月1日

【ACL2021】基于隐含结构推理网络的事件因果关系识别

专知会员服务

52+阅读 · 2021年8月13日

基于深度学习的跨模态检索综述

专知会员服务

61+阅读 · 2021年3月25日

多元时间序列因果关系分析研究综述

专知会员服务

146+阅读 · 2021年2月3日

自动图像标注技术综述(中文版)，27页pdf

专知会员服务

39+阅读 · 2020年12月14日

【EMNLP2020-京东】电子商务产品的多模态联合属性预测与属性值提取

【EMNLP2020-京东】电子商务产品的多模态联合属性预测与属性值提取

专知会员服务

21+阅读 · 2020年9月17日

KDD20 | 主题模型在图模型中的应用专题

专知会员服务

31+阅读 · 2020年9月13日

【ACM MM2020-计算所】基于多源语义嵌入的场景识别的广义零样本学习

【ACM MM2020-计算所】基于多源语义嵌入的场景识别的广义零样本学习

专知会员服务

22+阅读 · 2020年9月5日

【CVPR 2020-人大】基于层次图推理的细粒度文本视频跨模态检索

【CVPR 2020-人大】基于层次图推理的细粒度文本视频跨模态检索

专知会员服务

67+阅读 · 2020年4月5日

图像内容自动描述技术综述

图像内容自动描述技术综述

专知会员服务

88+阅读 · 2019年11月17日

杨宇鸿：腾讯多模态内容理解技术及应用

杨宇鸿：腾讯多模态内容理解技术及应用

专知

3+阅读 · 2022年1月27日

图像检索在高德地图POI数据生产中的应用

图像检索在高德地图POI数据生产中的应用

阿里技术

5+阅读 · 2021年11月4日

基于视觉和语言的跨媒体问答与推理研究综述

基于视觉和语言的跨媒体问答与推理研究综述

专知

5+阅读 · 2021年3月17日

CVPR 2020 | 细粒度文本视频跨模态检索

CVPR 2020 | 细粒度文本视频跨模态检索

AI科技评论

17+阅读 · 2020年3月24日

论文浅尝 | 利用关系标签的主题语义知识为关系抽取提供监督 (IJCAI 2019)

论文浅尝 | 利用关系标签的主题语义知识为关系抽取提供监督 (IJCAI 2019)

开放知识图谱

16+阅读 · 2019年8月17日

【CVPR2019】弱监督图像分类建模

【CVPR2019】弱监督图像分类建模

深度学习大讲堂

38+阅读 · 2019年7月25日

论文浅尝 | 基于多模态关联数据嵌入的知识库补全

论文浅尝 | 基于多模态关联数据嵌入的知识库补全

开放知识图谱

12+阅读 · 2018年12月13日

【学界】融合对抗学习的因果关系抽取

【学界】融合对抗学习的因果关系抽取

GAN生成式对抗网络

15+阅读 · 2018年7月14日

图像检索研究进展：浅层、深层特征及特征融合

图像检索研究进展：浅层、深层特征及特征融合

中国计算机学会

122+阅读 · 2018年3月26日

基于图片内容的深度学习图片检索（一）

基于图片内容的深度学习图片检索（一）

七月在线实验室

20+阅读 · 2017年10月1日

基于目标语义的网络图像检索技术研究

国家自然科学基金

0+阅读 · 2014年12月31日

基于影像关联层次模型的遥感影像检索研究

国家自然科学基金

1+阅读 · 2013年12月31日

基于内容的跨媒体检索研究

国家自然科学基金

1+阅读 · 2012年12月31日

基于社会网络的图像语义特征提取与描述方法研究

国家自然科学基金

0+阅读 · 2012年12月31日

面向大数据的媒体内容分析与关联语义挖掘研究

国家自然科学基金

0+阅读 · 2012年12月31日

基于Web挖掘的图像和视频标注与搜索关键技术研究

国家自然科学基金

0+阅读 · 2011年12月31日

基于视感知的图像视频语义获取关键技术研究

国家自然科学基金

0+阅读 · 2009年12月31日

基于跨媒体信息挖掘的网络舆情分析研究

国家自然科学基金

2+阅读 · 2009年12月31日

跨媒体语义医学图像检索中关键技术研究

国家自然科学基金

2+阅读 · 2008年12月31日

面向语义概念和上下文关系的图像检索关键技术研究

国家自然科学基金

1+阅读 · 2008年12月31日

Factual Error Correction for Abstractive Summaries Using Entity Retrieval

Arxiv

0+阅读 · 2022年4月18日

Unsupervised Cross-Task Generalization via Retrieval Augmentation

Arxiv

0+阅读 · 2022年4月17日

Guiding Attention using Partial-Order Relationships for Image Captioning

Arxiv

0+阅读 · 2022年4月15日

Cross-Modal Coherence for Text-to-Image Retrieval

Arxiv

0+阅读 · 2022年4月15日

Stretching Sentence-pair NLI Models to Reason over Long Documents and Clusters

Stretching Sentence-pair NLI Models to Reason over Long Documents and Clusters

Arxiv

0+阅读 · 2022年4月15日

Video as Conditional Graph Hierarchy for Multi-Granular Question Answering

Video as Conditional Graph Hierarchy for Multi-Granular Question Answering

Arxiv

0+阅读 · 2022年4月15日

KBGN: Knowledge-Bridge Graph Network for Adaptive Vision-Text Reasoning in Visual Dialogue

KBGN: Knowledge-Bridge Graph Network for Adaptive Vision-Text Reasoning in Visual Dialogue

Arxiv

12+阅读 · 2020年8月11日

Cross-lingual Knowledge Graph Alignment via Graph Matching Neural Network

Arxiv

15+阅读 · 2019年5月28日

Multi-Task Feature Learning for Knowledge Graph Enhanced Recommendation

Arxiv

15+阅读 · 2019年1月23日

Distance-based Self-Attention Network for Natural Language Inference

Arxiv

10+阅读 · 2017年12月6日

阅读: 0 点赞: 0

小贴士

登录享主题订阅及个性化推荐

相关主题

跨媒体检索

主题相关模型

热门VIP内容

开通专知VIP会员享更多权益服务

操作系统智能体：基于多模态大模型（MLLM）的通用计算设备智能体综述

《美国太空军系统全生命周期建模、仿真与分析效能提升方案》最新84页报告

【博士论文】推进数据高效的深度学习：非参数 Transformer、主动测试与上下文学习

自主人工智能：未来战争是否将是自主化的？

相关VIP内容

【博士论文】视觉语言交互中的视觉推理研究

【博士论文】视觉语言交互中的视觉推理研究

专知会员服务

64+阅读 · 2021年12月1日

【ACL2021】基于隐含结构推理网络的事件因果关系识别

专知会员服务

52+阅读 · 2021年8月13日

基于深度学习的跨模态检索综述

专知会员服务

61+阅读 · 2021年3月25日

多元时间序列因果关系分析研究综述

专知会员服务

146+阅读 · 2021年2月3日

自动图像标注技术综述(中文版)，27页pdf

专知会员服务

39+阅读 · 2020年12月14日

【EMNLP2020-京东】电子商务产品的多模态联合属性预测与属性值提取

【EMNLP2020-京东】电子商务产品的多模态联合属性预测与属性值提取

专知会员服务

21+阅读 · 2020年9月17日

KDD20 | 主题模型在图模型中的应用专题

专知会员服务

31+阅读 · 2020年9月13日

【ACM MM2020-计算所】基于多源语义嵌入的场景识别的广义零样本学习

【ACM MM2020-计算所】基于多源语义嵌入的场景识别的广义零样本学习

专知会员服务

22+阅读 · 2020年9月5日

【CVPR 2020-人大】基于层次图推理的细粒度文本视频跨模态检索

【CVPR 2020-人大】基于层次图推理的细粒度文本视频跨模态检索

专知会员服务

67+阅读 · 2020年4月5日

图像内容自动描述技术综述

图像内容自动描述技术综述

专知会员服务

88+阅读 · 2019年11月17日

相关资讯

杨宇鸿：腾讯多模态内容理解技术及应用

杨宇鸿：腾讯多模态内容理解技术及应用

专知

3+阅读 · 2022年1月27日

图像检索在高德地图POI数据生产中的应用

图像检索在高德地图POI数据生产中的应用

阿里技术

5+阅读 · 2021年11月4日

基于视觉和语言的跨媒体问答与推理研究综述

基于视觉和语言的跨媒体问答与推理研究综述

专知

5+阅读 · 2021年3月17日

CVPR 2020 | 细粒度文本视频跨模态检索

CVPR 2020 | 细粒度文本视频跨模态检索

AI科技评论

17+阅读 · 2020年3月24日

论文浅尝 | 利用关系标签的主题语义知识为关系抽取提供监督 (IJCAI 2019)

论文浅尝 | 利用关系标签的主题语义知识为关系抽取提供监督 (IJCAI 2019)

开放知识图谱

16+阅读 · 2019年8月17日

【CVPR2019】弱监督图像分类建模

【CVPR2019】弱监督图像分类建模

深度学习大讲堂

38+阅读 · 2019年7月25日

论文浅尝 | 基于多模态关联数据嵌入的知识库补全

论文浅尝 | 基于多模态关联数据嵌入的知识库补全

开放知识图谱

12+阅读 · 2018年12月13日

【学界】融合对抗学习的因果关系抽取

【学界】融合对抗学习的因果关系抽取

GAN生成式对抗网络

15+阅读 · 2018年7月14日

图像检索研究进展：浅层、深层特征及特征融合

图像检索研究进展：浅层、深层特征及特征融合

中国计算机学会

122+阅读 · 2018年3月26日

基于图片内容的深度学习图片检索（一）

基于图片内容的深度学习图片检索（一）

七月在线实验室

20+阅读 · 2017年10月1日

相关基金

基于目标语义的网络图像检索技术研究

国家自然科学基金

0+阅读 · 2014年12月31日

基于影像关联层次模型的遥感影像检索研究

国家自然科学基金

1+阅读 · 2013年12月31日

基于内容的跨媒体检索研究

国家自然科学基金

1+阅读 · 2012年12月31日

基于社会网络的图像语义特征提取与描述方法研究

国家自然科学基金

0+阅读 · 2012年12月31日

面向大数据的媒体内容分析与关联语义挖掘研究

国家自然科学基金

0+阅读 · 2012年12月31日

基于Web挖掘的图像和视频标注与搜索关键技术研究

国家自然科学基金

0+阅读 · 2011年12月31日

基于视感知的图像视频语义获取关键技术研究

国家自然科学基金

0+阅读 · 2009年12月31日

基于跨媒体信息挖掘的网络舆情分析研究

国家自然科学基金

2+阅读 · 2009年12月31日

跨媒体语义医学图像检索中关键技术研究

国家自然科学基金

2+阅读 · 2008年12月31日

面向语义概念和上下文关系的图像检索关键技术研究

国家自然科学基金

1+阅读 · 2008年12月31日

相关论文

Factual Error Correction for Abstractive Summaries Using Entity Retrieval

Arxiv

0+阅读 · 2022年4月18日

Unsupervised Cross-Task Generalization via Retrieval Augmentation

Arxiv

0+阅读 · 2022年4月17日

Guiding Attention using Partial-Order Relationships for Image Captioning

Arxiv

0+阅读 · 2022年4月15日

Cross-Modal Coherence for Text-to-Image Retrieval

Arxiv

0+阅读 · 2022年4月15日

Stretching Sentence-pair NLI Models to Reason over Long Documents and Clusters

Stretching Sentence-pair NLI Models to Reason over Long Documents and Clusters

Arxiv

0+阅读 · 2022年4月15日

Video as Conditional Graph Hierarchy for Multi-Granular Question Answering

Video as Conditional Graph Hierarchy for Multi-Granular Question Answering

Arxiv

0+阅读 · 2022年4月15日

KBGN: Knowledge-Bridge Graph Network for Adaptive Vision-Text Reasoning in Visual Dialogue

KBGN: Knowledge-Bridge Graph Network for Adaptive Vision-Text Reasoning in Visual Dialogue

Arxiv

12+阅读 · 2020年8月11日

Cross-lingual Knowledge Graph Alignment via Graph Matching Neural Network

Arxiv

15+阅读 · 2019年5月28日

Multi-Task Feature Learning for Knowledge Graph Enhanced Recommendation

Arxiv

15+阅读 · 2019年1月23日

Distance-based Self-Attention Network for Natural Language Inference

Arxiv

10+阅读 · 2017年12月6日

微信扫码咨询专知VIP会员