【ACMMM2024】视觉-语义分解和部分对齐在基于文档的零样本学习中的应用 - 专知VIP

会员服务 ·

12

ACM Multimedia · 视觉语义分解 · 零样本学习 ·

2024 年 7 月 24 日

【ACMMM2024】视觉-语义分解和部分对齐在基于文档的零样本学习中的应用

专知会员服务

专知，提供专业可信的知识分发服务，让认知协作更快更好！

最近的研究表明，百科全书中的文档作为辅助信息对零样本学习非常有帮助。现有方法通过将整个文档的语义与相应的图像对齐来传递知识。然而，这些方法忽略了语义信息在两者之间并不等价，导致次优的对齐效果。在本研究中，我们提出了一种新颖的网络，从文档和图像中提取多视角的语义概念，并对匹配的部分概念进行对齐，而不是整个概念。具体来说，我们提出了一个语义分解模块，从视觉和文本方面生成多视角的语义嵌入，为部分对齐提供基本概念。为了缓解嵌入中的信息冗余问题，我们提出了局部到语义方差损失，以捕捉不同的局部细节，并提出多语义多样性损失，以在嵌入之间强制正交性。随后，引入了两种损失，根据它们在视图和词到片段级别的语义相关性，部分对齐视觉-语义嵌入对。因此，我们在三种标准基准测试的两个文档来源下，一直优于最新的方法。在定性方面，我们表明我们的模型学习到了可解释的部分关联。代码可在此获取。

成为VIP会员查看完整内容

19

相关内容

ACM Multimedia

ACM 国际多媒体大会（英文名称：ACM Multimedia，简称：ACM MM）是多媒体领域的顶级国际会议，每年举办一次。

【KDD2024】异质性知情的元参数学习用于时空时间序列预测

【KDD2024】异质性知情的元参数学习用于时空时间序列预测

专知会员服务

22+阅读 · 2024年5月22日

【KDD2024】用于时空时间序列预测的异质性信息元参数学习

【KDD2024】用于时空时间序列预测的异质性信息元参数学习

专知会员服务

19+阅读 · 2024年5月20日

【CVPR2024】自然监督下的三维视觉定位与语言规范化的概念学习

【CVPR2024】自然监督下的三维视觉定位与语言规范化的概念学习

专知会员服务

16+阅读 · 2024年5月1日

【AAAI2024】使用大型语言模型的生成式多模态知识检索

【AAAI2024】使用大型语言模型的生成式多模态知识检索

专知会员服务

57+阅读 · 2024年1月19日

【ICML2022】基于元语义正则化的介入性对比学习

【ICML2022】基于元语义正则化的介入性对比学习

专知会员服务

21+阅读 · 2022年7月1日

【AAAI2022】基于变分信息瓶颈的图结构学习

【AAAI2022】基于变分信息瓶颈的图结构学习

专知会员服务

20+阅读 · 2021年12月18日

【AAAI2022】基于图神经网络的稀疏结构学习在文档分类中的应用

【AAAI2022】基于图神经网络的稀疏结构学习在文档分类中的应用

专知会员服务

35+阅读 · 2021年12月17日

【ICML2021】加速异构数据的分散式深度学习

专知会员服务

16+阅读 · 2021年7月7日

【NeurIPS2020】梯度增强的转导优化和泛化分析及在多尺度图神经网络中的应用

专知会员服务

14+阅读 · 2020年9月27日

【ACMMM2020】零样本语义分割的上下文感知特征生成

【ACMMM2020】零样本语义分割的上下文感知特征生成

专知会员服务

16+阅读 · 2020年8月21日

【AAAI2023】用于图对比学习的谱特征增强

【AAAI2023】用于图对比学习的谱特征增强

专知

20+阅读 · 2022年12月11日

【CVPR2021】跨模态检索的概率嵌入

【CVPR2021】跨模态检索的概率嵌入

专知

17+阅读 · 2021年3月2日

[IEEE TPAMI 2021]卷积原型网络在开放集识别中的应用

[IEEE TPAMI 2021]卷积原型网络在开放集识别中的应用

专知

11+阅读 · 2021年2月19日

【AAAI2021】基于图神经网络的文本语义匹配算法

【AAAI2021】基于图神经网络的文本语义匹配算法

专知

17+阅读 · 2021年1月30日

【MIT】硬负样本的对比学习

【MIT】硬负样本的对比学习

专知

13+阅读 · 2020年10月15日

【ACM Multimedia2020】跨模态注意力Transformer模型的深度视频理解

【ACM Multimedia2020】跨模态注意力Transformer模型的深度视频理解

专知

15+阅读 · 2020年8月30日

【KDD2020】图神经网络生成式预训练

【KDD2020】图神经网络生成式预训练

专知

22+阅读 · 2020年7月3日

【CVPR2020-北京大学】自适应间隔损失的提升小样本学习

【CVPR2020-北京大学】自适应间隔损失的提升小样本学习

专知

12+阅读 · 2020年6月9日

【CVPR2020-旷视】DPGN：分布传播图网络的小样本学习

【CVPR2020-旷视】DPGN：分布传播图网络的小样本学习

专知

13+阅读 · 2020年4月1日

【CVPR2020-牛津-谷歌】语音到动作:动作识别的跨模态监督，Cross-modal Supervision

【CVPR2020-牛津-谷歌】语音到动作:动作识别的跨模态监督，Cross-modal Supervision

专知

10+阅读 · 2020年3月31日

基于区分型码本的图像表示的研究与应用

国家自然科学基金

1+阅读 · 2015年12月31日

基于部件结构的图像协同分割方法研究

国家自然科学基金

1+阅读 · 2015年12月31日

基于迁移学习的图像隐写分析新方法研究

国家自然科学基金

1+阅读 · 2015年12月31日

基于Spark的大图数据最优子模式匹配查询方法研究

国家自然科学基金

1+阅读 · 2015年12月31日

模糊认知集群优化的聚类算法

国家自然科学基金

8+阅读 · 2015年12月31日

面向异分布数据的主动学习方法

国家自然科学基金

12+阅读 · 2015年12月31日

稀疏性多维联合优化在线视觉跟踪方法研究

国家自然科学基金

0+阅读 · 2015年12月31日

相依重尾随机变量和的渐近性及其在更新风险模型中的应用

国家自然科学基金

0+阅读 · 2014年12月31日

面向基因组相关性研究的迁移学习理论与方法

国家自然科学基金

0+阅读 · 2014年12月31日

基于字典学习的小样本高光谱遥感图像稀疏表示分类精度研究与应用

国家自然科学基金

3+阅读 · 2014年12月31日

Is ChatGPT a Good Recommender? A Preliminary Study

Arxiv

171+阅读 · 2023年4月20日

NeuralField-LDM: Scene Generation with Hierarchical Latent Diffusion Models

Arxiv

42+阅读 · 2023年4月19日

A Comprehensive Survey on Deep Graph Representation Learning

Arxiv

103+阅读 · 2023年4月11日

On Efficient Training of Large-Scale Deep Learning Models: A Literature Review

Arxiv

216+阅读 · 2023年4月7日

A Survey on Graph Diffusion Models: Generative AI in Science for Molecule, Protein and Material

Arxiv

81+阅读 · 2023年4月4日

A Survey of Large Language Models

A Survey of Large Language Models

Arxiv

478+阅读 · 2023年3月31日

Unleashing the Power of Edge-Cloud Generative AI in Mobile Networks: A Survey of AIGC Services

Arxiv

147+阅读 · 2023年3月29日

Nature Language Reasoning, A Survey

Arxiv

78+阅读 · 2023年3月26日

Knowledge Graphs: Opportunities and Challenges

Arxiv

174+阅读 · 2023年3月24日

Data-centric Artificial Intelligence: A Survey

Arxiv

24+阅读 · 2023年3月17日

VIP会员

相关主题

视觉语义分解

零样本学习

相关VIP内容

【KDD2024】异质性知情的元参数学习用于时空时间序列预测

【KDD2024】异质性知情的元参数学习用于时空时间序列预测

专知会员服务

22+阅读 · 2024年5月22日

【KDD2024】用于时空时间序列预测的异质性信息元参数学习

【KDD2024】用于时空时间序列预测的异质性信息元参数学习

专知会员服务

19+阅读 · 2024年5月20日

【CVPR2024】自然监督下的三维视觉定位与语言规范化的概念学习

【CVPR2024】自然监督下的三维视觉定位与语言规范化的概念学习

专知会员服务

16+阅读 · 2024年5月1日

【AAAI2024】使用大型语言模型的生成式多模态知识检索

【AAAI2024】使用大型语言模型的生成式多模态知识检索

专知会员服务

57+阅读 · 2024年1月19日

【ICML2022】基于元语义正则化的介入性对比学习

【ICML2022】基于元语义正则化的介入性对比学习

专知会员服务

21+阅读 · 2022年7月1日

【AAAI2022】基于变分信息瓶颈的图结构学习

【AAAI2022】基于变分信息瓶颈的图结构学习

专知会员服务

20+阅读 · 2021年12月18日

【AAAI2022】基于图神经网络的稀疏结构学习在文档分类中的应用

【AAAI2022】基于图神经网络的稀疏结构学习在文档分类中的应用

专知会员服务

35+阅读 · 2021年12月17日

【ICML2021】加速异构数据的分散式深度学习

专知会员服务

16+阅读 · 2021年7月7日

【NeurIPS2020】梯度增强的转导优化和泛化分析及在多尺度图神经网络中的应用

专知会员服务

14+阅读 · 2020年9月27日

【ACMMM2020】零样本语义分割的上下文感知特征生成

【ACMMM2020】零样本语义分割的上下文感知特征生成

专知会员服务

16+阅读 · 2020年8月21日

热门VIP内容

开通专知VIP会员享更多权益服务

模型提取攻击与防御的系统综述：最新进展与展望

【博士论文】低维与高维空间中潜在表征的分析、建模与变换

【CMU博士论文】用于物理模拟的高效深度学习模型

大模型解决方案白皮书：社交陪伴场景全流程落地指南

相关资讯

【AAAI2023】用于图对比学习的谱特征增强

【AAAI2023】用于图对比学习的谱特征增强

专知

20+阅读 · 2022年12月11日

【CVPR2021】跨模态检索的概率嵌入

【CVPR2021】跨模态检索的概率嵌入

专知

17+阅读 · 2021年3月2日

[IEEE TPAMI 2021]卷积原型网络在开放集识别中的应用

[IEEE TPAMI 2021]卷积原型网络在开放集识别中的应用

专知

11+阅读 · 2021年2月19日

【AAAI2021】基于图神经网络的文本语义匹配算法

【AAAI2021】基于图神经网络的文本语义匹配算法

专知

17+阅读 · 2021年1月30日

【MIT】硬负样本的对比学习

【MIT】硬负样本的对比学习

专知

13+阅读 · 2020年10月15日

【ACM Multimedia2020】跨模态注意力Transformer模型的深度视频理解

【ACM Multimedia2020】跨模态注意力Transformer模型的深度视频理解

专知

15+阅读 · 2020年8月30日

【KDD2020】图神经网络生成式预训练

【KDD2020】图神经网络生成式预训练

专知

22+阅读 · 2020年7月3日

【CVPR2020-北京大学】自适应间隔损失的提升小样本学习

【CVPR2020-北京大学】自适应间隔损失的提升小样本学习

专知

12+阅读 · 2020年6月9日

【CVPR2020-旷视】DPGN：分布传播图网络的小样本学习

【CVPR2020-旷视】DPGN：分布传播图网络的小样本学习

专知

13+阅读 · 2020年4月1日

【CVPR2020-牛津-谷歌】语音到动作:动作识别的跨模态监督，Cross-modal Supervision

【CVPR2020-牛津-谷歌】语音到动作:动作识别的跨模态监督，Cross-modal Supervision

专知

10+阅读 · 2020年3月31日

相关基金

基于区分型码本的图像表示的研究与应用

国家自然科学基金

1+阅读 · 2015年12月31日

基于部件结构的图像协同分割方法研究

国家自然科学基金

1+阅读 · 2015年12月31日

基于迁移学习的图像隐写分析新方法研究

国家自然科学基金

1+阅读 · 2015年12月31日

基于Spark的大图数据最优子模式匹配查询方法研究

国家自然科学基金

1+阅读 · 2015年12月31日

模糊认知集群优化的聚类算法

国家自然科学基金

8+阅读 · 2015年12月31日

面向异分布数据的主动学习方法

国家自然科学基金

12+阅读 · 2015年12月31日

稀疏性多维联合优化在线视觉跟踪方法研究

国家自然科学基金

0+阅读 · 2015年12月31日

相依重尾随机变量和的渐近性及其在更新风险模型中的应用

国家自然科学基金

0+阅读 · 2014年12月31日

面向基因组相关性研究的迁移学习理论与方法

国家自然科学基金

0+阅读 · 2014年12月31日

基于字典学习的小样本高光谱遥感图像稀疏表示分类精度研究与应用

国家自然科学基金

3+阅读 · 2014年12月31日

相关论文

Is ChatGPT a Good Recommender? A Preliminary Study

Arxiv

171+阅读 · 2023年4月20日

NeuralField-LDM: Scene Generation with Hierarchical Latent Diffusion Models

Arxiv

42+阅读 · 2023年4月19日

A Comprehensive Survey on Deep Graph Representation Learning

Arxiv

103+阅读 · 2023年4月11日

On Efficient Training of Large-Scale Deep Learning Models: A Literature Review

Arxiv

216+阅读 · 2023年4月7日

A Survey on Graph Diffusion Models: Generative AI in Science for Molecule, Protein and Material

Arxiv

81+阅读 · 2023年4月4日

A Survey of Large Language Models

A Survey of Large Language Models

Arxiv

478+阅读 · 2023年3月31日

Unleashing the Power of Edge-Cloud Generative AI in Mobile Networks: A Survey of AIGC Services

Arxiv

147+阅读 · 2023年3月29日

Nature Language Reasoning, A Survey

Arxiv

78+阅读 · 2023年3月26日

Knowledge Graphs: Opportunities and Challenges

Arxiv

174+阅读 · 2023年3月24日

Data-centric Artificial Intelligence: A Survey

Arxiv

24+阅读 · 2023年3月17日

微信扫码咨询专知VIP会员