【CVPR2022】语言引导与基于视觉的深度度量学习的集成 - 专知VIP

会员服务 ·

5

深度度量学习 · 语言引导 · CVPR 2022 · 论文 ·

2022 年 3 月 17 日

【CVPR2022】语言引导与基于视觉的深度度量学习的集成

专知会员服务

专知，提供专业可信的知识分发服务，让认知协作更快更好！

深度度量学习(Deep Metric Learning, DML)提出学习度量空间，将语义相似性编码为嵌入空间距离。这些空间应该可以转移到训练期间看到的类别之外。通常，DML方法使用任务网络来解决在二元类分配上定义的对比排序任务。然而，这种方法忽略了实际类之间的高级语义关系。这导致学习后的嵌入空间编码不完整的语义上下文，并歪曲类之间的语义关系，影响了学习后的度量空间的泛化性。为了解决这一问题**，我们提出了一种视觉相似度学习的语言指导目标**。利用专家类名和伪类名的语言嵌入，我们根据有意义的语言语义对视觉表示空间进行上下文化和重新对齐，以获得更好的语义一致性。大量的实验和消融为我们提出的方法提供了强大的动力，并显示语言指导为DML提供了显著的、模型无关的改进，在所有基准上实现了具有竞争力的和最先进的结果。代码可在https://github.com/ExplainableML/LanguageGuidance_for_DML获得。

成为VIP会员查看完整内容

17

相关内容

深度度量学习

深度度量学习

【CVPR2022】三元组对比学习的视觉-语言预训练

【CVPR2022】三元组对比学习的视觉-语言预训练

专知会员服务

33+阅读 · 2022年3月3日

【AAAI2022】用于视觉常识推理的场景图增强图像-文本学习

【AAAI2022】用于视觉常识推理的场景图增强图像-文本学习

专知会员服务

50+阅读 · 2021年12月20日

【NeuraIPS2021】HSVA:面向零样本学习的分层语义视觉自适应

专知会员服务

14+阅读 · 2021年10月1日

【ICLR2021】自监督蒸馏学习视觉表示

【ICLR2021】自监督蒸馏学习视觉表示

专知会员服务

34+阅读 · 2021年4月14日

CVPR2021 百度研究院 | 半监督迁移学习的自适应一致性正则化

专知会员服务

31+阅读 · 2021年3月20日

【CVPR2021】空间一致性表示学习

专知会员服务

63+阅读 · 2021年3月12日

【CVPR2021】自监督几何感知

【CVPR2021】自监督几何感知

专知会员服务

46+阅读 · 2021年3月6日

【CVPR2021】跨模态检索的概率嵌入

【CVPR2021】跨模态检索的概率嵌入

专知会员服务

20+阅读 · 2021年3月2日

【ACMMM2020】零样本语义分割的上下文感知特征生成

【ACMMM2020】零样本语义分割的上下文感知特征生成

专知会员服务

16+阅读 · 2020年8月21日

【CVPR2020-Oral】用于深度网络的任务感知超参数

【CVPR2020-Oral】用于深度网络的任务感知超参数

专知会员服务

28+阅读 · 2020年5月25日

【CVPR2022】带噪声标签的少样本学习

【CVPR2022】带噪声标签的少样本学习

专知

1+阅读 · 2022年4月15日

【CVPR2022】双曲图像分割

【CVPR2022】双曲图像分割

专知

2+阅读 · 2022年3月14日

【南洋理工-CVPR2022】视觉语言模型的条件提示学习

【南洋理工-CVPR2022】视觉语言模型的条件提示学习

专知

1+阅读 · 2022年3月13日

【CVPR2022】弱监督目标定位建模为领域适应

【CVPR2022】弱监督目标定位建模为领域适应

专知

1+阅读 · 2022年3月4日

【CVPR2022】三元组对比学习的视觉-语言预训练

【CVPR2022】三元组对比学习的视觉-语言预训练

专知

3+阅读 · 2022年3月3日

【WWW2022】TaxoEnrich:通过结构语义表示的自监督分类法补全

【WWW2022】TaxoEnrich:通过结构语义表示的自监督分类法补全

专知

0+阅读 · 2022年2月14日

【ICLR2021】自监督蒸馏学习视觉表示

【ICLR2021】自监督蒸馏学习视觉表示

专知

1+阅读 · 2021年4月14日

【CVPR2021】空间一致性表示学习

【CVPR2021】空间一致性表示学习

专知

0+阅读 · 2021年3月12日

【CVPR2021】基于反事实推断的视觉问答框架

【CVPR2021】基于反事实推断的视觉问答框架

专知

38+阅读 · 2021年3月4日

【CVPR2021】跨模态检索的概率嵌入

【CVPR2021】跨模态检索的概率嵌入

专知

17+阅读 · 2021年3月2日

基于组合地图模型的图像检索算法研究

国家自然科学基金

0+阅读 · 2013年12月31日

物联网异构标识解析关键技术研究

国家自然科学基金

3+阅读 · 2013年12月31日

三维模型在异构空间中的语义迁移方法研究

国家自然科学基金

0+阅读 · 2013年12月31日

基于多任务概率视觉语义模型的图像场景理解

国家自然科学基金

2+阅读 · 2013年12月31日

跨语图像检索中融合视觉信息的多语翻译与集成方法研究

国家自然科学基金

2+阅读 · 2013年12月31日

基于统计流形的局部视觉特征层次化索引研究

国家自然科学基金

0+阅读 · 2011年12月31日

面向网络弱标记图像的视觉对象模型在线学习方法

国家自然科学基金

0+阅读 · 2011年12月31日

面向视觉残障者的图像的力/触觉表达与再现方法研究

国家自然科学基金

0+阅读 · 2010年12月31日

基于感知视觉单词描述的对象分割研究

国家自然科学基金

0+阅读 · 2009年12月31日

面向语义概念和上下文关系的图像检索关键技术研究

国家自然科学基金

1+阅读 · 2008年12月31日

Self-supervised Video Representation Learning with Cascade Positive Retrieval

Arxiv

0+阅读 · 2022年4月20日

On the Coexistence of Stability and Incentive Compatibility in Fractional Matchings

Arxiv

0+阅读 · 2022年4月19日

Bootstrapped Representation Learning for Skeleton-Based Action Recognition

Arxiv

0+阅读 · 2022年4月19日

NAFSSR: Stereo Image Super-Resolution Using NAFNet

Arxiv

0+阅读 · 2022年4月19日

TSception: Capturing Temporal Dynamics and Spatial Asymmetry from EEG for Emotion Recognition

Arxiv

0+阅读 · 2022年4月18日

Hand Geometry Based Recognition with a MLP Classifier

Arxiv

0+阅读 · 2022年4月16日

K-Net: Towards Unified Image Segmentation

Arxiv

12+阅读 · 2021年11月1日

A Survey on Visual Transformer

Arxiv

19+阅读 · 2020年12月23日

SlowFast Networks for Video Recognition

SlowFast Networks for Video Recognition

Arxiv

19+阅读 · 2018年12月10日

Reinforced Self-Attention Network: a Hybrid of Hard and Soft Attention for Sequence Modeling

Arxiv

16+阅读 · 2018年1月31日

VIP会员

相关主题

深度度量学习

相关VIP内容

【CVPR2022】三元组对比学习的视觉-语言预训练

【CVPR2022】三元组对比学习的视觉-语言预训练

专知会员服务

33+阅读 · 2022年3月3日

【AAAI2022】用于视觉常识推理的场景图增强图像-文本学习

【AAAI2022】用于视觉常识推理的场景图增强图像-文本学习

专知会员服务

50+阅读 · 2021年12月20日

【NeuraIPS2021】HSVA:面向零样本学习的分层语义视觉自适应

专知会员服务

14+阅读 · 2021年10月1日

【ICLR2021】自监督蒸馏学习视觉表示

【ICLR2021】自监督蒸馏学习视觉表示

专知会员服务

34+阅读 · 2021年4月14日

CVPR2021 百度研究院 | 半监督迁移学习的自适应一致性正则化

专知会员服务

31+阅读 · 2021年3月20日

【CVPR2021】空间一致性表示学习

专知会员服务

63+阅读 · 2021年3月12日

【CVPR2021】自监督几何感知

【CVPR2021】自监督几何感知

专知会员服务

46+阅读 · 2021年3月6日

【CVPR2021】跨模态检索的概率嵌入

【CVPR2021】跨模态检索的概率嵌入

专知会员服务

20+阅读 · 2021年3月2日

【ACMMM2020】零样本语义分割的上下文感知特征生成

【ACMMM2020】零样本语义分割的上下文感知特征生成

专知会员服务

16+阅读 · 2020年8月21日

【CVPR2020-Oral】用于深度网络的任务感知超参数

【CVPR2020-Oral】用于深度网络的任务感知超参数

专知会员服务

28+阅读 · 2020年5月25日

热门VIP内容

开通专知VIP会员享更多权益服务

《城市滨海地区：理解复杂多变环境下的指挥控制框架》50页报告

《理解城市战及其在俄乌战争中的表现》报告

美空军“顶点2025”实验：推进AI在C2、动态目标锁定与联盟集成中的应用

《建设式兵棋模拟作为战术集群配置优化的关键组成部分》

相关资讯

【CVPR2022】带噪声标签的少样本学习

【CVPR2022】带噪声标签的少样本学习

专知

1+阅读 · 2022年4月15日

【CVPR2022】双曲图像分割

【CVPR2022】双曲图像分割

专知

2+阅读 · 2022年3月14日

【南洋理工-CVPR2022】视觉语言模型的条件提示学习

【南洋理工-CVPR2022】视觉语言模型的条件提示学习

专知

1+阅读 · 2022年3月13日

【CVPR2022】弱监督目标定位建模为领域适应

【CVPR2022】弱监督目标定位建模为领域适应

专知

1+阅读 · 2022年3月4日

【CVPR2022】三元组对比学习的视觉-语言预训练

【CVPR2022】三元组对比学习的视觉-语言预训练

专知

3+阅读 · 2022年3月3日

【WWW2022】TaxoEnrich:通过结构语义表示的自监督分类法补全

【WWW2022】TaxoEnrich:通过结构语义表示的自监督分类法补全

专知

0+阅读 · 2022年2月14日

【ICLR2021】自监督蒸馏学习视觉表示

【ICLR2021】自监督蒸馏学习视觉表示

专知

1+阅读 · 2021年4月14日

【CVPR2021】空间一致性表示学习

【CVPR2021】空间一致性表示学习

专知

0+阅读 · 2021年3月12日

【CVPR2021】基于反事实推断的视觉问答框架

【CVPR2021】基于反事实推断的视觉问答框架

专知

38+阅读 · 2021年3月4日

【CVPR2021】跨模态检索的概率嵌入

【CVPR2021】跨模态检索的概率嵌入

专知

17+阅读 · 2021年3月2日

相关基金

基于组合地图模型的图像检索算法研究

国家自然科学基金

0+阅读 · 2013年12月31日

物联网异构标识解析关键技术研究

国家自然科学基金

3+阅读 · 2013年12月31日

三维模型在异构空间中的语义迁移方法研究

国家自然科学基金

0+阅读 · 2013年12月31日

基于多任务概率视觉语义模型的图像场景理解

国家自然科学基金

2+阅读 · 2013年12月31日

跨语图像检索中融合视觉信息的多语翻译与集成方法研究

国家自然科学基金

2+阅读 · 2013年12月31日

基于统计流形的局部视觉特征层次化索引研究

国家自然科学基金

0+阅读 · 2011年12月31日

面向网络弱标记图像的视觉对象模型在线学习方法

国家自然科学基金

0+阅读 · 2011年12月31日

面向视觉残障者的图像的力/触觉表达与再现方法研究

国家自然科学基金

0+阅读 · 2010年12月31日

基于感知视觉单词描述的对象分割研究

国家自然科学基金

0+阅读 · 2009年12月31日

面向语义概念和上下文关系的图像检索关键技术研究

国家自然科学基金

1+阅读 · 2008年12月31日

相关论文

Self-supervised Video Representation Learning with Cascade Positive Retrieval

Arxiv

0+阅读 · 2022年4月20日

On the Coexistence of Stability and Incentive Compatibility in Fractional Matchings

Arxiv

0+阅读 · 2022年4月19日

Bootstrapped Representation Learning for Skeleton-Based Action Recognition

Arxiv

0+阅读 · 2022年4月19日

NAFSSR: Stereo Image Super-Resolution Using NAFNet

Arxiv

0+阅读 · 2022年4月19日

TSception: Capturing Temporal Dynamics and Spatial Asymmetry from EEG for Emotion Recognition

Arxiv

0+阅读 · 2022年4月18日

Hand Geometry Based Recognition with a MLP Classifier

Arxiv

0+阅读 · 2022年4月16日

K-Net: Towards Unified Image Segmentation

Arxiv

12+阅读 · 2021年11月1日

A Survey on Visual Transformer

Arxiv

19+阅读 · 2020年12月23日

SlowFast Networks for Video Recognition

SlowFast Networks for Video Recognition

Arxiv

19+阅读 · 2018年12月10日

Reinforced Self-Attention Network: a Hybrid of Hard and Soft Attention for Sequence Modeling

Arxiv

16+阅读 · 2018年1月31日

微信扫码咨询专知VIP会员