【ACM MM2020-计算所】基于多源语义嵌入的场景识别的广义零样本学习 - 专知VIP

会员服务 ·

2

零样本学习 · 场景识别 ·

2020 年 9 月 5 日

【ACM MM2020-计算所】基于多源语义嵌入的场景识别的广义零样本学习

专知会员服务

专知，提供专业可信的知识分发服务，让认知协作更快更好！

从语义描述中识别视觉类别是一种很有前途的方法，它可以扩展视觉分类器的能力，使其超越训练数据中所表示的概念(即看到的类别)。这个问题是由(广义的)零样本学习方法(GZSL)解决的，它利用语义描述将它们连接到所看到的类别(例如，标签嵌入，属性)。传统的GZSL主要是为了目标识别而设计的。在本文中，我们关注于零样本场景识别，这是一个更具挑战性的设置，有数百个类别，它们的差异可能是微妙的，通常在特定的物体或区域。传统的GZSL表示不够丰富，无法捕获这些局部差别。针对这些限制，我们提出了一个具有两个新组件的特征生成框架:1)多源语义信息(即属性、单词嵌入和描述)，2)可以增强场景识别的区域描述。为了生成综合的视觉特征，我们提出了两步生成方法，其中局部描述采样和使用作为条件来生成视觉特征。生成的特征被聚合并与真实的特征一起用来训练一个联合分类器。为了对该方法进行评价，我们引入了一种新的具有多语义标注的零样本场景识别数据集。在该数据集和SUN属性数据集上的实验结果表明了该方法的有效性。

https://vipl.ict.ac.cn/homepage/jsq/publication/2020-Song-ACMMM.html

成为VIP会员查看完整内容

22

相关内容

零样本学习

零样本学习

零样本学习是AI识别方法之一。简单来说就是识别从未见过的数据类别，即训练的分类器不仅仅能够识别出训练集中已有的数据类别，还可以对于来自未见过的类别的数据进行区分。这是一个很有用的功能，使得计算机能够具有知识迁移的能力，并无需任何训练数据，很符合现实生活中海量类别的存在形式。

【EMNLP2020-清华】基于常识知识图谱的多跳推理语言生成

【EMNLP2020-清华】基于常识知识图谱的多跳推理语言生成

专知会员服务

74+阅读 · 2020年9月25日

【ACM MM2020】跨模态分布匹配的半监督多模态情感识别

【ACM MM2020】跨模态分布匹配的半监督多模态情感识别

专知会员服务

43+阅读 · 2020年9月8日

【ACM MM2020】对偶注意力GAN语义图像合成

【ACM MM2020】对偶注意力GAN语义图像合成

专知会员服务

36+阅读 · 2020年9月2日

【ACMMM2020】零样本语义分割的上下文感知特征生成

【ACMMM2020】零样本语义分割的上下文感知特征生成

专知会员服务

16+阅读 · 2020年8月21日

【ACM Multimedia 2020】共同注意力网络的自监督视听表示学习

【ACM Multimedia 2020】共同注意力网络的自监督视听表示学习

专知会员服务

28+阅读 · 2020年8月14日

【ACMMM2020-北航】KBGN:用于视觉对话中自适应视觉-文本推理的知识桥图网络

【ACMMM2020-北航】KBGN:用于视觉对话中自适应视觉-文本推理的知识桥图网络

专知会员服务

22+阅读 · 2020年8月12日

【ACMMM2020-北航】协作双路径度量的小样本学习

【ACMMM2020-北航】协作双路径度量的小样本学习

专知会员服务

29+阅读 · 2020年8月11日

【CVPR2020】通过自适应GANs生成不同的图像，Diverse Image Generation via Self-Conditioned GANs

【CVPR2020】通过自适应GANs生成不同的图像，Diverse Image Generation via Self-Conditioned GANs

专知会员服务

34+阅读 · 2020年6月19日

【CVPR2020】视频符号语言识别中跨领域知识的传递, Transferring Cross-domain Knowledge for Video Sign Language Recognition

【CVPR2020】视频符号语言识别中跨领域知识的传递, Transferring Cross-domain Knowledge for Video Sign Language Recognition

专知会员服务

9+阅读 · 2020年4月17日

【CVPR 2020-人大】基于层次图推理的细粒度文本视频跨模态检索

【CVPR 2020-人大】基于层次图推理的细粒度文本视频跨模态检索

专知会员服务

67+阅读 · 2020年4月5日

7篇必读ACM MM 2019论文：图神经网络+多媒体

7篇必读ACM MM 2019论文：图神经网络+多媒体

新智元

43+阅读 · 2019年11月9日

近期必读的7篇 ACM MM 2019【图神经网络（GNN）+多媒体（MM）】相关论文

近期必读的7篇 ACM MM 2019【图神经网络（GNN）+多媒体（MM）】相关论文

专知

42+阅读 · 2019年11月5日

论文浅尝 | 利用知识图谱嵌入和图卷积网络进行长尾关系抽取

论文浅尝 | 利用知识图谱嵌入和图卷积网络进行长尾关系抽取

开放知识图谱

30+阅读 · 2019年7月5日

论文浅尝 | 最新10篇《知识图谱》论文推荐(ICML, CVPR, ACL, KDD, IJCAI 2019)

论文浅尝 | 最新10篇《知识图谱》论文推荐(ICML, CVPR, ACL, KDD, IJCAI 2019)

开放知识图谱

61+阅读 · 2019年6月11日

最新10篇《知识图谱》论文推荐(ICML, CVPR, ACL, KDD, IJCAI 2019)

最新10篇《知识图谱》论文推荐(ICML, CVPR, ACL, KDD, IJCAI 2019)

专知

81+阅读 · 2019年6月9日

论文浅尝 | 基于属性嵌入的知识图谱间实体对齐方法

论文浅尝 | 基于属性嵌入的知识图谱间实体对齐方法

开放知识图谱

30+阅读 · 2019年3月26日

ACM MM | 中山大学等提出HSE：基于层次语义嵌入模型的精细化物体分类

ACM MM | 中山大学等提出HSE：基于层次语义嵌入模型的精细化物体分类

极市平台

4+阅读 · 2018年9月5日

赛尔原创 | IJCAI 2018基于图结构的实体和关系联合抽取模型简介

赛尔原创 | IJCAI 2018基于图结构的实体和关系联合抽取模型简介

哈工大SCIR

22+阅读 · 2018年6月12日

论文浅尝 | 用异源监督进行关系抽取：一种表示学习方法

论文浅尝 | 用异源监督进行关系抽取：一种表示学习方法

开放知识图谱

8+阅读 · 2018年4月8日

CVPR2018 | 让AI识别语义空间关系：斯坦福大学李飞飞组提出「参考关系模型」

CVPR2018 | 让AI识别语义空间关系：斯坦福大学李飞飞组提出「参考关系模型」

机器之心

3+阅读 · 2018年4月8日

Multi-Modal Graph Neural Network for Joint Reasoning on Vision and Scene Text

Multi-Modal Graph Neural Network for Joint Reasoning on Vision and Scene Text

Arxiv

10+阅读 · 2020年3月31日

A Survey on Contextual Embeddings

Arxiv

29+阅读 · 2020年3月16日

Knowledge Graphs

Arxiv

102+阅读 · 2020年3月4日

Language Modelling Makes Sense: Propagating Representations through WordNet for Full-Coverage Word Sense Disambiguation

Arxiv

3+阅读 · 2019年6月24日

MMKG: Multi-Modal Knowledge Graphs

Arxiv

30+阅读 · 2019年3月13日

Collaborative Similarity Embedding for Recommender Systems

Arxiv

8+阅读 · 2019年2月19日

Convolutional Collaborative Filter Network for Video Based Recommendation Systems

Arxiv

5+阅读 · 2018年10月18日

Mobile recommender systems: Identifying the major concepts

Arxiv

7+阅读 · 2018年5月6日

Visually Explainable Recommendation

Arxiv

7+阅读 · 2018年1月31日

Predicting Visual Features from Text for Image and Video Caption Retrieval

Arxiv

5+阅读 · 2018年1月29日

VIP会员

相关主题

零样本学习

相关VIP内容

【EMNLP2020-清华】基于常识知识图谱的多跳推理语言生成

【EMNLP2020-清华】基于常识知识图谱的多跳推理语言生成

专知会员服务

74+阅读 · 2020年9月25日

【ACM MM2020】跨模态分布匹配的半监督多模态情感识别

【ACM MM2020】跨模态分布匹配的半监督多模态情感识别

专知会员服务

43+阅读 · 2020年9月8日

【ACM MM2020】对偶注意力GAN语义图像合成

【ACM MM2020】对偶注意力GAN语义图像合成

专知会员服务

36+阅读 · 2020年9月2日

【ACMMM2020】零样本语义分割的上下文感知特征生成

【ACMMM2020】零样本语义分割的上下文感知特征生成

专知会员服务

16+阅读 · 2020年8月21日

【ACM Multimedia 2020】共同注意力网络的自监督视听表示学习

【ACM Multimedia 2020】共同注意力网络的自监督视听表示学习

专知会员服务

28+阅读 · 2020年8月14日

【ACMMM2020-北航】KBGN:用于视觉对话中自适应视觉-文本推理的知识桥图网络

【ACMMM2020-北航】KBGN:用于视觉对话中自适应视觉-文本推理的知识桥图网络

专知会员服务

22+阅读 · 2020年8月12日

【ACMMM2020-北航】协作双路径度量的小样本学习

【ACMMM2020-北航】协作双路径度量的小样本学习

专知会员服务

29+阅读 · 2020年8月11日

【CVPR2020】通过自适应GANs生成不同的图像，Diverse Image Generation via Self-Conditioned GANs

【CVPR2020】通过自适应GANs生成不同的图像，Diverse Image Generation via Self-Conditioned GANs

专知会员服务

34+阅读 · 2020年6月19日

【CVPR2020】视频符号语言识别中跨领域知识的传递, Transferring Cross-domain Knowledge for Video Sign Language Recognition

【CVPR2020】视频符号语言识别中跨领域知识的传递, Transferring Cross-domain Knowledge for Video Sign Language Recognition

专知会员服务

9+阅读 · 2020年4月17日

【CVPR 2020-人大】基于层次图推理的细粒度文本视频跨模态检索

【CVPR 2020-人大】基于层次图推理的细粒度文本视频跨模态检索

专知会员服务

67+阅读 · 2020年4月5日

热门VIP内容

开通专知VIP会员享更多权益服务

【牛津博士论文】零样本强化学习综述

《美军条令：陆军指挥官与规划人员地理空间指南》60页

战术边缘指挥控制：防务面临的核心挑战

迈向开放世界检测：综述

相关资讯

7篇必读ACM MM 2019论文：图神经网络+多媒体

7篇必读ACM MM 2019论文：图神经网络+多媒体

新智元

43+阅读 · 2019年11月9日

近期必读的7篇 ACM MM 2019【图神经网络（GNN）+多媒体（MM）】相关论文

近期必读的7篇 ACM MM 2019【图神经网络（GNN）+多媒体（MM）】相关论文

专知

42+阅读 · 2019年11月5日

论文浅尝 | 利用知识图谱嵌入和图卷积网络进行长尾关系抽取

论文浅尝 | 利用知识图谱嵌入和图卷积网络进行长尾关系抽取

开放知识图谱

30+阅读 · 2019年7月5日

论文浅尝 | 最新10篇《知识图谱》论文推荐(ICML, CVPR, ACL, KDD, IJCAI 2019)

论文浅尝 | 最新10篇《知识图谱》论文推荐(ICML, CVPR, ACL, KDD, IJCAI 2019)

开放知识图谱

61+阅读 · 2019年6月11日

最新10篇《知识图谱》论文推荐(ICML, CVPR, ACL, KDD, IJCAI 2019)

最新10篇《知识图谱》论文推荐(ICML, CVPR, ACL, KDD, IJCAI 2019)

专知

81+阅读 · 2019年6月9日

论文浅尝 | 基于属性嵌入的知识图谱间实体对齐方法

论文浅尝 | 基于属性嵌入的知识图谱间实体对齐方法

开放知识图谱

30+阅读 · 2019年3月26日

ACM MM | 中山大学等提出HSE：基于层次语义嵌入模型的精细化物体分类

ACM MM | 中山大学等提出HSE：基于层次语义嵌入模型的精细化物体分类

极市平台

4+阅读 · 2018年9月5日

赛尔原创 | IJCAI 2018基于图结构的实体和关系联合抽取模型简介

赛尔原创 | IJCAI 2018基于图结构的实体和关系联合抽取模型简介

哈工大SCIR

22+阅读 · 2018年6月12日

论文浅尝 | 用异源监督进行关系抽取：一种表示学习方法

论文浅尝 | 用异源监督进行关系抽取：一种表示学习方法

开放知识图谱

8+阅读 · 2018年4月8日

CVPR2018 | 让AI识别语义空间关系：斯坦福大学李飞飞组提出「参考关系模型」

CVPR2018 | 让AI识别语义空间关系：斯坦福大学李飞飞组提出「参考关系模型」

机器之心

3+阅读 · 2018年4月8日

相关论文

Multi-Modal Graph Neural Network for Joint Reasoning on Vision and Scene Text

Multi-Modal Graph Neural Network for Joint Reasoning on Vision and Scene Text

Arxiv

10+阅读 · 2020年3月31日

A Survey on Contextual Embeddings

Arxiv

29+阅读 · 2020年3月16日

Knowledge Graphs

Arxiv

102+阅读 · 2020年3月4日

Language Modelling Makes Sense: Propagating Representations through WordNet for Full-Coverage Word Sense Disambiguation

Arxiv

3+阅读 · 2019年6月24日

MMKG: Multi-Modal Knowledge Graphs

Arxiv

30+阅读 · 2019年3月13日

Collaborative Similarity Embedding for Recommender Systems

Arxiv

8+阅读 · 2019年2月19日

Convolutional Collaborative Filter Network for Video Based Recommendation Systems

Arxiv

5+阅读 · 2018年10月18日

Mobile recommender systems: Identifying the major concepts

Arxiv

7+阅读 · 2018年5月6日

Visually Explainable Recommendation

Arxiv

7+阅读 · 2018年1月31日

Predicting Visual Features from Text for Image and Video Caption Retrieval

Arxiv

5+阅读 · 2018年1月29日

微信扫码咨询专知VIP会员