AI角 | AI challenger零样本学习算法大赛报名开启，数据集开放

会员服务 ·

AI角 | AI challenger零样本学习算法大赛报名开启，数据集开放

2018 年 3 月 23 日 大数据文摘

大数据文摘作品

去年，AI Challenger（以下简称AIC）全球挑战赛吸引了来自65个国家近万团队参赛。

今年的AIC预热赛零样本学习（zero-shot learning）竞赛即日起开始。

零样本学习竞赛同样发布大规模图像属性数据集，包含78017张图片、230个类别、359种属性。

与目前主流的用于zero-shot learning的数据集相比，图片量更大、属性更丰富、类别与ImageNet重合度更低。

经典零样本学习方法介绍

创新工场AI工程院运营副总裁吴卓浩表示，因为在很多情况下人们难以获得足够的有标注的数据来训练识别或预测模型。

受人类学习能力的启发，零样本学习（zero-shot learning）希望借助辅助知识（如属性、词向量、文本描述等），在没有任何训练样本的情况下学会从未见过的新概念。

这具有重要的研究意义和广泛的应用场景，被认为是实现大规模物体识别的一个重要方式。

最经典的零样本学习方法是Lampert 提出的直接属性预测模型(DAP)。

如下图所示，模型中属性训练是在传统特征提取的基础上的进行的，首先使用颜色直方图、局部自相似直方图、SIFT和PHOG等6种方法来提取样本图像的底层特征，这几种特征包含了图像的颜色、形状和纹理等方面，所以通过这种特征提取方法得到的特征可以良好的表达图像中的信息。这几种图像特征不仅适用与线性分类器，而且在非线性分类器中也能达到良好的表现。

在DAP方法中，通过上述的特征提取方法得到样本的图像特征后，将特征用于属性分类器的训练，然后将训练得出的模型用于属性的预测，最后采用贝叶斯方法推算测试样本的类别。近年来深度特征的使用大幅提高了零样本识别的准确率。

最具挑战的AI识别方法

零样本学习是当前最具挑战的AI识别方法之一。简单来说就是识别从未见过的数据类别，即训练的分类器不仅仅能够识别出训练集中已有的数据类别，还可以对于来自未见过的类别的数据进行区分。

这是一个很有用的功能，使得计算机能够具有知识迁移的能力，并无需任何训练数据，很符合现实生活中海量类别的存在形式。

传统的“零样本学习”方法首先是让智能体（Agent）对类别进行语义理解。将类别标签利用辅助知识（如属性）嵌入到语义空间中，再利用训练集中的数据学习这种从图像到语义的映射关系。

此后，即使遇到新的类别，只要提供了该类别的语义知识，模型即可识别该类别，这就是零样本学习。

例如识别一张斑马的图片，但在训练时没有训练过斑马的图片。那么我们可以通过比较这张斑马图片中包含的属性和各个类别的属性定义，进而在属性空间中找到与该测试图片相近标签，即为该图片的标签。

而零样本学习的意义也显而易见：在传统图像识别任务中，训练阶段和测试阶段的类别是相同的，但每次为了识别新类别的样本需要在训练集中加入这种类别的数据。

一些类别的样本收集代价大，即使收集到足够的训练样本，也需要对整个模型进行重新训练。这都会加大识别系统的成本，零样本学习方法便能很好的解决这个问题。

将来未知语言也能翻译

早期的零样本学习研究可以追溯到2008 年，Larochelle 等人针对字符分类问题提出了零样本学习（zero shot learning）方法，并且识别准确率达到了60%。

2009年Lampert 等人提出了Animals with Attributes数据集和经典的基于属性学习的算法，才真正打开零样本学习的关注度。

北大硕士赵波表示，在一些场景下，如细粒度物体识别、任意语言之间的翻译等，难以获得足够的有标注的数据来训练识别或预测模型。

因此，零样本学习具有重要的研究意义和广泛的应用场景。受人类学习能力的启发，零样本学习希望借助辅助知识（如属性、词向量、文本描述等）学习从未见过的新概念。目前零样本学习被认为是实现大规模物体识别的一个重要方式。

应用场景

未知物体识别

例如，模型在“马”、“牛”等类别上训练过，因此模型能够准确地识别“马”、“牛”的图片。当模型遇到“象”这个新类别，由于从未见过，模型无法作出判断。

传统解决方案是收集大量“象”的图片，与原数据集一起重新训练。这种解决方案的代价高、速度慢。然而，人类能够从描述性知识中快速学习一个新概念。

例如，一个儿童即使没有见过“象”，当提供他文本描述“象是一种的大型食草类动物，有长鼻和长牙”。儿童能够根据描述快速学会“象”这一新类别，并能在第一次见到“象”时识别出来。

零样本学习与之类似，在没有任何训练样本的情况下，借助辅助知识（如属性、词向量、文本描述等）学习一些从未见过的新概念（类别）。

未知语言翻译

比如说要进行三种语言之间的翻译，按照传统的方法需要分别训练六个网络，在日语和韩语之间没有那么多样本的情况下，训练英语→特征空间→日语，韩语→特征空间→英语这两个网络，那么就可以自动学会韩语→特征空间→日语这个翻译过程。

未知类别图像合成

近年来，对抗网络GAN被用于图像合成，取得了以假乱真的效果。但传统图像合成仅能合成见过的类别的图像。零样本图像合成希望模型能够合成从未见过的类别的图像。目前已有一些算法通过条件GAN网络实现了零样本图像合成。

图像哈希

传统图像哈希算法利用一些训练样本来学习针对某些类别的哈希算法。但这些学习到的哈希算法无法用于新类别。零样本图像哈希，希望在已知类别上学到哈希算法能够运用到新的未知类别上。一些基于属性的零样本哈希算法已经被提出。

竞赛奖励

冠军：30,000人民币，颁发获奖证书

亚军：10,000人民币，颁发获奖证书

季军：3,000人民币，颁发获奖证书

双周冠军：3,000人民币

双周亚军：2,000人民币

双周季军：1,000人民币

以上提及金额为税前金额，详细规则请参考《竞赛选手报名协议》

注：数据集下载地址：https://challenger.ai/datasets

报名方式

(1) 报名时间：即日起至4月23日。竞赛报名以及组队队员变更截止时间为4月23日23:59:59。

(2) 参赛队伍可1-3人组队参赛，确保报名信息准确有效。每名选手在大赛平台只能拥有一个账号，否则会被取消参赛资格及激励。

(3) 实名认证：为保证大赛公平性，所有选手必须完成个人信息实名认证。认证过程在个人中心的实名认证区域完成。

(4) 报名方式：登入AI Challenger官网，完成个人信息注册，即可报名参赛。

(5) 参赛队员必须遵守并签署《竞赛选手报名协议》。

【今日机器学习概念】

Have a Great Definition

登录查看更多

相关内容

零样本学习

关注 29

零样本学习是AI识别方法之一。简单来说就是识别从未见过的数据类别，即训练的分类器不仅仅能够识别出训练集中已有的数据类别，还可以对于来自未见过的类别的数据进行区分。这是一个很有用的功能，使得计算机能够具有知识迁移的能力，并无需任何训练数据，很符合现实生活中海量类别的存在形式。

【ACL2020-Google】BLEURT:一种基于迁移学习的自然语言生成度量

专知会员服务

20+阅读 · 2020年5月12日

基于深度神经网络的少样本学习综述

专知会员服务

173+阅读 · 2020年4月22日

【伯克利】元学习的元基线，A New Meta-Baseline for Few-Shot Learning

专知会员服务

67+阅读 · 2020年3月28日

注意力图神经网络的多标签文本分类

专知会员服务

112+阅读 · 2020年3月28日

Video Description视频描述综述论文-方法、数据集和评估指标，UWA

专知会员服务

39+阅读 · 2020年3月5日

【自动化学报】零样本学习研究进展，中国石油大学

专知会员服务

88+阅读 · 2020年1月27日

姿势服装随心换-CVPR2019

专知会员服务

36+阅读 · 2020年1月26日

【课程推荐】深度学习中的新兴挑战（Emerging Challenges in Deep Learning）

专知会员服务

17+阅读 · 2019年11月10日

【ICCV 2019 Workshop】Adaptive Confidence Smoothing for Generalized Zero-Shot Learning，巴伊兰大学 Yuval Atzmon

专知会员服务

13+阅读 · 2019年10月31日

新加坡南洋理工最新37页《零样本学习综述》论文

专知会员服务

114+阅读 · 2019年10月20日

竞赛 | 旷视发布通用物体检测数据集 Objects365，开启 CVPR 物体检测挑战赛

AI科技评论

5+阅读 · 2019年4月17日

新加坡南洋理工最新37页《零样本学习综述》论文

专知

104+阅读 · 2019年2月27日

论文浅尝 | 当知识图谱遇上零样本学习——零样本学习综述

开放知识图谱

21+阅读 · 2018年9月26日

AI Challenger 2017 奇遇记

AINLP

5+阅读 · 2018年6月10日

报名 | 码隆科技与谷歌研究院合办Kaggle大赛，挑战商品图像分类极限！

机器之心

10+阅读 · 2018年4月19日

AI challenger又发福利：零样本学习算法大赛 and 零样本数据集

创新工场

5+阅读 · 2018年3月28日

国内首次零样本学习算法大赛开启报名，零样本数据集免费下载

AI研习社

7+阅读 · 2018年3月22日

AI challenger发起零样本学习算法大赛，推出零样本数据集

量子位

4+阅读 · 2018年3月21日

资讯 | 总奖金 200 万的 AI Challenger 开赛，可申请免费 GPU 资源

AI100

4+阅读 · 2017年9月4日

独家 | 一文读懂迁移学习（附学习工具包）

数据派THU

13+阅读 · 2017年7月13日

Talking-Heads Attention

Arxiv

15+阅读 · 2020年3月5日

HyperKG: Hyperbolic Knowledge Graph Embeddings for Knowledge Base Completion

Arxiv

6+阅读 · 2019年8月17日

Small Data Challenges in Big Data Era: A Survey of Recent Progress on Unsupervised and Semi-Supervised Methods

Arxiv

88+阅读 · 2019年3月27日

Transfer Adaptation Learning: A Decade Survey

Arxiv

37+阅读 · 2019年3月12日

HotpotQA: A Dataset for Diverse, Explainable Multi-hop Question Answering

Arxiv

5+阅读 · 2018年9月25日

Visual-textual Attention Driven Fine-grained Representation Learning

Arxiv

3+阅读 · 2018年4月26日

Transferring Common-Sense Knowledge for Object Detection

Arxiv

12+阅读 · 2018年4月3日

Zero-shot Recognition via Semantic Embeddings and Knowledge Graphs

Arxiv

6+阅读 · 2018年3月21日

Visual and Semantic Knowledge Transfer for Large Scale Semi-supervised Object Detection

Arxiv

9+阅读 · 2018年3月13日

Leveraging Unlabeled Data for Crowd Counting by Learning to Rank

Arxiv

6+阅读 · 2018年3月8日

VIP会员