Meta-Learning 元学习：学会快速学习

2018 年 12 月 19 日 极市平台

极市平台（ExtremeMart）是深圳极视角旗下的专业视觉算法开发与分发平台，为开发者提供行业场景集，每月上百真实项目需求，算法分发，技术共享等，旨在联合开发者建立起良好的计算机视觉生态。已与上百名开发者建立了合作并转化了上百种视觉算法。

PS.本周四（12月20日）晚，主持开发ImagePy开源项目的闫霄龙闫总将为我们分享：基于ImagePy的图像处理算法解析，公众号回复“37”即可获取直播详情。

来源：专知

【导读】元学习，也称为“学习学习”，旨在通过一些训练少量样本可以学习新技能或快速适应新环境的模型。有三种常见的方法：1）学习有效的距离度量（基于度量）; 2）使用（循环）网络与外部或内部存储器（基于模型）; 3）明确优化模型参数以进行快速学习（基于优化）。

良好的机器学习模型通常需要使用大量样本进行训练。相比之下，人类能够更快，更有效地学习新的概念和技能。只看过几次猫和鸟的孩子可以很快分辨它们；会骑自行车的人很快就能上手摩托车。是否有可能通过一些训练少量样本快速设计出具有类似属性的机器学习模型？这就是元学习旨在解决的问题。

一个良好的元学习模型能够很好地推广到在训练期间从未遇到过的新任务和新环境。最终，改编的模型可以完成新任务。这就是元学习也被称为学习如何学习学习的原因。

任务可以是任何明确定义的机器学习问题系列：监督学习，强化学习等。例如，这里有几个具体的元学习任务：

本文将分为两部分，第一部分主要介绍元学习的定义和基于度量的元学习，第二部分介绍基于模型和基于优化的元学习，尽情期待！

元学习问题的定义

一个简单的视角

一个好的元学习模型应该在各种学习任务上进行训练，并针对任务进行优化。每个任务都与数据集相关联，数据集包含特征向量和真实标签。最佳模型参数是：

它看起来与正常学习任务非常相似，但是一个数据集被视为一个数据样本。

Few-shot classification是监督学习领域中元学习的实例。数据集通常被分成两部分，一个用于学习的支持集\和一个用于训练或测试的预测集，。我们经常考虑K-shot N-class分类任务：支持集包含N个类中每个类别的K个标记示例。

数据集包含特征向量和标签对，并且每个标签属于已知标签集L假设我们的分类器带参数出属于该数据点的数据点的概率。给定特征向量的类y

最佳参数应最大化真实标签的概率

在Few-shot classification中，目标是给定“快速学习”的小数据集，减少预测误差。我们希望使用标签子集“伪造”数据集，以避免将所有标签暴露给模型并相应地修改优化过程以鼓励快速学习：

对标签子集进行采样。
对支持集和训练batch进行采样。它们都只包含带有属于采样标签集的标签的数据点。
支持集是模型输入的一部分。
最终的优化使用小批量计算损失并通过反向传播更新模型参数，就像在监督学习中一样。

每对采样数据集可以视为一个数据点。完成对模型训练之后，它可以推广到其他数据集。

该想法在某种程度上类似于仅有一组特定数据样本可用时，在图像分类（ImageNet）或语言建模（大文本语料库）中使用预训练模型。元学习将这一想法更进一步，但是它不是根据一个下行任务进行微调，而是靠优化模型。

Learner和Meta-Learner

元学习的另一种流行观点将模型更新分解为两个阶段：

分类器是训练用于操作给定任务的“学习者”模型; 与此同时，优化器gφ学习如何通过支持集更新学习者模型的参数
然后在最后的优化步骤中，我们需要更新θ和φ以最大化

常见方法

元学习有三种常用方法：基于度量，基于模型和基于优化。 Oriol Vinyals在他NIPS 2018的演讲中有一个很好的总结：

是测量间两者相似性的核函数。

接下来我们将回顾每种方法中的经典模型。

基于度量的元学习

基于度量的元学习中的核心思想类似于最近邻算法（即，k-NN分类器和k均值聚类）和核密度估计。一组已知标签上的预测概率是支持集样本的标签的加权和。权重由核函数生成，测量两个数据样本之间的相似性。

学习一个好的内核对于基于度量的元学习模型的成功至关重要。度量学习与此意图完全一致，因为它旨在学习对象的度量或距离函数。良好指标的概念取决于问题。它应该代表任务空间中输入之间的关系，并促进解决问题。

下面介绍的所有模型都明确地学习了输入数据的嵌入向量，并使用它们来设计适当的核函数。

卷积Siamese神经网络

Siamese神经网络由两个网络组成，它们的输出在顶部联合训练，具有学习输入数据样本对之间关系的功能。两个网络是相同的，共享相同的权重和网络参数。换句话说，两者都指的是学习有效嵌入以揭示数据点对之间的关系的相同嵌入网络。

Koch，Zemel和Salakhutdinov（2015）提出了一种使用暹罗神经网络进行一次性图像分类的方法。首先，训练暹罗网络进行验证任务，以判断两个输入图像是否在同一类中。它输出属于同一类的两个图像的概率。然后，在测试时间期间，暹罗网络处理测试图像与支持集中的每个图像之间的所有图像对。最终预测是具有最高概率的支持图像的类。