李飞飞点赞「ARM」：一种让模型快速适应数据变化的元学习方法

会员服务 ·

李飞飞点赞「ARM」：一种让模型快速适应数据变化的元学习方法 | 开源

2020 年 11 月 6 日 量子位

鱼羊编译整理
量子位报道 | 公众号 QbitAI

训练好的模型，遇到新的一组数据就懵了，这是机器学习中常见的问题。

举一个简单的例子，比如对一个手写笔迹识别模型来说，它的训练数据长这样：

那么当它遇到来自另一个用户的笔迹时，这究竟是“a”还是“2”呢？

说实话，即使是人类，如果没看到该用户单独写了一个写法不同的“2”（图中红框），也很可能辨认失误。

为了让模型能够快速适应这样的数据变化，现在，来自伯克利和斯坦福的研究人员，提出用元学习的方法来解决这个问题。

还获得了李飞飞的点赞转发。

不妨一起来看看，这一次元学习这种“学习如何学习的方法”又发挥了怎样的作用。

自适应风险最小化（ARM）

机器学习中的绝大多数工作都遵循经验风险最小化（ERM）框架。但在伯克利和斯坦福的这项研究中，研究人员引入了自适应风险最小化（ARM）框架，这是一种用于学习模型的问题公式。

ARM问题设置和方法的示意图如下。

在训练过程中，研究人员采用模拟分布偏移对模型进行元训练，这样，模型能直接学习如何最好地利用适应程序，并在测试时以完全相同的方式执行该程序。

如果在测试偏移中，观察到与训练时模拟的偏移相似的情况，模型就能有效地适应这些测试分布，以实现更好的性能。

在具体方法的设计上，研究人员主要基于上下文元学习和基于梯度的元学习，开发了3种解决ARM问题的方法，即ARM-CML，ARM-BN和ARM-LL。

如上图所示，在上下文方法中，x1，x2，…，xK被归纳为上下文c。模型可以利用上下文c来推断输入分布的额外信息。

归纳的方法有两种：

通过一个单独的上下文网络
在模型自身中采用批量归一化激活

在基于梯度的方法中，一个未标记的损失函数L被用于模型参数的梯度更新，以产生专门针对测试输入的参数，并能产生更准确的预测结果。

优于基线方法

所以，自适应风险最小化（ARM）方法效果究竟如何？

首先，来看ARM效果与各基线的对比。

在4个不同图像分类基准上的比较结果显示，无论是在最坏情况（WC）还是在平均性能上，ARM方法都明显具更好的性能表现和鲁棒性。

另外，研究人员还进行了定性分析。

以开头提到的“2”和“a”的情况举例，使用一个batch的50张无标注测试样本（包含来自同一用户的“2”和“a”的笔迹），ARM方法训练的模型就能够成功将两者区分开。

这就说明，训练自适应模型确实是处理分布偏移的有效方法。

这项研究已经开源，如果你感兴趣，文末链接自取，可以亲自尝试起来了~

传送门

论文地址：
https://arxiv.org/abs/2007.02931

开源地址：
https://github.com/henrikmarklund/arm

博客地址：
https://ai.stanford.edu/blog/adaptive-risk-minimization/

— 完 —

本文系网易新闻•网易号特色内容激励计划签约账号【量子位】原创内容，未经账号授权，禁止随意转载。

榜单征集！7大奖项锁定AI TOP企业

「2020中国人工智能年度评选」报名中！评选将从公司、人物、产品、社区四大维度共7个奖项寻找优秀的AI企业，欢迎大家扫码报名参与。

评选报名截止于11.20，并将于12月16日揭晓，也期待与百万从业者们，共同见证这些优秀企业的荣誉！

量子位 QbitAI · 头条号签约作者

վ'ᴗ' ի 追踪AI技术和产品新动态

一键三连「分享」、「点赞」和「在看」

科技前沿进展日日相见~

登录查看更多

相关内容

ARM

关注 2

安谋控股公司，又称ARM公司，跨国性半导体设计与软件公司，总部位于英国英格兰剑桥。主要的产品是ARM架构处理器的设计，将其以知识产权的形式向客户进行授权，同时也提供软件开发工具。维基百科

【AAAI2021】元学习器的冷启动序列推荐

专知会员服务

41+阅读 · 2020年12月19日

【NeurIPS2020 】数据扩充的图对比学习

专知会员服务

49+阅读 · 2020年11月9日

《小样本元学习》2020最新综述论文

专知会员服务

173+阅读 · 2020年7月31日

CVPR2020最新《小样本学习》综述教程，145页ppt带你学习最新FSL进展

专知会员服务

246+阅读 · 2020年6月20日

【牛津大学&DeepMind】自监督学习教程，141页ppt

专知会员服务

181+阅读 · 2020年5月29日

元学习(meta learning) 最新进展综述论文

专知会员服务

281+阅读 · 2020年5月8日

基于深度神经网络的少样本学习综述

专知会员服务

173+阅读 · 2020年4月22日

【Google-CMU】元伪标签的元学习，Meta Pseudo Labels

专知会员服务

32+阅读 · 2020年3月30日

【Mila-Google】使用元学习动态调整源代码模型，On-the-Fly Adaptation of Source Code Models using Meta-Learning

专知会员服务

21+阅读 · 2020年3月28日

【元学习 | 论文】NeuralPS19，多模态模型无关元学习，南加州大学

专知会员服务

62+阅读 · 2019年11月21日

置信学习：让样本中的"脏数据"原形毕露 ( 附开源实现 )

DataFunTalk

9+阅读 · 2020年7月3日

专知

40+阅读 · 2020年6月20日

【Google-CMU】元伪标签的元学习，Meta Pseudo Labels

专知

48+阅读 · 2020年3月30日

成熟的目标检测，也该自己学习数据增强策略达到SOTA了

机器之心

17+阅读 · 2019年6月28日

元学习(Meta-Learning) 综述及五篇顶会论文推荐

专知

194+阅读 · 2019年4月14日

干货实践 | 计算机视觉花卉识别模型（代码分享）

计算机视觉战队

10+阅读 · 2019年3月13日

刷新三项COCO纪录！姿态估计模型HRNet开源了，中科大微软出品 | CVPR

量子位

11+阅读 · 2019年2月28日

Meta-Learning 元学习：学会快速学习

GAN生成式对抗网络

20+阅读 · 2018年12月8日

论文 | 一种针对非线性数据的局部在线学习方法

数据猿

5+阅读 · 2018年6月18日

论文Express | 谷歌大脑：基于元学习的无监督学习更新规则

大数据文摘

5+阅读 · 2018年5月3日

Medical Instrument Detection in Ultrasound-Guided Interventions: A Review

Arxiv

1+阅读 · 2021年2月1日

Learning Safe Multi-Agent Control with Decentralized Neural Barrier Certificates

Arxiv

0+阅读 · 2021年1月31日

Estimating the Probability that a Vehicle Reaches a Near-Term Goal State Using Multiple Lane Changes

Arxiv

0+阅读 · 2021年1月31日

Aquanims: Area-Preserving Animated Transitions in Statistical Data Graphics based on a Hydraulic Metaphor

Arxiv

0+阅读 · 2021年1月29日

Covariance Prediction via Convex Optimization

Arxiv

0+阅读 · 2021年1月29日

A Survey of Learning Causality with Data: Problems and Methods

Arxiv

31+阅读 · 2020年5月5日

Multi-task Deep Reinforcement Learning with PopArt

Arxiv

4+阅读 · 2018年9月12日

Unsupervised Meta-Learning for Reinforcement Learning

Arxiv

8+阅读 · 2018年6月12日

Low-Shot Learning from Imaginary Data

Arxiv

15+阅读 · 2018年4月3日

Twitter Sentiment Analysis

Arxiv

5+阅读 · 2015年9月14日

VIP会员