清华张长水等人30页少样本学习综述论文,涵盖400+参考文献

2020 年 9 月 20 日 机器之心

选自arXiv

作者:张长水等

机器之心编

编辑:魔王

这篇综述文章回顾了少样本学习(FSL)的演进历史和当前进展,对 FSL 方法进行了层次分类,并总结了近期多个 FSL 扩展性主题及其最新进展,介绍了 FSL 在计算机视觉、自然语言处理等领域中的应用。


少样本学习(FSL)是机器学习领域中重要且有难度的课题。基于少量样本进行学习和泛化的能力是区分人工智能和人类智能的重要分界线,因为人类往往能够基于一个或少量样本建立对新事物的认知,而机器学习算法通常需要数百或数千个监督样本才能实现泛化。


少样本学习的研究可以追溯到 21 世纪初,近年来随着深度学习技术的发展它也受到广泛的关注,但是目前关于 FSL 的综述文章较少。 清华大学教授、IEEE Fellow 张长水等人广泛阅读和总结了自 21 世纪初到 2019 年的 300 余篇论文,写了一篇关于 FSL 的综述文章


 论文链接:https://arxiv.org/pdf/2009.02653.pdf

这篇综述文章回顾了 FSL 的演进历史和当前进展,将 FSL 方法分为基于生成模型和基于判别模型两大类,并重点介绍了基于元学习的 FSL 方法。

此外,本文还总结了近期出现的多个 FSL 扩展性主题及其最新进展,并介绍了 FSL 在计算机视觉、自然语言处理、音频、强化学习和机器人学、数据分析等热点研究领域中的应用。

最后,本文讨论了 FSL 的未来趋势,希望能为后续研究提供指引。

该综述文章的新颖之处和主要贡献包括:

  1. 对自 21 世纪初至 2019 年的 300 余篇 FSL 主题论文进行了更加全面及时的综述,涵盖从早期 Congealing 模型 [29] 到近期元学习方法的所有 FSL 方法。详尽的阐述有利于掌握 FSL 的整体发展脉络,构建 FSL 的完整知识结构体系。

  2. 该论文提供了易于理解的层次分类,根据建模原则将现有的 FSL 方法分为基于生成模型的方法和基于判别模型的方法。在每一个类别中,又基于泛化性进行细分。

  3. 该论文重点介绍目前主流的 FSL 方法,即基于元学习的 FSL 方法,并将其分为五个大类:Learn-to-Measure、Learn-to-Finetune、Learn-to-Parameterize、Learn-to-Adjust 和 Learn-to-Remember。此外,该综述文章还揭示了多种元学习 FSL 方法之间的底层发展关系。

  4. 该论文在原版 FSL 之外,还总结了近期出现的多个扩展性研究主题及其进展。这些主题包括:半监督 FSL、无监督 FSL、跨域 FSL、通用 FSL 和多模态 FSL,它们很有挑战性,且为解决方案赋予了实际意义,可用于许多现实机器学习问题。而之前的综述文章很少涉及这类扩展性主题。

  5. 该论文广泛地总结了现有 FSL 方法在多个领域的应用,如计算机视觉、自然语言处理、音频、强化学习和机器人学、数据分析等,还概括了当前 FSL 方法在基准数据集上的性能,以为后续研究提供指引。


文章结构

  • 第二章:概述 FSL 发展历史、符号和定义,以及对现有 FSL 方法进行分类;

  • 第三章:介绍第一类 FSL 方法——基于生成模型的方法;

  • 第四章:介绍第二类 FSL 方法——基于判别模型的方法;

  • 第五章:总结 FSL 的多个扩展性主题;

  • 第六章:介绍 FSL 在多个领域中的应用,及基准性能;

  • 第七章:探讨 FSL 的未来方向。


下图 1 展示了该综述文章的主要内容,包括 FSL 的发展过程、方法分类、扩展性主题和应用。


这篇综述文章篇幅较长, 共有 30 页内容,参考文献多达 414 篇 。我们仅选取部分概括性的图表进行展示,详情参见原论文。

基于生成模型的 FSL 方法

下表 1 总结了第一类 FSL 方法——基于生成模型的 FSL 方法:


基于判别模型的 FSL 方法

本文将基于判别模型的 FSL 方法分为四类: 增强、度量学习、元学习和其他方法 ,并重点介绍了元学习方法。

下图 2 概括了基于增强的 FSL 方法的通用框架:


下表 2 则总结了监督式和无监督式增强方法:


下图 8 展示了基于度量学习的 FSL 方法的通用框架:


下表 3 则总结了基于度量学习的 FSL 方法的主要特征:


元学习

下图 12 展示了基于元学习的 FSL 方法的通用框架:


此外,这部分还介绍了基于元学习的 FSL 方法的五个子类别:Learn-to-Measure (L2M)、Learn-to-Finetune (L2F)、Learn-to-Parameterize (L2P)、Learn-to-Adjust (L2A) 和 Learn-to-Remember (L2R)。

下图 13 展示了不同 L2M 方法之间的发展关系:


许多近期提出的 Learn-to-Finetune 方法属于 MAML 变体,下图 16 展示了 MAML 与其变体之间的关系:


下表 4 总结了 Learnto-Parameterize 方法:


下表 5 总结了 Learn-to-Adjust 方法:


下图 22 展示了 Learn-to-Remember 方法的通用框架:


FSL 方法的应用领域

下表 9 总结了 FSL 方法在计算机视觉、自然语言处理、音频、强化学习和机器人学、数据分析等领域的应用:



如何根据任务需求搭配恰当类型的数据库?

在AWS推出的白皮书《进入专用数据库时代》中,介绍了8种数据库类型:关系、键值、文档、内存中、关系图、时间序列、分类账、领域宽列,并逐一分析了每种类型的优势、挑战与主要使用案例。

点击阅读原文识别二维码,申请免费获取白皮书。



© THE END 

转载请联系本公众号获得授权

投稿或寻求报道:content@jiqizhixin.com

登录查看更多
1

相关内容

张长水,男,1965年生,河北人。智能技术与系统国家重点实验室学术委员会委员,清华大学自动化系教授、博士生导师, 智能技术与系统国家重点实验室副主任,自动化系主任。主要从事图像处理、信号处理、模式识别与人工智能、进化计算等研究领域以及和工业界的合作。
最新《深度学习视频异常检测》2020综述论文,21页pdf
专知会员服务
84+阅读 · 2020年9月30日
专知会员服务
64+阅读 · 2020年9月10日
西北大学等最新《深度主动学习》全面综述论文,30页pdf
专知会员服务
223+阅读 · 2020年5月6日
基于深度神经网络的少样本学习综述
专知会员服务
170+阅读 · 2020年4月22日
深度学习自然语言处理综述,266篇参考文献
专知会员服务
229+阅读 · 2019年10月12日
【综述】迁移自适应学习十年进展
专知
41+阅读 · 2019年11月26日
图数据表示学习综述论文
专知
52+阅读 · 2019年6月10日
CNN已老,GNN来了!清华大学孙茂松组一文综述GNN
Image Captioning 36页最新综述, 161篇参考文献
专知
90+阅读 · 2018年10月23日
学界 | 综述论文:四大类深度迁移学习
机器之心
16+阅读 · 2018年9月15日
Compositional Generalization in Image Captioning
Arxiv
3+阅读 · 2019年9月16日
Few-shot Adaptive Faster R-CNN
Arxiv
3+阅读 · 2019年3月22日
Arxiv
5+阅读 · 2018年10月11日
Arxiv
136+阅读 · 2018年10月8日
Arxiv
4+阅读 · 2018年3月14日
VIP会员
相关VIP内容
最新《深度学习视频异常检测》2020综述论文,21页pdf
专知会员服务
84+阅读 · 2020年9月30日
专知会员服务
64+阅读 · 2020年9月10日
西北大学等最新《深度主动学习》全面综述论文,30页pdf
专知会员服务
223+阅读 · 2020年5月6日
基于深度神经网络的少样本学习综述
专知会员服务
170+阅读 · 2020年4月22日
深度学习自然语言处理综述,266篇参考文献
专知会员服务
229+阅读 · 2019年10月12日
Top
微信扫码咨询专知VIP会员