ICLR2019少样本学习新思路：利用转导(Transductive)和标签传播 - 专知

会员服务 ·

1

ICLR2019少样本学习新思路：利用转导(Transductive)和标签传播

2019 年 1 月 18 日 专知

【导读】ICLR2019最新论文《Learning to Propagate Labels: Transductive Propagation Network for Few-shot Learning》阅读笔记

授权转载于知乎：

https://zhuanlan.zhihu.com/p/55111343

文章链接：http://www.zhuanzhi.ai/paper/c365df686ef370f0302902cf29660d67

代码链接：github.com/csyanbin/TPN

1. Motivation: 少样本学习问题为什么要用转导(Transductive)？

目前大部分深度学习的算法依赖于大量的标准数据，这些数据的采集、标注需要耗费大量的人力成本。然而在标注数据比较少的情况下，深度学习的应用和效果都受到了限制。与之相反，人类具有从少量数据中学习的能力，例如给一个小朋友看过几张苹果的图片之后，他就可以很快学会“苹果”这个类别。

少样本学习(few-shot learning)的目标是在已知类别(Seen Class)训练一个分类模型，使它能够在只有少量数据的未知类别(Unseen Class)上面具有很好的泛化性能。少样本学习面临两个重要的问题：（1）已知类别和未知类别之间没有交集，导致它们的数据分布差别很大，不能直接通过训练分类器和微调(finetune)的方式得到很好的性能；（2）未知类别只有极少量数据(每个类别1或者5个训练样本)，导致分类器学习不可靠。

对于第一个问题，Matching Networks提出了episodic training的策略。一个episode就是一个少样本学习的子任务，包含训练集和测试集。这里的episode类似于深度学习中的mini-batch的概念。
对于第二个问题，目前解决方法较少。我们提出利用转导(Transductive)的思想，拿到所有无标注数据，建立权重图，得到全部预测结果，如下图：

转导推理(Transduction) vs 归纳推理(Induction)

我们提出的转导方法将全部无标注数据和有标注数据一起建立一个无向图，通过标签传播的方式得到全部无标注数据的标签。相比较归纳推理(Inductive)方法，我们可以利用无标注数据的分布实现更好的预测。

2. Method: 如何进行标签传播

算法流程

这篇文章提出了转导传播网络(Transductive Propagation Network)，主要分成四个模块：

学习一个样本相关的图结构，针对每一个子任务(episode)我们学习一个单独的图结构，图的权重根据不同的任务和数据动态调整。在第3)步中，我们利用了标签传播算法存在解析解的良好特性，使每个子任务的求解一步完成，而不是像其他方法比如MAML那样，需要多次迭代。2)和3)两个步骤，体现了我们论文题目中的"Learning to Propagate Label"的思想。

3. Experiment：算法性能

我们的方法在常见的miniImagenet和tieredImagenet数据集上，取得了最佳性能。对比算法包括MAML(ICML2017)，Prototypical Network(NIPS2017)和Relation Network(CVPR2018)等。

miniImagenet

tieredImagenet

同时我们的算法还可以进行半监督(semi-supervised) 少样本学习，同样取得了非常好的性能，具体可以参考我们的论文。

4. Future：未来方向

本文提供了在训练数据较少的情况下，如何更好地利用无标注数据的一个思路。

如何改进图的结构，有没有比标签传播更好的方式，这些都是未来可以研究很探讨的方向。

-END-

专 · 知

专知《深度学习: 算法到实战》课程正在开讲！中科院博士为你讲授！ 欢迎扫码报名学习！

请加专知小助手微信（扫一扫如下二维码添加），咨询《深度学习:算法到实战》参团限时优惠报名~

欢迎微信扫一扫加入专知人工智能知识星球群，获取专业知识教程视频资料和与专家交流咨询！

请PC登录www.zhuanzhi.ai或者点击阅读原文，注册登录专知，获取更多AI知识资料！

点击“阅读原文”，了解报名专知《深度学习:算法到实战》课程

登录查看更多

57

相关内容

少样本学习

少样本学习

【CVPR 2020 Oral】小样本类增量学习

专知会员服务

112+阅读 · 2020年6月26日

【CVPR2020】跨模态哈希的无监督知识蒸馏

【CVPR2020】跨模态哈希的无监督知识蒸馏

专知会员服务

61+阅读 · 2020年6月25日

【ICML2020】小样本目标检测

【ICML2020】小样本目标检测

专知会员服务

91+阅读 · 2020年6月2日

具有组合核的图神经网络，Graph Neural Networks with Composite Kernels

具有组合核的图神经网络，Graph Neural Networks with Composite Kernels

专知会员服务

59+阅读 · 2020年5月20日

基于深度神经网络的少样本学习综述

基于深度神经网络的少样本学习综述

专知会员服务

173+阅读 · 2020年4月22日

【CVPR2020-北交】图匹配组合求解器，Learning Combinatorial Solver GM

【CVPR2020-北交】图匹配组合求解器，Learning Combinatorial Solver GM

专知会员服务

28+阅读 · 2020年4月11日

【斯坦福大学】图卷积神经网络和标签传播统一建模学习

专知会员服务

100+阅读 · 2020年2月20日

【IJCV2020】通过迭代亲密学习实现弱监督语义分割

专知会员服务

42+阅读 · 2020年2月20日

WSDM2020教程《基于图学习和推理的推荐系统》，附130页PPT下载

WSDM2020教程《基于图学习和推理的推荐系统》，附130页PPT下载

专知会员服务

217+阅读 · 2020年2月15日

近期必读的5篇 CVPR 2019【图卷积网络】相关论文和代码

近期必读的5篇 CVPR 2019【图卷积网络】相关论文和代码

专知会员服务

33+阅读 · 2020年1月10日

ICLR2019 图上的对抗攻击

ICLR2019 图上的对抗攻击

图与推荐

17+阅读 · 2020年3月15日

EMNLP 2019开源论文：针对短文本分类的异质图注意力网络

EMNLP 2019开源论文：针对短文本分类的异质图注意力网络

PaperWeekly

31+阅读 · 2019年10月22日

目标检测数据标注成本高怎么破？主动学习的自适应监督框架

目标检测数据标注成本高怎么破？主动学习的自适应监督框架

AI科技评论

9+阅读 · 2019年10月11日

GroupSoftmax：利用COCO和CCTSDB训练83类检测器

GroupSoftmax：利用COCO和CCTSDB训练83类检测器

极市平台

12+阅读 · 2019年9月25日

CVPR 2019提前看：少样本学习专题

CVPR 2019提前看：少样本学习专题

机器之心

19+阅读 · 2019年6月14日

标签间相关性在多标签分类问题中的应用

标签间相关性在多标签分类问题中的应用

人工智能前沿讲习班

23+阅读 · 2019年6月5日

【学界】ICLR2019少样本学习新思路：利用转导(Transductive)和标签传播

【学界】ICLR2019少样本学习新思路：利用转导(Transductive)和标签传播

GAN生成式对抗网络

61+阅读 · 2019年1月18日

AI+视频监控算法创新：如何用未标注样本，解决单标注样本下的行人重识别问题？

AI+视频监控算法创新：如何用未标注样本，解决单标注样本下的行人重识别问题？

AI掘金志

6+阅读 · 2018年6月25日

【论文笔记】用图卷积网络( GCN)来做语义角色标注

【论文笔记】用图卷积网络( GCN)来做语义角色标注

专知

61+阅读 · 2018年5月26日

【ICCV17论文笔记】循环注意力区域实现图像多标签分类

【ICCV17论文笔记】循环注意力区域实现图像多标签分类

专知

9+阅读 · 2018年4月21日

L^2-GCN: Layer-Wise and Learned Efficient Training of Graph Convolutional Networks

L^2-GCN: Layer-Wise and Learned Efficient Training of Graph Convolutional Networks

Arxiv

16+阅读 · 2020年3月30日

Unifying Graph Convolutional Neural Networks and Label Propagation

Arxiv

31+阅读 · 2020年2月17日

Area Attention

Arxiv

5+阅读 · 2019年5月23日

Sparse2Dense: From direct sparse odometry to dense 3D reconstruction

Sparse2Dense: From direct sparse odometry to dense 3D reconstruction

Arxiv

9+阅读 · 2019年3月21日

Learning to Propagate Labels: Transductive Propagation Network for Few-shot Learning

Arxiv

7+阅读 · 2019年2月8日

LNEMLC: Label Network Embeddings for Multi-Label Classification

Arxiv

4+阅读 · 2019年1月1日

End to End Video Segmentation for Driving : Lane Detection For Autonomous Car

Arxiv

3+阅读 · 2018年12月13日

Mobile Video Object Detection with Temporally-Aware Feature Maps

Arxiv

11+阅读 · 2018年3月28日

Graph Attention Networks

Arxiv

10+阅读 · 2018年2月4日

Weakly Supervised One-Shot Detection with Attention Siamese Networks

Arxiv

14+阅读 · 2018年1月12日

VIP会员

相关主题

少样本学习

相关VIP内容

【CVPR 2020 Oral】小样本类增量学习

专知会员服务

112+阅读 · 2020年6月26日

【CVPR2020】跨模态哈希的无监督知识蒸馏

【CVPR2020】跨模态哈希的无监督知识蒸馏

专知会员服务

61+阅读 · 2020年6月25日

【ICML2020】小样本目标检测

【ICML2020】小样本目标检测

专知会员服务

91+阅读 · 2020年6月2日

具有组合核的图神经网络，Graph Neural Networks with Composite Kernels

具有组合核的图神经网络，Graph Neural Networks with Composite Kernels

专知会员服务

59+阅读 · 2020年5月20日

基于深度神经网络的少样本学习综述

基于深度神经网络的少样本学习综述

专知会员服务

173+阅读 · 2020年4月22日

【CVPR2020-北交】图匹配组合求解器，Learning Combinatorial Solver GM

【CVPR2020-北交】图匹配组合求解器，Learning Combinatorial Solver GM

专知会员服务

28+阅读 · 2020年4月11日

【斯坦福大学】图卷积神经网络和标签传播统一建模学习

专知会员服务

100+阅读 · 2020年2月20日

【IJCV2020】通过迭代亲密学习实现弱监督语义分割

专知会员服务

42+阅读 · 2020年2月20日

WSDM2020教程《基于图学习和推理的推荐系统》，附130页PPT下载

WSDM2020教程《基于图学习和推理的推荐系统》，附130页PPT下载

专知会员服务

217+阅读 · 2020年2月15日

近期必读的5篇 CVPR 2019【图卷积网络】相关论文和代码

近期必读的5篇 CVPR 2019【图卷积网络】相关论文和代码

专知会员服务

33+阅读 · 2020年1月10日

热门VIP内容

开通专知VIP会员享更多权益服务

《美国太空军系统全生命周期建模、仿真与分析效能提升方案》最新84页报告

《商用大语言模型的升级风险管理：国家安全运用》

自主人工智能：未来战争是否将是自主化的？

《从装备到文化：美陆军技术素养建设启示录》最新报告

相关资讯

ICLR2019 图上的对抗攻击

ICLR2019 图上的对抗攻击

图与推荐

17+阅读 · 2020年3月15日

EMNLP 2019开源论文：针对短文本分类的异质图注意力网络

EMNLP 2019开源论文：针对短文本分类的异质图注意力网络

PaperWeekly

31+阅读 · 2019年10月22日

目标检测数据标注成本高怎么破？主动学习的自适应监督框架

目标检测数据标注成本高怎么破？主动学习的自适应监督框架

AI科技评论

9+阅读 · 2019年10月11日

GroupSoftmax：利用COCO和CCTSDB训练83类检测器

GroupSoftmax：利用COCO和CCTSDB训练83类检测器

极市平台

12+阅读 · 2019年9月25日

CVPR 2019提前看：少样本学习专题

CVPR 2019提前看：少样本学习专题

机器之心

19+阅读 · 2019年6月14日

标签间相关性在多标签分类问题中的应用

标签间相关性在多标签分类问题中的应用

人工智能前沿讲习班

23+阅读 · 2019年6月5日

【学界】ICLR2019少样本学习新思路：利用转导(Transductive)和标签传播

【学界】ICLR2019少样本学习新思路：利用转导(Transductive)和标签传播

GAN生成式对抗网络

61+阅读 · 2019年1月18日

AI+视频监控算法创新：如何用未标注样本，解决单标注样本下的行人重识别问题？

AI+视频监控算法创新：如何用未标注样本，解决单标注样本下的行人重识别问题？

AI掘金志

6+阅读 · 2018年6月25日

【论文笔记】用图卷积网络( GCN)来做语义角色标注

【论文笔记】用图卷积网络( GCN)来做语义角色标注

专知

61+阅读 · 2018年5月26日

【ICCV17论文笔记】循环注意力区域实现图像多标签分类

【ICCV17论文笔记】循环注意力区域实现图像多标签分类

专知

9+阅读 · 2018年4月21日

相关论文

L^2-GCN: Layer-Wise and Learned Efficient Training of Graph Convolutional Networks

L^2-GCN: Layer-Wise and Learned Efficient Training of Graph Convolutional Networks

Arxiv

16+阅读 · 2020年3月30日

Unifying Graph Convolutional Neural Networks and Label Propagation

Arxiv

31+阅读 · 2020年2月17日

Area Attention

Arxiv

5+阅读 · 2019年5月23日

Sparse2Dense: From direct sparse odometry to dense 3D reconstruction

Sparse2Dense: From direct sparse odometry to dense 3D reconstruction

Arxiv

9+阅读 · 2019年3月21日

Learning to Propagate Labels: Transductive Propagation Network for Few-shot Learning

Arxiv

7+阅读 · 2019年2月8日

LNEMLC: Label Network Embeddings for Multi-Label Classification

Arxiv

4+阅读 · 2019年1月1日

End to End Video Segmentation for Driving : Lane Detection For Autonomous Car

Arxiv

3+阅读 · 2018年12月13日

Mobile Video Object Detection with Temporally-Aware Feature Maps

Arxiv

11+阅读 · 2018年3月28日

Graph Attention Networks

Arxiv

10+阅读 · 2018年2月4日

Weakly Supervised One-Shot Detection with Attention Siamese Networks

Arxiv

14+阅读 · 2018年1月12日

大家都在搜

久别重逢话双塔

大型语言模型

国防科技创新

无人机测控通信自组网技术综述

微信扫码咨询专知VIP会员