本教程涵盖了元学习的原则理论和最新的研究进展,并结合了基于对推进新的生物医学发现的高度相关性案例,进行研究设计。我们将介绍一种表示学习方法,通过学习跨数据集进行泛化,从而将标记数据和未标记数据连接起来。

教学目的

在生物医学领域,获取有标签的数据集往往非常困难和耗时。在机器学习理论被使用之前,它需要耗费大量的手工劳动和专家知识来进行手工标记。其结果是导致出现了许多几乎没有标记或完全没有标记的数据集。例如,在蛋白质功能预测中,大量的功能标签只有少数标记基因,或者在单细胞转录组学中,新的和罕见的细胞类型出现在庞大的、异质性的单细胞数据集。

虽然机器学习方法擅长处理具有大量标记数据集的任务,这些标记数据集可以支持高度参数化模型的学习,但要解决生物医学中的核心问题,我们需要的是一种可以推广到不可见的领域,并且仅给出几个标记训练示例数据集,或者在极端情况下,完全没有标记的数据集的方法。低数据模式任务的主要进展是通过元学习(学习跨任务学习)在相关任务中利用知识。元学习背后的核心思想是在之前的任务中获取先验知识,从而实现从少量数据中高效地学习新任务。

本教程将涵盖元学习的原则理论和最近的研究进展,并结合了基于对推进新的生物医学发现的高度相关性案例,进行研究设计。我们将介绍一种表示学习方法,通过学习在只有少数标记例子或没有任何标记数据的数据集上进行泛化,从而架起标记数据和未标记数据之间的桥梁,并强调可解释性。我们将花相当多的时间来解释如何将可解释性作为方法设计中的一个基本特征。本教程将使学员具备理解基础和最先进的元学习方法的能力,并在自己的研究中使用学到的概念和方法。

学习目标

通过完成课程学习,参与者将获得关于对元学习技术的基本概念和最新进展的理解和广泛的知识:

  1. 我们如何有效地从几乎没有标记的数据集中获取知识,例如,蛋白功能或结构与几个标记的例子?我们如何利用先验知识来学习泛化,即元学习?

  2. 我们如何利用现有知识库中的知识,如基因本体和细胞本体,来提供基于少数标记示例的决策背后的解释?

  3. 在没有任何标注例子的情况下,我们需要怎样学习呢?我们是如何发现新的,从未见过的类别/类,如罕见的和未见过的细胞类型的单细胞实验?

  4. 我们如何在不同物种、组织或测序技术之间迁移知识?

  5. 什么基本的生物学开放问题可以从元学习技术中受益?元学习如何运用于这些问题?

  6. 哪些框架、工具和库可用来在新的数据集和应用中使用元学习方法?

成为VIP会员查看完整内容
29

相关内容

Meta Learning,元学习,也叫 Learning to Learn(学会学习)。是继Reinforcement Learning(增强学习)之后又一个重要的研究分支。

知识荟萃

精品入门和进阶教程、论文和代码整理等

更多

查看相关VIP内容、论文、资讯等
专知会员服务
31+阅读 · 2021年7月2日
专知会员服务
95+阅读 · 2021年5月25日
【ICLR2021】对未标记数据进行深度网络自训练的理论分析
【2020新书】数据结构与数据表示指南,112页pdf
专知会员服务
82+阅读 · 2020年10月6日
《小样本元学习》2020最新综述论文
专知会员服务
172+阅读 · 2020年7月31日
机器也能学会如何学习?——元学习介绍
AINLP
19+阅读 · 2019年9月22日
用深度学习揭示数据的因果关系
专知
28+阅读 · 2019年5月18日
Meta-Learning 元学习:学会快速学习
极市平台
75+阅读 · 2018年12月19日
Arxiv
5+阅读 · 2020年3月17日
Deep Co-Training for Semi-Supervised Image Segmentation
Arxiv
3+阅读 · 2018年12月3日
Arxiv
3+阅读 · 2018年8月27日
Arxiv
8+阅读 · 2018年5月1日
VIP会员
相关VIP内容
专知会员服务
31+阅读 · 2021年7月2日
专知会员服务
95+阅读 · 2021年5月25日
【ICLR2021】对未标记数据进行深度网络自训练的理论分析
【2020新书】数据结构与数据表示指南,112页pdf
专知会员服务
82+阅读 · 2020年10月6日
《小样本元学习》2020最新综述论文
专知会员服务
172+阅读 · 2020年7月31日
微信扫码咨询专知VIP会员