【干货】苹果 AI 负责人 Russ Salakhutdinov 最新演讲:深度生成模型定量评估(56 PPT)

2017 年 3 月 27 日 新智元

  新智元编译  

来源:www.cs.cmu.edu

作者:Russ Salakhutdinov

整理:刘小芹  

【新智元导读】Russ Salakhutdinov 是苹果 AI 研发负责人,CMU 教授,也是著名的机器学习领域大牛。本文是 Russ 有关评估深度生成模型的讲座的 ppt。


新智元327技术大会爱奇艺回播视频链接,请点击阅读原文。


PPT下载:http://www.cs.cmu.edu/~rsalakhu/talk_Eval.pdf





本讲结构:

  • 概要

  • 退火重要性采样(AIS)

  • 用于无向图模型的反向 AIS Estimator

  • 评估 directed,decoder-based 生成模型


无监督学习→ 非概率模型、概率(生成)模型


Directed vs. Undirected Models


左:Helmholtz Machine / 变分自编码器

右:深度玻尔兹曼机


马尔可夫随机场


图模型:是用于表示随机变量之间依赖关系结构的强大框架。


受限玻尔兹曼机


模型选择


生成模型

 

模型A和模型B哪个是更好的生成模型?


一般来说,我们应该怎样选择模型?


在验证集上比较 P(x):P(x) = f(x) / Z

我们需要得到分配函数 Z 的估值


简单重要性采样


退火重要性采样


退火重要性采样的运行


AIS 是重要性采样


具有几何平均值的RBM


用 MNIST 训练的受限玻尔兹曼机

左:目标分布上的样本

右:具有几何平均值的 AIS


Undirected Model 存在的问题


激励:RBM 抽样

运行马尔可夫链(吉布斯采样)



展开的RBM作为深度定向生成模型


Reverse AIS Estimator(RAISE)


MNIST


在 MNIST 上训练有 500 个隐藏单元的 RBM

初始分布均匀


Omniglot 数据集


在 Omniglot 上训练有 500 个隐藏单元的 RBM


MNIST 和 Omniglot 的结果


DBM(深度玻尔兹曼机)和 DBN(深度置信网络)


Decoder-Based 模型:将样本从简单分布转换为数据流


Directed vs. Undirected 模型


左:Helmholtz Machine / 变分自编码器

右:深度玻尔兹曼机


变分自编码器(VAE)


VAE:概率有向图模型,使用被称为编码器网络的近似推理模型。


GANs 和 GMMNs


GAN:是解码器和鉴别器网络之间的博弈训练的生成模型。

GMMN:采用最大平均差异(MMD)作为训练目标。


退火重要性采样(AIS)


AIS:通过引入一个中间分布序列来弥补先验和后验之间的差距。


两个架构,三个模型:VAE、GAN、GMMN


AIS 的验证:KDE vs. AIS


在模拟数据上的结果(KDE 使用100万样本)


MNIST 结果


  • VAE 得到的对数似然性比 GAN 或 GMMN 更高。

  • KDE 误差与模型之间的差异具有相同的数量级,不能用于可靠地比较对数似然性。

  • 视觉上无法分辨出3个模型间的区别。

  • 在我们的简单实验中,GAN 和 GMMN 没有过拟合。



<完>




新智元327技术大会爱奇艺回播视频链接,请点击阅读原文。

登录查看更多
2

相关内容

深度生成模型基本都是以某种方式寻找并表达(多变量)数据的概率分布。有基于无向图模型(马尔可夫模型)的联合概率分布模型,另外就是基于有向图模型(贝叶斯模型)的条件概率分布。前者的模型是构建隐含层(latent)和显示层(visible)的联合概率,然后去采样。基于有向图的则是寻找latent和visible之间的条件概率分布,也就是给定一个随机采样的隐含层,模型可以生成数据。 生成模型的训练是一个非监督过程,输入只需要无标签的数据。除了可以生成数据,还可以用于半监督的学习。
最新《高级深度学习》课程, 慕尼黑工业大学
专知会员服务
76+阅读 · 2020年6月20日
Fariz Darari简明《博弈论Game Theory》介绍,35页ppt
专知会员服务
106+阅读 · 2020年5月15日
WSDM 2020教程《深度贝叶斯数据挖掘》,附257页PPT下载
专知会员服务
153+阅读 · 2020年2月7日
深度强化学习策略梯度教程,53页ppt
专知会员服务
176+阅读 · 2020年2月1日
【干货51页PPT】深度学习理论理解探索
专知会员服务
60+阅读 · 2019年12月24日
246 页《统计机器学习与凸优化》教程 PPT 下载
新智元
24+阅读 · 2018年9月21日
115页Slides带你领略深度生成模型全貌(附PPT)
数据派THU
11+阅读 · 2018年7月31日
探幽深度生成模型的两种方法:VAE和GAN
AI前线
15+阅读 · 2018年3月10日
【干货】一文读懂什么是变分自编码器
专知
12+阅读 · 2018年2月11日
Music Transformer
Arxiv
5+阅读 · 2018年12月12日
Arxiv
6+阅读 · 2018年4月21日
Arxiv
4+阅读 · 2018年3月23日
Arxiv
7+阅读 · 2018年3月21日
Arxiv
7+阅读 · 2018年3月17日
Arxiv
6+阅读 · 2018年3月12日
VIP会员
相关论文
Music Transformer
Arxiv
5+阅读 · 2018年12月12日
Arxiv
6+阅读 · 2018年4月21日
Arxiv
4+阅读 · 2018年3月23日
Arxiv
7+阅读 · 2018年3月21日
Arxiv
7+阅读 · 2018年3月17日
Arxiv
6+阅读 · 2018年3月12日
Top
微信扫码咨询专知VIP会员