资源 | 从变分边界到进化策略，一文读懂机器学习变换技巧

会员服务 ·

资源 | 从变分边界到进化策略，一文读懂机器学习变换技巧

2017 年 11 月 18 日 机器之心

选自inFERENCe

作者：Ferenc Huszár

机器之心编译

参与：路雪、黄小天

本文作者 Ferenc Huszár 是一名机器学习研究者，在剑桥取得博士学位，对概率推断、生成模型、无监督学习和应用深度学习解决问题感兴趣。本文总结了他关于机器学习变换式的技巧，机器之心对此进行编译介绍。

本文分享的是我的笔记，旨在帮助大家获得更好的理解。这是一本关于各种「变换式」的手册，将这些变换用于机器学习问题，并最终使其转为已知解决方案的问题：寻找一个易处理向量场的稳定吸引子。

典型设置为：你有一些模型参数θ。你想优化一些客观标准，但是使用下面列出的方式解决优化问题比较困难。如果可以的话，你可以对问题进行相应的变换处理。之后，如果问题得到了高效优化，非常棒。如果没有，你可以递归地使用该「变换」，直到解决该问题。

你可以将其作为一种编译器，将抽象的机器学习问题编译成寻找易处理向量场中稳定吸引子的典型问题。

那么，我先来介绍以下这些问题的变换：

变分边界（variational bound）
对抗博弈（Adversarial game）
进化策略（Evolution Strategy）
凸松弛法（convex relaxation）

变分边界

典型问题

我的损失函数 f(θ) 很难计算，主要是由于它涉及到难以解决的边缘化（marginalization），我无法评估它，除了将其最小化。

解决方案

让我们构建一组通常可微分的上边界：

并解决优化问题

严格讲，一但优化结束，你可以摈弃辅助参数ψ∗ - 尽管结果经常证明其本身是有意义和有用的，尤其是对于近似推理，比如 VAE 识别模型。

变换技巧

詹森不等式（Jensen's inequality）：凸函数的平均值永远不会低于平均值的凸函数取值。一般出现在下面的标准证据下界（standard evidence lower bound／ELBO）推导的一些变体之中：

再参数化技巧：在变分推理中我们经常遇到这种形式的梯度：

其中变量的 pdf 出现在被积函数中。如果我们可以找到有关其第二个参数的可微分函数 h:(E,Θ)↦X，和易于采样的 pϵ 对 E 的概率分布，下式则会成立：

我们可以使用以下在变分上边界经常遇到的积分重构。

对于这个期望的蒙特卡罗估计量通常比 REINFORCE 估计量的相同数量具有明显更低的方差。

对抗性博弈

典型问题

我无法根据样本直接估计损失函数 f(θ)，原因通常在于损失函数依赖于数据分布或模型，或二者皆有。

解决方案

我们可以构建一个近似，使

然后就可以解决在双人博弈中找到稳定均衡的问题，博弈中双方分别最小化与 ψ 有关的损失函数 g 和与 θ 有关的损失函数 h。

有时，近似可能是下界的形式，其中 h=−g：

这种情况下，我们可以转而解决以下最小最大问题：

变换技巧

辅助任务中的贝叶斯优化：如果损失函数依赖于可从中轻松采样的概率分布的密度，通常你可以构建一个辅助任务，其贝叶斯优化解决方案依赖于密度的值。辅助任务示例：似然比估计的二分类、去噪，或评估评分函数的分数匹配。

凸共役性（Convex conjugate）：损失函数包含密度的凸函数（如 f 散度），你可以通过用凸共役性的形式重新表述来变换你的问题。f 关于其凸共役性 f∗ 的表达式为：

注意：u 是密度函数，内积 ⟨u,v_ψ⟩ 是 v_ψ 的期望值，可以近似到蒙特卡罗采样。

进化策略

典型问题

我的 f(θ) 易于评估但难以优化，可能是因为包含了离散运算，或者该函数是分段常值函数，无法使用反向传播。

解决方案

观察任意概率 pψ 在 θ 上的结果：

因此，在进化策略中，我们将优化问题简化为：

通常，根据函数 f 和分布 pψ 的类别，f 的局部最小值可以从 ψ 的局部最小值中恢复。

变换技巧

强化梯度估计量：它依赖以下技巧

其中 RHS 可以轻松近似蒙特卡罗。蒙特卡罗强化估计量的方差一般比较高。

凸松弛法

典型问题

我的 f(θ) 很难优化，因为它具备不可微和非凸成分，如 ℓ_0（稀疏方法中的向量范数）或分类中的赫维赛德阶跃函数（Heaviside step function）。

解决方案

用凸逼近替换非凸组件，将目标变换成典型的凸函数 g。

变换技巧

ℓ_1 损失函数：在很多稀疏学习情况下，我们希望最小化向量中非零项的数量，叫作 ℓ_0 损失函数。你可以用该向量的 ℓ_1 范数替换 ℓ_0 损失函数。

折叶损失函数（hinge loss）和大间隔方法：二值分类器在 0-1 损失函数下的错误率，其目标通常是分类器参数的分段常值函数（piecewise constant function），很难优化。我们可以用折叶损失替代 0-1 损失，可以理解为一个凸上界。然后，优化问题很可能最大化分类器的间隔。

本文为机器之心编译，转载请联系本公众号获得授权。

✄------------------------------------------------

加入机器之心（全职记者/实习生）：hr@jiqizhixin.com

投稿或寻求报道：content@jiqizhixin.com

广告&商务合作：bd@jiqizhixin.com

登录查看更多

相关内容

变换

关注 2

【经典书】机器学习：贝叶斯和优化方法，1075页pdf

专知会员服务

414+阅读 · 2020年6月8日

【CVPR2020】我们能用强化学习来学习图模型推断的启发规则吗?

专知会员服务

43+阅读 · 2020年5月5日

【硬核书】博弈论导论，417页pdf，Game Theory: An Introduction，普林斯顿大学出版社

专知会员服务

231+阅读 · 2020年4月21日

【Google-Mila】你的GAN实际上是一个基于能量的模型，你应该使用鉴别器驱动的潜在采样，Your GAN is Secretly an Energy-based Model and You Should Use Discriminator Driven Latent Sampling

专知会员服务

30+阅读 · 2020年3月28日

熵与其它信息量估计—国科大UCAS胡包钢教授《信息论与机器学习》课程第四讲

专知会员服务

54+阅读 · 2020年3月9日

国科大UCAS胡包钢教授《信息论与机器学习》课程第三讲：信息论基础二

专知会员服务

71+阅读 · 2020年3月2日

生成式对抗网络先验贝叶斯推断，Bayesian Inference with Generative Adversarial Network Priors

专知会员服务

28+阅读 · 2020年2月18日

自动结构变分推理，Automatic structured variational inference

专知会员服务

41+阅读 · 2020年2月10日

【清华大学】自动微分蒙特卡洛，理论与应用，Automatic Differentiable Monte Carlo: Theory and Application (附pdf）

专知会员服务

28+阅读 · 2019年11月23日

【AAAI2020论文】分类感知的生成式对抗网络，具有分类文本生成的层次进化学习 (附pdf)

专知会员服务

21+阅读 · 2019年11月19日

【学界】NIPS 2018 | 作为多目标优化的多任务学习：寻找帕累托最优解

GAN生成式对抗网络

9+阅读 · 2018年11月2日

再谈变分自编码器VAE：从贝叶斯观点出发

PaperWeekly

13+阅读 · 2018年4月2日

一文学习基于蒙特卡罗的强化学习方法（送书）

人工智能头条

7+阅读 · 2018年3月13日

DeepMind高级研究员：重新理解GAN，最新算法、技巧及应用（59页PPT）

新智元

16+阅读 · 2018年2月5日

【干货】机器学习中样本比例不平衡的处理方法

机器学习研究会

8+阅读 · 2018年1月14日

一文读懂贝叶斯分类算法（附学习资源）

大数据文摘

12+阅读 · 2017年12月14日

独家 | 一文读懂贝叶斯分类算法（附学习资源）

数据派THU

7+阅读 · 2017年12月7日

深度 | 结合Logistic回归构建最大熵马尔科夫模型

机器之心

4+阅读 · 2017年11月25日

观点 | 三大特征选择策略，有效提升你的机器学习水准

机器之心

7+阅读 · 2017年10月23日

机器学习(7)之感知机python实现

机器学习算法与Python学习

4+阅读 · 2017年7月23日

Exploring Categorical Regularization for Domain Adaptive Object Detection

Arxiv

5+阅读 · 2020年3月20日

A Modern Introduction to Online Learning

Arxiv

21+阅读 · 2019年12月31日

Optimization for deep learning: theory and algorithms

Arxiv

106+阅读 · 2019年12月19日

Seeing What a GAN Cannot Generate

Arxiv

8+阅读 · 2019年10月24日

Keyphrase Generation for Scientific Articles using GANs

Arxiv

8+阅读 · 2019年9月24日

Towards Understanding Regularization in Batch Normalization

Arxiv

4+阅读 · 2018年9月27日

Conditional Image-to-Image Translation

Arxiv

8+阅读 · 2018年5月1日

Fictitious GAN: Training GANs with Historical Models

Arxiv

4+阅读 · 2018年3月23日

Signal Processing and Piecewise Convex Estimation

Arxiv

4+阅读 · 2018年3月14日

Safety-aware Adaptive Reinforcement Learning with Applications to Brushbot Navigation

Arxiv

4+阅读 · 2018年1月29日

VIP会员