GAN的原理和数学推导

2021 年 5 月 5 日 专知

点击上方【AI人工智能初学者】，选择【星标】公众号

期待您我的相遇与进步

1 简介

我们都知道可以通过最大似然估计的方式来获得一个模型以用于生成图像，之所以它可以用来生成图像是因为最大似然估计可以获得一个，可以让你和真实数据的分布情况。

上述的最大似然估计的方法虽然可行，但是有比较大的约束，即模型不能够过于复杂；例如服从正态分布，那么最大似然估计的方法就可以计算出，但如果是一个非常复杂的分布，那么使用这种方式难以获得一个比较理想的模型。这种强制性的约束会带来各种限制，而我们则是希望可以拟合任何分布，于是这里便引出了GAN了。

2 生成器拟合分布

在GAN中有2个主要的组成部分，分别是生成器和判别器，

2.1 生成器

因为通过最大似然估计的方式计算复杂的分布，所以GAN的方法就是使用一个神经网络来完成数据分布拟合的事情，而这个神经网络就是生成器，因为神经网络理论上可以拟合任意的分布，所以生成器可以代替最大似然估计来拟合数据的分布。

对于GAN中的生成器而言，它会接收一个随机噪声输入，这个噪声可能来自于正态分布、均匀分布或其他任意分布，经过生成器的转换，输出的数据可以组成一种复杂的分布，最小化这个分布于真实数据分布之间的差异。

对于输入给生成器的数据分布不用太在意，因为生成器是一个复杂的神经网络，它有能力将输入的数据“改造”成各种各样的数据分布。

那么对于生成器而言，它的目标函数为：

即最小化生成分布与真实数据分布之间的距离。

因为我们无法准确的知道生成分布与真实分布的具体的分布情况，所以依旧使用采样的方式来解决这个问题，即从数据集中抽取一个样本，将抽出的样本的分布看成是和的分布。这种做法的思想其实是大数定律，知道2个分布后，就可以通过训练生成器来最小化两个分布之间的差异。

2.2 判别器

通过前面的描述我们可以知道生成器可以最小化生成分布与真实分布之间的距离，但是如何定义这个距离呢？即生成器目标函数中的如何定义呢？

GAN可以通过判别器来定义这两个分布的距离，如下图所示：

使用真实数据与生成数据来训练判别器，训练的目的是让判别器可以分别出哪些是真实数据哪些是生成的数据，即给真实数据打高分，给生成的数据打低分，其公式如下：

对于从真实分布中抽样的样本就打高分，即最大化；对于从生成分布中抽样的样本就打低分，即最大化，那么判别器D的目标函数是：

2.3 目标函数

回到一开始的话题，生成器在训练的时候需要先定义生成分布与真实分布之间的距离，而两个分布之间的距离可以由判别器来进行定义：

从而生成器可以获得新的目标函数公式：

3 GAN的数学推导

通过前面的讨论，我想大家应该已经明白生成器用来拟合真实数据分布，而判别器用来度量真实分布与生成分布之间的距离，接下来就来推导一下

因为在训练生成器之前，先要由两个分布之间距离的定义，所以这里就来推导，这里先将判别器的目标函数变换成积分的形式：

因为判别器希望最大，其实就是要求上式的中间部分最大，即最大，为了简化计算，这里将记为，将记为，将记为，则可以变换为如下的形式：

要找到一个使得函数最大，求其导数为0的值即可：

将上式进行简单的简化的变化可以求得：

这里将和替换为原来的值，获得如下的公式：

推导出，就可以得到将推导出来的结果代入生成器的目标函数中：

将其变换为积分的形式可以得到如下：

这里做一些简单的变换可以得到：

其实通过上面的推导可以看出来，上面的公式就是JS散度，这里再回忆一下JS散度公式：

通过上式可以看出用于类似的样式，所以可以将简化为下式：

推导到这里就可以看出，生成器最小化GAN的目标函数其实就是最小化真实分布与生成分布之间的JS散度，即最小化两个分布的相对熵。

专知便捷查看

便捷下载，请关注专知公众号（点击上方蓝色专知关注）

后台回复“生成式对抗网络” 就可以获取《生成式对抗网络资料全局》专知下载链接

专知，专业可信的人工智能知识分发 ，让认知协作更快更好！欢迎注册登录专知www.zhuanzhi.ai，获取5000+AI主题干货知识资料！

欢迎微信扫一扫加入专知人工智能知识星球群，获取最新AI专业干货知识教程资料和与专家交流咨询！

点击“ 阅读原文 ”，了解使用专知 ，查看获取5000+AI主题知识资源

登录查看更多

相关内容

最大似然估计

关注 0

在统计学中，最大似然估计(maximum likelihood estimation, MLE)是通过最大化似然函数估计概率分布参数的一种方法，使观测数据在假设的统计模型下最有可能。参数空间中使似然函数最大化的点称为最大似然估计。最大似然逻辑既直观又灵活，因此该方法已成为统计推断的主要手段。

最新《生成式对抗网络GAN进展》综述论文，41页pdf阐述GAN在计算机视觉应用进展

专知会员服务

131+阅读 · 2020年12月26日

最新《机器学习：基本原理》2021新书，209页pdf

专知会员服务

134+阅读 · 2020年10月24日

最新《生成式对抗网络数学导论》，30页pdf

专知会员服务

79+阅读 · 2020年9月3日

生成对抗网络GAN正则化方法: 近期研究综述

专知会员服务

109+阅读 · 2020年5月21日

完整版！《GAN实战：生成对抗网络深度学习》在线书与代码，牛津大学Jakub著作 (附下载)

专知会员服务

354+阅读 · 2019年12月25日

万字综述之生成对抗网络（GAN）

PaperWeekly

43+阅读 · 2019年3月19日

从GAN到WGAN：生成对抗网络背后的数学原理（一）

论智

28+阅读 · 2018年2月14日

【原理】学懂GAN的数学原理，让它不再神秘

GAN生成式对抗网络

3+阅读 · 2017年11月26日

GAN的数学原理

算法与数学之美

16+阅读 · 2017年9月2日

【原理】GAN的数学原理

GAN生成式对抗网络

8+阅读 · 2017年8月30日

GAN Inversion: A Survey

Arxiv

19+阅读 · 2021年1月14日

A Mathematical Introduction to Generative Adversarial Nets (GAN)

Arxiv

28+阅读 · 2020年9月1日

In-Domain GAN Inversion for Real Image Editing

Arxiv

3+阅读 · 2020年7月16日

Quantum generative adversarial networks

Arxiv

4+阅读 · 2018年4月30日

KBGAN: Adversarial Learning for Knowledge Graph Embeddings

Arxiv

6+阅读 · 2018年2月20日

VIP会员