觉得 GAN 不好理解?GANLab 将GAN的训练过程可视化给你看

【导读】Generative Adversarial Network (GAN) 是当下最热门的研究领域之一。它主要包括了两个部分,即生成器 generator 与判别器 discriminator。生成器主要用来学习真实图像分布从而让自身生成的图像更加真实,以骗过判别器。判别器则需要对接收的图片进行真假判别。如果你对上述描述有些困惑, 没关系,Minsuk Kahng 等同学,近日在计算机视觉顶级期刊TVCG上,发布了一款新工具 GANLab,可以让你轻松理解 GAN 的训练过程。


  • 论文 

    • GAN Lab: Understanding Complex Deep Generative Models using Interactive Visual Experimentation

  • 作者 

    • Minsuk Kahng, Nikhil Thorat, Polo Chau, Fernanda Viégas, and Martin Wattenberg. 

  • 期刊

    • IEEE Transactions on Visualization and Computer Graphics

  • GANLab网址

    • https://poloclub.github.io/ganlab/

  • 整理报道

    • huaiwen


首先让我们一睹为快,到底 GAN 是怎么训练的:

视频内的 GANLab 工具,分为几个功能区:


左侧的网络区, 包含了这个 GAN 的网络结构,和生成过程。中间的展示区,展示了,生成器生成的假样本(图中紫色),在不断拟合真样本(图中绿色)的过程, 同时,展示区,还通过背景颜色的不同,展示了判别器,对各个样本的判别结果:紫色背景,表示判别为假; 绿色背景表示判别为真。


在整个过程中,生成器努力地让生成的图像更加真实,而判别器则努力地去识别出图像的真假,这个过程相当于一个二人博弈,随着时间的推移,生成器和判别器在不断地进行对抗,最终两个网络达到了一个动态均衡:生成器生成的图像接近于真实图像分布,而判别器识别不出真假图像,对于给定图像的预测为真的概率基本接近 0.5(相当于随机猜测类别)。


但实际训练过程中,判别器和生成器之间的平衡很难掌控,比如,如下就是一个判别器学的过强的例子:


为此,我们可以细致的调节参数,GANLab 可以自由设置参数:

如图所示,我们可以调整噪声的生成方式, 生成器的隐层个数, 优化方法, 学习率,判别器隐层个数机器优化方法等等。


GANLab 的最右边,是 Metrics 量表区,展示一些学习过程中的 Loss 情况;一般来说,这些Loss 信息,并不能用来判断 GAN 到底收敛与否。具体情况, 大家可以自行尝试, 相信你会对 GAN 有一个全新的认知。


-END-

专 · 知


人工智能领域26个主题知识资料全集获取与加入专知人工智能服务群: 欢迎微信扫一扫加入专知人工智能知识星球群,获取专业知识教程视频资料和与专家交流咨询!



请PC登录www.zhuanzhi.ai或者点击阅读原文,注册登录专知,获取更多AI知识资料!


请加专知小助手微信(扫一扫如下二维码添加),加入专知主题群(请备注主题类型:AI、NLP、CV、 KG等)交流~

 AI 项目技术 & 商务合作:bd@zhuanzhi.ai, 或扫描上面二维码联系!

请关注专知公众号,获取人工智能的专业知识!

点击“阅读原文”,使用专知

展开全文
Top
微信扫码咨询专知VIP会员