会员服务 ·

0

StarGAN-多领域图像翻译

2017 年 12 月 26 日 CreateAMind 张雨石

http://blog.csdn.net/stdcoutzyx/article/details/78829232

标签：
StarGAN /
图像翻译 /
对抗神经网络 /
Pix2Pix /
CycleGAN

Pix2Pix模型解决了有Pair对数据的图像翻译问题；CycleGAN解决了Unpaired数据下的图像翻译问题。但无论是Pix2Pix还是CycleGAN，都是解决了一对一的问题，即一个领域到另一个领域的转换。当有很多领域要转换了，对于每一个领域转换，都需要重新训练一个模型去解决。这样的行为太低效了。本文所介绍的StarGAN就是将多领域转换用统一框架实现的算法。

下图是StarGAN的效果，在同一种模型下，可以做多个图像翻译任务，比如更换头发颜色，更换表情，更换年龄等。

引入

如果只能训练一对一的图像翻译模型，会导致两个问题：

训练低效，每次训练耗时很大。
训练效果有限，因为一个领域转换单独训练的话就不能利用其它领域的数据来增大泛化能力。

为了解决多对多的图像翻译问题，StarGAN出现了。

模型框架

StarGAN，顾名思义，就是星形网络结构，在StarGAN中，生成网络G被实现成星形。如下图所示，左侧为普通的Pix2Pix模型要训练多对多模型时的做法，而右侧则是StarGAN的做法，可以看到，StarGAN仅仅需要一个G来学习所有领域对之间的转换。

那么，是什么让G有这样的能力呢？

网络结构

要想让G拥有学习多个领域转换的能力，需要对生成网络G和判别网络D做如下改动。

在G的输入中添加目标领域信息，即把图片翻译到哪个领域这个信息告诉生成模型。
D除了具有判断图片是否真实的功能外，还要有判断图片属于哪个类别的能力。这样可以保证G中同样的输入图像，随着目标领域的不同生成不同的效果
除了上述两样以外，还需要保证图像翻译过程中图像内容要保存，只改变领域差异的那部分。图像重建可以完整这一部分，图像重建即将图像翻译从领域A翻译到领域B，再翻译回来，不会发生变化。

D的训练和G的训练如下所示。

目标函数

首先是GAN的通用函数，判断输出图像是否真实

其次是类别损失，该损失被分成两个，训练D的时候，使用真实图像在原始领域进行，训练G的时候，使用生成的图像在目标领域进行。

训练D的损失：

训练G的损失：

再次则是重建函数，重建函数与CycleGAN中的正向函数类似。

汇总后则是

多数据集训练

在多数据集下训练StarGAN存在一个问题，那就是数据集之间的类别可能是不相交的，但内容可能是相交的。比如CelebA数据集合RaFD数据集，前者拥有很多肤色，年龄之类的类别。而后者拥有的是表情的类别。但前者的图像很多也是有表情的，这就导致前一类的图像在后一类的标记是不可知的。

为了解决这个问题，在模型输入中加入了Mask，即如果来源于数据集B，那么将数据集A中的标记全部设为0.

效果图

更多请参考原始论文.

Reference

[1]. StarGAN: Unified Generative Adversarial Networks for Multi-Domain Image-to-Image Translation
[2]. Pix2Pix图像翻译
[3]. CycleGAN-Unpaired图像翻译

招聘公众号回复招聘

登录查看更多

4

相关内容

图像翻译

【CVPR2020】MSG-GAN:用于稳定图像合成的多尺度梯度GAN

【CVPR2020】MSG-GAN:用于稳定图像合成的多尺度梯度GAN

专知会员服务

29+阅读 · 2020年4月6日

自回归模型:PixelCNN

自回归模型:PixelCNN

专知会员服务

28+阅读 · 2020年3月21日

完整版！《GAN实战：生成对抗网络深度学习》在线书与代码，牛津大学Jakub著作 (附下载)

完整版！《GAN实战：生成对抗网络深度学习》在线书与代码，牛津大学Jakub著作 (附下载)

专知会员服务

354+阅读 · 2019年12月25日

【GitHub实战】Pytorch实现的小样本逼真的视频到视频转换

【GitHub实战】Pytorch实现的小样本逼真的视频到视频转换

专知会员服务

36+阅读 · 2019年12月15日

【ICIP2019教程-NVIDIA】图像到图像转换，附7份PPT下载

【ICIP2019教程-NVIDIA】图像到图像转换，附7份PPT下载

专知会员服务

55+阅读 · 2019年11月20日

综述：基于GAN的图像翻译模型盘点

综述：基于GAN的图像翻译模型盘点

GAN生成式对抗网络

21+阅读 · 2019年9月2日

生成对抗网络在图像翻译上的应用【附PPT与视频资料】

生成对抗网络在图像翻译上的应用【附PPT与视频资料】

人工智能前沿讲习班

7+阅读 · 2018年11月28日

GAN做图像翻译的一点总结

GAN做图像翻译的一点总结

PaperWeekly

4+阅读 · 2017年12月26日

附资料包|GAN发展历程综述：送你最易入手的几个架构

附资料包|GAN发展历程综述：送你最易入手的几个架构

七月在线实验室

6+阅读 · 2017年9月5日

GAN猫的脸

机械鸡

11+阅读 · 2017年7月8日

Video-to-Video Synthesis

Video-to-Video Synthesis

Arxiv

9+阅读 · 2018年8月20日

Sem-GAN: Semantically-Consistent Image-to-Image Translation

Sem-GAN: Semantically-Consistent Image-to-Image Translation

Arxiv

4+阅读 · 2018年7月12日

Conditional Image-to-Image Translation

Arxiv

8+阅读 · 2018年5月1日

XGAN: Unsupervised Image-to-Image Translation for Many-to-Many Mappings

Arxiv

3+阅读 · 2018年4月25日

StarGAN: Unified Generative Adversarial Networks for Multi-Domain Image-to-Image Translation

Arxiv

5+阅读 · 2017年11月24日

VIP会员

相关主题

相关VIP内容

【CVPR2020】MSG-GAN:用于稳定图像合成的多尺度梯度GAN

【CVPR2020】MSG-GAN:用于稳定图像合成的多尺度梯度GAN

专知会员服务

29+阅读 · 2020年4月6日

自回归模型:PixelCNN

自回归模型:PixelCNN

专知会员服务

28+阅读 · 2020年3月21日

完整版！《GAN实战：生成对抗网络深度学习》在线书与代码，牛津大学Jakub著作 (附下载)

完整版！《GAN实战：生成对抗网络深度学习》在线书与代码，牛津大学Jakub著作 (附下载)

专知会员服务

354+阅读 · 2019年12月25日

【GitHub实战】Pytorch实现的小样本逼真的视频到视频转换

【GitHub实战】Pytorch实现的小样本逼真的视频到视频转换

专知会员服务

36+阅读 · 2019年12月15日

【ICIP2019教程-NVIDIA】图像到图像转换，附7份PPT下载

【ICIP2019教程-NVIDIA】图像到图像转换，附7份PPT下载

专知会员服务

55+阅读 · 2019年11月20日

热门VIP内容

开通专知VIP会员享更多权益服务

美海军作战管理系统：变革战场空间的二十年

《任务与武器驱动美海军舰队设计》报告

俄罗斯“沙希德”/“天竺葵”攻击无人机

《利用动态图对网络攻击进行建模与仿真：在云安全评估中的应用》90页

相关资讯

综述：基于GAN的图像翻译模型盘点

综述：基于GAN的图像翻译模型盘点

GAN生成式对抗网络

21+阅读 · 2019年9月2日

生成对抗网络在图像翻译上的应用【附PPT与视频资料】

生成对抗网络在图像翻译上的应用【附PPT与视频资料】

人工智能前沿讲习班

7+阅读 · 2018年11月28日

GAN做图像翻译的一点总结

GAN做图像翻译的一点总结

PaperWeekly

4+阅读 · 2017年12月26日

附资料包|GAN发展历程综述：送你最易入手的几个架构

附资料包|GAN发展历程综述：送你最易入手的几个架构

七月在线实验室

6+阅读 · 2017年9月5日

GAN猫的脸

机械鸡

11+阅读 · 2017年7月8日

相关论文

Video-to-Video Synthesis

Video-to-Video Synthesis

Arxiv

9+阅读 · 2018年8月20日

Sem-GAN: Semantically-Consistent Image-to-Image Translation

Sem-GAN: Semantically-Consistent Image-to-Image Translation

Arxiv

4+阅读 · 2018年7月12日

Conditional Image-to-Image Translation

Arxiv

8+阅读 · 2018年5月1日

XGAN: Unsupervised Image-to-Image Translation for Many-to-Many Mappings

Arxiv

3+阅读 · 2018年4月25日

StarGAN: Unified Generative Adversarial Networks for Multi-Domain Image-to-Image Translation

Arxiv

5+阅读 · 2017年11月24日

大家都在搜

大型语言模型

蓝牙安全攻防

朱克爱德华兹家族

隐秘的头发

冷启动，0预算，如何借助分销裂变引爆私域用户增长？

微信扫码咨询专知VIP会员