GAN和PS合体会怎样？东京大学图像增强新研究：无需配对图像，增强效果还可解释

会员服务 ·

GAN和PS合体会怎样？东京大学图像增强新研究：无需配对图像，增强效果还可解释

2019 年 12 月 22 日 量子位

十三发自凹非寺
量子位报道 | 公众号 QbitAI

GAN和PS合体，会擦出怎样的火花？

在让图像变美的这条道路上，方法可谓是层出不穷。

过去，若是有大量的原始图像和增强图像，那么我们就可以用类似CNN的方法进行训练，来让图像变得更美。

但在现实中，成对的图像并没有那么多。于是，像CycleGAN这样方法就诞生了。

然而，我们都知道，生成对抗网络的过程就像一个黑盒子，人们无法手动调节细节部分，以及输出图像的分辨率也有限制。

于是乎，来自东京大学的研究人员想出了一个办法——让GAN和PS软件做个合体。

我们在PS美化图片的时候，会对图像的参数进行一些设置。

研究人员提出的这个方法是一个强化学习框架，让GAN和PS做结合，这样就可以用PS美化图像的参数，以及在不需要大量成对图像的情况下，输出较好的结果。

图像集无需成对，效果逼近专业水平

话不多说，先来看看这个强化学习框架的效果吧！

实验主要是从两方面进行，一是图片增强，二是人脸美化。

图片增强(Photo Enhancement)

在这个实验中，研究人员采用的数据集是MIT-Adobe 5K。

这个数据集包含了5000张图片，每张照片都由5位专家处理过。

为了呈现不成对的图像集，研究人员将其中的2250张原始图像和2250张不重叠且修饰过的图像作为训练集，另外500张作为测试集。

△在MIT-Adobe 5K数据集上，不同方法间的定量比较

研究人员首先进行了定量比较。

和提出的强化学习框架做比较的，是其他一些无需成对图像集的现有方法，例如CycleGAN。

从上表的实验数据可以看出，无论是大图还是小图，在PSNR和SSIM这两个评测指标方面多取得了最优结果。

△在MIT-Adobe 5K数据集的一张测试图像上，不同方法间的定性比较

接下来是定性比较。

此处，使用了Adobe Lightroom中提供的“auto white-balance”和“auto-tone adjustment”功能，研究人员将其命名为Lightroom (auto)。

如上图所示，Lightroom (auto)会让颜色变暗，CycleGAN会让天空和建筑之间的边界产生伪影，Exposure会让图像过度曝光，D&R输出的图像比目标图像稍微暗一些。

而研究人员的方法更加接近上图(h)中专家修饰过的图像。

值得注意的是，虽然DPE的方法也比较接近，但在定量实验中会表现出尺度敏感性。

人脸美化(Face Beautification)

第二个实验就是对人脸照片进行美化。

在这个实验中所用到的数据集是SCUTFBP5500，共包含5500人脸图像以及附带的“颜值评分”。

研究人员假定评分前1500的是“高颜值”人脸照片，其他的便是颜值不那么高的人脸照片。

△在SCUT-FBP5500数据集上的定性比较

同样，先做的是定性实验。

作比较的方法包括ResGAN、CycelGAN、DFI和Facelet，这些方法都使用CNN来处理人脸图像。

从上图的实验结果不难看出，ResGAN只能产生眼部周围的伪影。后三者虽然试图让人脸看着更好看些，但是痕迹过于明显。

而这个强化学习框架的效果，会让人脸美化得更加自然。

GAN和PS如何做结合?

研究人员提出的强化学习框架如下图所示。

判别器D的训练过程和一般GAN中的判别器是一样的。

也就是说，判别器D是用来学习将生成图像和真实图像作区分。

而生成器将原始图像作为输入，并输出一些参数，提供给PS软件。

由于PS软件是不可微分的，所以研究人员利用强化学习来训练生成器。

值得注意的是，在现有的图像处理RL方法中，agent接收图像后按顺序决定操作，而这个方法的agent接收图像并只选择一个操作。

于是，这个方法的生成器和判别器分别如下所示。

研究人员交替地训练判别器和生成器，并且还创建了一个缓冲区(replay buffer)，用于保存训练过程中生成的图像。

研究小结

总的来说，这项研究所提出的强化学习框架，解决了如下问题：

由于神经网络结构的原因，生成图像会存在一些伪影；
在不配对图像增强方法中，生成的图像分辨率有限；
增强效果无法解释。

而这个RL框架，可以有效的将GAN和PS进行结合，从而得到更好的图像增强效果。

传送门

论文地址：

https://arxiv.org/pdf/1912.07833.pdf

— 完 —

大咖齐聚！量子位MEET大会精彩回放

量子位 MEET 2020 智能未来大会精彩回放来袭！李开复、倪光南、景鲲、周伯文、吴明辉、曹旭东、叶杰平、唐文斌、王砚峰、黄刚、马原等AI大咖与你一起读懂人工智能。扫码观看回放吧~ ~

跟大咖交流 | 进入AI社群

量子位 QbitAI · 头条号签约作者

վ'ᴗ' ի 追踪AI技术和产品新动态

喜欢就点「在看」吧 !

登录查看更多

相关内容

图像增强

关注 4

【CVPR2020 旷视研究院】探索类别正则化的领域自适应对象检测

专知会员服务

24+阅读 · 2020年4月22日

【CVPR2020-Facebook AI】单样本自适应域脸生成，One-Shot Domain Adaptation

专知会员服务

29+阅读 · 2020年4月6日

【CVPR2020】MSG-GAN:用于稳定图像合成的多尺度梯度GAN

专知会员服务

29+阅读 · 2020年4月6日

谷歌提出“T5” 新NLP模型，突破迁移学习局限，多基准测试达SOTA！

专知会员服务

41+阅读 · 2020年2月26日

必读的10篇 CVPR 2019【生成对抗网络】相关论文和代码

专知会员服务

33+阅读 · 2020年1月10日

【浙江大学】对抗样本生成技术综述

专知会员服务

92+阅读 · 2020年1月6日

【GitHub实战】Pytorch实现的小样本逼真的视频到视频转换

专知会员服务

36+阅读 · 2019年12月15日

【CCF优秀博士学位论文奖-2019】融合结构先验的图像及视频去模糊研究，天津大学任文琦

专知会员服务

48+阅读 · 2019年11月8日

【MLA 2019】图像的非监督增强匹配，清华大学张长水教授

专知会员服务

28+阅读 · 2019年11月6日

【ICCV2019最佳论文官方代码】Official pytorch implementation of the paper: "SinGAN: Learning a Generative Model from a Single Natural Image"(从单一自然图像中学习的无条件生成模型) 附PDF论文

专知会员服务

22+阅读 · 2019年11月2日

科研人员提出海量虚拟数据生成新方法

中科院之声

6+阅读 · 2019年9月25日

加强版CycleGAN！贾佳亚等提出卡通图与真实人脸转换模型，看女神突破次元壁长啥样

量子位

10+阅读 · 2019年7月11日

谷歌提出新型自动语音识别数据增强大法，直接对频谱图“动刀”，提升模型表现

量子位

8+阅读 · 2019年4月28日

【学界】画个草图生成2K高清视频，这份效果惊艳研究值得你跑一跑

GAN生成式对抗网络

8+阅读 · 2018年8月26日

无需干净样本，英伟达AI去马赛克

AR酱

10+阅读 · 2018年7月13日

【学界】实景照片秒变新海诚风格漫画：清华大学提出CartoonGAN

GAN生成式对抗网络

14+阅读 · 2018年6月20日

谷歌放大招！数据增强实现自动化

新智元

8+阅读 · 2018年6月4日

基于GAN的极限图像压缩框架

论智

12+阅读 · 2018年4月15日

GAN做图像翻译的一点总结

PaperWeekly

4+阅读 · 2017年12月26日

深度图像先验：无需学习即可生成新图像

论智

45+阅读 · 2017年12月4日

Generating Fact Checking Explanations

Arxiv

9+阅读 · 2020年4月13日

Hierarchical Adaptive Contextual Bandits for Resource Constraint based Recommendation

Arxiv

5+阅读 · 2020年4月2日

Attentive Convolution: Equipping CNNs with RNN-style Attention Mechanisms

Arxiv

3+阅读 · 2018年11月13日

Close to Human Quality TTS with Transformer

Arxiv

3+阅读 · 2018年11月13日

Compositional GAN: Learning Conditional Image Composition

Arxiv

31+阅读 · 2018年7月19日

Sem-GAN: Semantically-Consistent Image-to-Image Translation

Arxiv

4+阅读 · 2018年7月12日

Learning to Sketch with Shortcut Cycle Consistency

Arxiv

5+阅读 · 2018年5月1日

Wasserstein Auto-Encoders

Arxiv

7+阅读 · 2018年3月12日

DeblurGAN: Blind Motion Deblurring Using Conditional Adversarial Networks

Arxiv

9+阅读 · 2018年1月16日

Demystifying MMD GANs

Arxiv

12+阅读 · 2018年1月12日

VIP会员