用GAN也可以P图，效果还不输PS | 英伟达出品

会员服务 ·

用GAN也可以P图，效果还不输PS | 英伟达出品

2021 年 11 月 12 日 量子位

丰色发自凹非寺
量子位报道 | 公众号 QbitAI

把人的眼睛变大、把闭着的嘴合上、转动眼珠：

质量如此逼真、一点糊图的痕迹都没出现——

如果我不说，你知道这其实是GAN自己P的吗？

除了人脸，汽车啊鸟啊猫啊也都可以，比如改改车轮大小、换个车轴样式：

把小鸟的喙部变长、头抬高、胸脯变壮：

用动图展示就更炫酷了：

大点大点，圆点圆点，头发再多一点……

怎么样，这GAN的效果是不是也不输PS？

一个高质量P图GAN

以上这些都来自一个叫做EditGAN的模型，可以对图像实现很多细节上的编辑，同时还能保持原图质量。

研究出自英伟达、多伦多大学以及MIT，相关论文已被NeurIPS 2021接收。

在此之前，大多数基于GAN的图像编辑方法往往都需要大规模数据集上的语义分割注释才能训练，并且也只能做一些有限的修改，有的甚至只是在两张图之间简单地进行插值。

EditGAN作为一种全新方法，只需少量语义标记就能训练。

它会把原图像分割成高度精细的语义块（segmentation mask），有多精细呢？

就比如下面这张人脸图，被足足按30种语义进行了分割：

而在一个交互工具中（还未开放地址），只需操作这些语义块就可以对相应部分进行修改。

EditGAN的关键思想在于利用图像和语义分割的联合分布p(x, y) 。

具体来说就是给定要编辑的新图像x，将其嵌入到EditGAN的潜空间，由于语义分割图和RGB图像共享相同的潜码，所以可以得到相应的分割图y。

接着，使用简单的交互式数字绘画或标签工具，可以根据所需的编辑手动修改分割图y。

然后进行共享潜码的优化，以保持新分割图与真实图像的RGB外观一致，如图所示：

相应的梯度则通过共享生成器反向传播而成。

结果就是潜空间中的编辑向量δw ⁺_edit。

此外，EditGAN通过学习提炼各种各样的编辑向量，可以直接应用于新的图像。

还可以泛化到绘画作品上

真实质量如何？

研究人员在在四个不同类别的图像上对EditGAN进行评估：汽车（空间分辨率384×512）、鸟类（512×512）、猫（256×256）和人脸（1024×1024）。

定性实验结果

将EditGAN此前学习的编辑向量应用于新图像，经过30个优化步骤的细化，EditGAN的编辑操作保持了原图像的质量。

用它进行高精度细节编辑的效果也很好，比如下面左图对轮轴的旋转，右图对瞳孔大小的修改：

在下面这种高清的图像上效果就更好了：

作者表示，目前其他方法都还不能达到这样的效果。

此外，EditGAN也有很强的泛化能力，比如在下面这种绘画等风格的人像上，做点小表情毫无违和感。

定量实验结果

和基于MaskGAN的smile编辑基准的模型相比，EditGAN则实现了最佳属性精度和ID分数。

最后，和所有基于GAN的图像编辑方法一样，EditGAN仅限于应用到由GAN建模的图像上。

作者介绍

一作凌欢，多伦多大学博士生，同时在该校人工智能研究院（Vector Institute）和英伟达做研究。

共同一作Karsten Kreis，英伟达高级研究科学家，2018年以博士学位毕业德国马普高分子所。

其余作者包括：英伟达多伦多AI Lab的Li Daiqing，多伦多大学的Seung Wook Kim，以及MIT教授Antonio Torralba。

通讯作者为一作导师，多伦多大学副教授，英伟达AI总监Sanja Fidler。

论文地址：
https://arxiv.org/abs/2111.03186

项目主页：
https://nv-tlabs.github.io/editGAN/

— 完 —

李开复老师邀你参加「MEET智能未来大会」，与大咖嘉宾、AI从业者共同探讨智能科技新未来！

限时优惠&免费报名中，即刻扫码、锁定席位吧~

量子位 QbitAI · 头条号签约作者

վ'ᴗ' ի 追踪AI技术和产品新动态

一键三连「分享」「点赞」和「在看」

科技前沿进展日日相见 ~

登录查看更多

相关内容

EditGAN

关注 0

元宇宙知识 | 如何在元宇宙中应用众多GAN模型？？？

专知会员服务

35+阅读 · 2022年1月29日

【ICCV 2021】HCFlow：使用一个统一的框架处理图像超分辨率和图像再缩放

专知会员服务

15+阅读 · 2021年10月4日

【ICCV2021】一张草图训练可控的GAN？CMU朱俊彦团队

专知会员服务

22+阅读 · 2021年8月10日

最新《生成式对抗网络GAN逆转》综述论文，22页pdf

专知会员服务

40+阅读 · 2021年1月19日

【AAAI2021】“可瘦身”的生成式对抗网络

专知会员服务

13+阅读 · 2020年12月12日

深度学习图像检索(CBIR): 十年之大综述

专知会员服务

47+阅读 · 2020年12月5日

【ACM MM2020】对偶注意力GAN语义图像合成

专知会员服务

36+阅读 · 2020年9月2日

【CVPR2020-Facebook AI】单样本自适应域脸生成，One-Shot Domain Adaptation

专知会员服务

29+阅读 · 2020年4月6日

姿势服装随心换-CVPR2019

专知会员服务

36+阅读 · 2020年1月26日

必读的10篇 CVPR 2019【生成对抗网络】相关论文和代码

专知会员服务

33+阅读 · 2020年1月10日

太惊艳！用GAN生成新海诚、宫崎骏动漫风格图像

CVer

5+阅读 · 2020年8月11日

尝试混搭，告别格子衫，这个GAN帮你展示真人高清混搭效果

机器之心

9+阅读 · 2019年9月11日

美图秀秀又有P图黑科技：上GAN修老照片，消除人脸马赛克，在线就能体验

量子位

6+阅读 · 2019年9月5日

比AI视频换脸还可怕！DeepMind新AI可生成逼真视频

智东西

10+阅读 · 2019年7月23日

能生成逼真图像的不只有 GAN

机器学习算法与Python学习

8+阅读 · 2019年6月6日

草图秒变风景照，英伟达神笔马良GaoGAN终于开源了

新智元

14+阅读 · 2019年4月17日

【学界】Google用更少标签生成图像，还提出一个用于训练评估GAN的库

GAN生成式对抗网络

23+阅读 · 2019年4月10日

DeOldify：用GAN为黑白照片重新着色

论智

34+阅读 · 2018年11月2日

【学界】画个草图生成2K高清视频，这份效果惊艳研究值得你跑一跑

GAN生成式对抗网络

8+阅读 · 2018年8月26日

基于GAN的极限图像压缩框架

论智

12+阅读 · 2018年4月15日

JoJoGAN: One Shot Face Stylization

Arxiv

0+阅读 · 2022年2月2日

TransGAN: Two Transformers Can Make One Strong GAN

Arxiv

3+阅读 · 2021年2月16日

GAN Inversion: A Survey

Arxiv

19+阅读 · 2021年1月14日

Sentence-BERT: Sentence Embeddings using Siamese BERT-Networks

Arxiv

4+阅读 · 2019年8月27日

GAN Dissection: Visualizing and Understanding Generative Adversarial Networks

Arxiv

11+阅读 · 2018年12月8日

ESRGAN: Enhanced Super-Resolution Generative Adversarial Networks

Arxiv

6+阅读 · 2018年9月17日

Compositional GAN: Learning Conditional Image Composition

Arxiv

31+阅读 · 2018年7月19日

The GAN Landscape: Losses, Architectures, Regularization, and Normalization

Arxiv

3+阅读 · 2018年7月12日

Cross-Domain Adversarial Auto-Encoder

Arxiv

4+阅读 · 2018年4月17日

DeblurGAN: Blind Motion Deblurring Using Conditional Adversarial Networks

Arxiv

4+阅读 · 2018年4月3日

VIP会员