会员服务 ·

【学界】神经网络P图新神器：摘墨镜戴美瞳都能搞定，加首饰换发型真假难分 | 代码开源

2019 年 2 月 22 日 GAN生成式对抗网络

来源：量子位

城里新来了个AI修图师，可以说有求必应。

拍了一张美美的照片，但是我还不满意。想瘦脸，想按照我想要的弧线瘦脸；还想让眉毛俏皮上挑、鼻子也挺一点。

AI修图师，行不行？

行。

简单。把不满意的地方涂掉，接着想怎么改，就怎么简单勾勒一下线条。

然后，点一下按钮。效果你看看，行不行？

求大神帮忙：帮我P成咧嘴微笑，以及眼珠换个颜色。

行。

世间P图的要求不过尔尔，对于这个AI修图师来说，简直信手拈来。只要你提好需求，然后一键就能完美实现。

来个实战演示，譬如给美女加个刘海、画个眼影。也是轻轻松松快速完成。

给小伙去掉墨镜、露出眼睛。没问题，分分钟搞定。

真的，这都不算难事儿。

加首饰、换发型、补全脸

其实，过去我们也介绍过一些类似的神经网络P图大师。

不过这次的AI修图师，还有一些新本领。

例如，对于色彩的掌握。

可以根据要求，改变眼球的颜色，轻松告别美瞳或者红眼。

还能改变发型。

甚至，给光头P上秀发，而且头发可以是不同颜色的混搭，直接生成一种挑染的风范~

不仅如此，这个AI还能按照需求，定制生成搭配的首饰。

耳坠啊什么的，全都不在话下。

当然，以上种种还都是小儿科。

这个AI能脑补的范围可不只是一点点，而是一大片。

即便你给它这样一张图片。

只要给出要求。

AI修图师也能很好的重建出来。

左边是脑补的结果，右边是真实的照片，对比一下，你会点赞的……

再展示一组。

甚至，只给一个带颜色的简笔画，AI修图师也能生成接近原照片的结果。

你看：

这是怎么做到的？

原理解读

其实这个最新出现的AI修图大师，来自韩国电子通信研究院（ETRI）。背后是一个名叫SC-FEGAN的模型，可以分为生成器、鉴别器两大部分。

输入一张不完整的图片，加上蒙版、线稿或者颜色信息，生成器就能推断出编辑后的照片。然后，鉴别器来判断这张照片是不是P得天衣无缝。

生成器基于英伟达推出的图像修复模型U-net，一共有16个卷积层，所有卷积层都使用3x3大小的门控卷积（gated convolution）。

除了输入和输出之外，所有卷积层之后都应用英伟达在2017年提出的局部响应归一化（LRN）。

生成器中还引入了各种损失训练，包括每像素损失、感知损失、风格损失、总方差损失以及通用的GAN损失函数。

鉴别器，使用的是伊利诺伊大学厄巴纳-香槟分校（UIUC）和Adobe研究团队在2018年提出SN-PatchGAN中的架构。

使用了3x3大小的卷积核并应用了梯度惩罚损失项，并没有将ReLu函数应用到GAN损失之中。

数据集

在这项研究中，训练使用的是香港中文大学汤晓鸥组收集的人脸数据集CelebA-HQ数据集。

在其中随机选择两组共29000张图像用于训练，1000张图像用于测试。

将图像统一调整为了512x512像素之后，通过自由蒙版和加州大学联合Adobe推出的面部图像生成算法GFC创建对应的草图和颜色数据。

创建颜色数据时，使用直方图均衡化来避免光反射和阴影造成的颜色污染。

然后，使用加州大学HED边沿检测器，来生成与用户输入相对应的草图数据，修改面部图像，然后平滑曲线，并擦除修改图像产生的细小边缘。

效果怎么样？

研究中，与伊利诺伊大学厄巴纳-香槟分校和Adobe研究团队的网络Deepfillv1进行了对比。

在对人物面部进行了大面积胡抹乱画之后，Deepfillv1虽然对整体进行了复原，但是各种涂抹痕迹，以及细节处理，都远远不及新提出的SC-FEGAN。

此外，与其他的研究相比，SC-FEGAN对数据的依赖并没有那么高。

哪怕是是输入一幅完全涂抹掉的图像，也能生成一些头发丝出来。

传送门

这篇论文，来自韩国电子通信研究院，作者是Youngjoo Jo和Jongyoul Park。

这项研究的模型代码，已经在GitHub上开源了，并且提供了带有图形界面的Demo，但需要下载安装。

如果你对这项研究感兴趣，请收好传送门：

SC-FEGAN: Face Editing Generative Adversarial Network with User’s Sketch and Color
https://arxiv.org/pdf/1902.06838.pdf

GitHub项目地址：
https://github.com/JoYoungjoo/SC-FEGAN

高质量延伸阅读

☞ OpenPV平台发布在线的ParallelEye视觉任务挑战赛

☞【学界】第1届“智能车辆中的平行视觉”研讨会成功举行

☞【学界】生成式对抗网络：从生成数据到创造智能

☞【学界】OpenPV：中科院研究人员建立开源的平行视觉研究平台

☞【学界】基于平行视觉的特定场景下行人检测

☞【学界】ParallelEye：面向交通视觉研究构建的大规模虚拟图像集

☞【CFP】Virtual Images for Visual Artificial Intelligence

☞【最详尽的GAN介绍】王飞跃等：生成式对抗网络 GAN 的研究进展与展望

☞【智能自动化学科前沿讲习班第1期】王飞跃教授：生成式对抗网络GAN的研究进展与展望

☞【智能自动化学科前沿讲习班第1期】王坤峰副研究员：GAN与平行视觉

☞【重磅】平行将成为一种常态：从SimGAN获得CVPR 2017最佳论文奖说起

☞【平行讲坛】平行图像：图像生成的一个新型理论框架

☞【学界】基于生成对抗网络的低秩图像生成方法

☞【学界】Ian Goodfellow等人提出对抗重编程，让神经网络执行其他任务

☞【学界】六种GAN评估指标的综合评估实验，迈向定量评估GAN的重要一步

☞【资源】T2T：利用StackGAN和ProGAN从文本生成人脸

☞【学界】 CVPR 2018最佳论文作者亲笔解读：研究视觉任务关联性的Taskonomy

☞【业界】英特尔OpenVINO™工具包为创新智能视觉提供更多可能

☞【学界】ECCV 2018: 对抗深度学习: 鱼 (模型准确性) 与熊掌 (模型鲁棒性) 能否兼得

☞【学界】何恺明组又出神作！最新论文提出全景分割新方法

登录查看更多

相关内容

神经网络

关注 5910

人工神经网络（Artificial Neural Network，即ANN ），是20世纪80 年代以来人工智能领域兴起的研究热点。它从信息处理角度对人脑神经元网络进行抽象，建立某种简单模型，按不同的连接方式组成不同的网络。在工程与学术界也常直接简称为神经网络或类神经网络。神经网络是一种运算模型，由大量的节点（或称神经元）之间相互联接构成。每个节点代表一种特定的输出函数，称为激励函数（activation function）。每两个节点间的连接都代表一个对于通过该连接信号的加权值，称之为权重，这相当于人工神经网络的记忆。网络的输出则依网络的连接方式，权重值和激励函数的不同而不同。而网络自身通常都是对自然界某种算法或者函数的逼近，也可能是对一种逻辑策略的表达。最近十多年来，人工神经网络的研究工作不断深入，已经取得了很大的进展，其在模式识别、智能机器人、自动控制、预测估计、生物、医学、经济等领域已成功地解决了许多现代计算机难以解决的实际问题，表现出了良好的智能特性。