来源:量子位
城里新来了个AI修图师,可以说有求必应。
拍了一张美美的照片,但是我还不满意。想瘦脸,想按照我想要的弧线瘦脸;还想让眉毛俏皮上挑、鼻子也挺一点。
AI修图师,行不行?
行。
简单。把不满意的地方涂掉,接着想怎么改,就怎么简单勾勒一下线条。
然后,点一下按钮。效果你看看,行不行?
求大神帮忙:帮我P成咧嘴微笑,以及眼珠换个颜色。
行。
世间P图的要求不过尔尔,对于这个AI修图师来说,简直信手拈来。只要你提好需求,然后一键就能完美实现。
来个实战演示,譬如给美女加个刘海、画个眼影。也是轻轻松松快速完成。
给小伙去掉墨镜、露出眼睛。没问题,分分钟搞定。
真的,这都不算难事儿。
其实,过去我们也介绍过一些类似的神经网络P图大师。
不过这次的AI修图师,还有一些新本领。
例如,对于色彩的掌握。
可以根据要求,改变眼球的颜色,轻松告别美瞳或者红眼。
还能改变发型。
甚至,给光头P上秀发,而且头发可以是不同颜色的混搭,直接生成一种挑染的风范~
不仅如此,这个AI还能按照需求,定制生成搭配的首饰。
耳坠啊什么的,全都不在话下。
当然,以上种种还都是小儿科。
这个AI能脑补的范围可不只是一点点,而是一大片。
即便你给它这样一张图片。
只要给出要求。
AI修图师也能很好的重建出来。
左边是脑补的结果,右边是真实的照片,对比一下,你会点赞的……
再展示一组。
甚至,只给一个带颜色的简笔画,AI修图师也能生成接近原照片的结果。
你看:
这是怎么做到的?
其实这个最新出现的AI修图大师,来自韩国电子通信研究院(ETRI)。背后是一个名叫SC-FEGAN的模型,可以分为生成器、鉴别器两大部分。
输入一张不完整的图片,加上蒙版、线稿或者颜色信息,生成器就能推断出编辑后的照片。然后,鉴别器来判断这张照片是不是P得天衣无缝。
生成器基于英伟达推出的图像修复模型U-net,一共有16个卷积层,所有卷积层都使用3x3大小的门控卷积(gated convolution)。
除了输入和输出之外,所有卷积层之后都应用英伟达在2017年提出的局部响应归一化(LRN)。
生成器中还引入了各种损失训练,包括每像素损失、感知损失、风格损失、总方差损失以及通用的GAN损失函数。
鉴别器,使用的是伊利诺伊大学厄巴纳-香槟分校(UIUC)和Adobe研究团队在2018年提出SN-PatchGAN中的架构。
使用了3x3大小的卷积核并应用了梯度惩罚损失项,并没有将ReLu函数应用到GAN损失之中。
在这项研究中,训练使用的是香港中文大学汤晓鸥组收集的人脸数据集CelebA-HQ数据集。
在其中随机选择两组共29000张图像用于训练,1000张图像用于测试。
将图像统一调整为了512x512像素之后,通过自由蒙版和加州大学联合Adobe推出的面部图像生成算法GFC创建对应的草图和颜色数据。
创建颜色数据时,使用直方图均衡化来避免光反射和阴影造成的颜色污染。
然后,使用加州大学HED边沿检测器,来生成与用户输入相对应的草图数据,修改面部图像,然后平滑曲线,并擦除修改图像产生的细小边缘。
研究中,与伊利诺伊大学厄巴纳-香槟分校和Adobe研究团队的网络Deepfillv1进行了对比。
在对人物面部进行了大面积胡抹乱画之后,Deepfillv1虽然对整体进行了复原,但是各种涂抹痕迹,以及细节处理,都远远不及新提出的SC-FEGAN。
此外,与其他的研究相比,SC-FEGAN对数据的依赖并没有那么高。
哪怕是是输入一幅完全涂抹掉的图像,也能生成一些头发丝出来。
这篇论文,来自韩国电子通信研究院,作者是Youngjoo Jo和Jongyoul Park。
这项研究的模型代码,已经在GitHub上开源了,并且提供了带有图形界面的Demo,但需要下载安装。
如果你对这项研究感兴趣,请收好传送门:
SC-FEGAN: Face Editing Generative Adversarial Network with User’s Sketch and Color
https://arxiv.org/pdf/1902.06838.pdf
GitHub项目地址:
https://github.com/JoYoungjoo/SC-FEGAN
☞ OpenPV平台发布在线的ParallelEye视觉任务挑战赛
☞【学界】OpenPV:中科院研究人员建立开源的平行视觉研究平台
☞【学界】ParallelEye:面向交通视觉研究构建的大规模虚拟图像集
☞【CFP】Virtual Images for Visual Artificial Intelligence
☞【最详尽的GAN介绍】王飞跃等:生成式对抗网络 GAN 的研究进展与展望
☞【智能自动化学科前沿讲习班第1期】王飞跃教授:生成式对抗网络GAN的研究进展与展望
☞【智能自动化学科前沿讲习班第1期】王坤峰副研究员:GAN与平行视觉
☞【重磅】平行将成为一种常态:从SimGAN获得CVPR 2017最佳论文奖说起
☞【学界】Ian Goodfellow等人提出对抗重编程,让神经网络执行其他任务
☞【学界】六种GAN评估指标的综合评估实验,迈向定量评估GAN的重要一步
☞【资源】T2T:利用StackGAN和ProGAN从文本生成人脸
☞【学界】 CVPR 2018最佳论文作者亲笔解读:研究视觉任务关联性的Taskonomy
☞【业界】英特尔OpenVINO™工具包为创新智能视觉提供更多可能
☞【学界】ECCV 2018: 对抗深度学习: 鱼 (模型准确性) 与熊掌 (模型鲁棒性) 能否兼得