美图秀秀又有P图黑科技:上GAN修老照片,消除人脸马赛克,在线就能体验

2019 年 9 月 5 日 量子位
乾明 发自 凹非寺 
量子位 报道 | 公众号 QbitAI

美图秀秀,现在P图新增最新黑科技。

一言以蔽之,不服就GAN(生成对抗网络)。

不仅能够照片模糊、失焦等问题,还能去掉马赛克。

当然,也会顺手帮你美颜。

比如,这是一张20年前的图片,流传至今已经变得模糊了。P图后,效果是这样的:

图片是不模糊了,但是这个美颜效果……Emmm

甚至打上马赛克,它也能给你把皮肤“磨得”相对来说比较平整。

这就是美图最近推出的“老照片修复”功能,能够取得这样的效果,不仅仅只是靠传统P图算法,还用上了GAN。

用GAN来P图

美图的GAN,名为BeautyGAN,由美图影像实验室MTlab研发。

主要用于解决图片被压缩,或者夜拍、抓拍或是抖动造成的照片模糊或者失焦等问题。

修复一张照片通常分两步:人像修复画质增强

人像修复

人像修复基本上对人脸进行修复,包括人脸裁框和脸部生成修复。

实现人脸裁框方面,美图舍弃了以往单纯利用眼睛间距来裁切人脸的方式,而采用最小包围盒矩形框来裁切人脸,具体来说是这样的:

先用目前成熟的基于CNN的人脸检测和人脸对齐方法获得图像中的人脸点集,计算其外接矩形,向外拓展得到人脸的裁切矩形。

然后通过人脸的裁切矩形,获得人脸的旋转角度,从原图中裁取摆正后的人脸图像。

脸部修复,就是GAN发挥作用的地方。

美图介绍称,人脸生成存在五官变形、丢失遮挡(如手、刘海等)信息等,导致大部分深度学习生成的人脸和真实人脸存在较大差距,生成的脸一眼就能看出来是假的。

还好StyleGAN出现了,借用图像风格迁移能生成逼真人脸。但这仅仅只是生成,并不能实现一对一的人脸修复。

为了用StyleGAN,美图为其设计了一个编码器-解码器网络形式。

他们说,在这个过程中,如果想复用编码器中的featuremap,保留脸部的五官特征,避免发生变形,就需要将其和解码器对应大小的featuremap连接起来。

与以往采用加的连接形式,美图采用的是concat的方式,可保留编码器结构的部分featuremap,避免脸部严重变形或者丢失脸部遮挡(如手、刘海等)的信息。

实际的操作过程,是在网络中,输入一张s x s的图,经过五次下采样,得到一张大小s32 x s32的featuremap,再经5次上采样,生成一张大小为S x S的修复脸部图。

为了进一步增强BeautyGAN的生成能力,美图还借助了StyleGAN的训练方式。

首先,他们训练了解码器的生成能力,即输入一个大小为s32 x s32的随机向量,通过逐层的上采样加上concat的随机向量,最终生成一张s x s大小的人脸,确保生成的人脸看不出真假。

上述的解码器网络结构就是一个生成器,然后加上判别器,就构成了美图的BeautyGAN。

美图表示,直到解码器结构训练稳定具备生成人脸的能力后,才会与编码器结构合并,并进行整个网络结构的训练。

人像修复之后,就会进入下一阶段。

画质增强

美图表示,在这个过程中,分辨率比较高的图片在进行全图去噪等操作时,比较耗时间。

为了提高计算效率,他们将待修复图缩小到一定尺度,再进行分块、去噪等修复操作。然后通过guided-filter网络结构的画质增强方案恢复为原始分辨率。

之后,再利用超分辨率网络,最终使得画质整体变得更加清晰。       

至此,整个图像的处理流程也就大致明了。

美图影像实验室MTlab

最后,简单介绍下这次技术背后的美图影像实验室MTlab。

美图影像实验室(MTlab)成立于2010年。2014年正式独立,目标是利用不断累计的图像数据,训练出更加精准的机器算法,利用算法提供更多服务。

目前,核心技术服务有人脸技术、3D技术、肢体检测、图像恢复、图像增强、增强现实、图像分割、影像生成、极致美颜、美妆技术、AI测肤等11项。

根据官方网站介绍,自2015年以来,美图影像实验室已经发表20多篇论文,其中不乏ICCV、ECCV、CVPR等计算机视觉领域的顶级学术会议。而且,在今年的CVPR和ICCV上的竞赛中,也都获得了有冠军。

基于MTlab,美图在2019年4月推出AI开放平台,对外进行解决方案输出,已经有用宝洁、屈臣氏、欧莱雅、丝芙兰、淘宝、百度等多家公司使用。

现在美图影像实验室MTlab的负责人是万鹏飞,博士毕业于香港科技大学ECE系,本科毕业于中国科学技术大学EEIS系。研究方向主要包括计算机视觉和计算成像。

One more thing…..

还是温馨提示一下吧。

美图这只AI,虽然能够去掉马赛克,但比较重的马赛克,效果并不太理想。

而且也只能去掉人脸上的马赛克,连沸羊羊就不行:

       

看,根本没啥效果……

所以,有大胆想法的小伙伴们,也不是想GAN就能GAN的。

直播 | 揭秘最强中文NLP预训练模型

量子位 QbitAI · 头条号签约作者

վ'ᴗ' ի 追踪AI技术和产品新动态

喜欢就点「在看」吧 ! 


登录查看更多
6

相关内容

美图秀秀是一款傻瓜式的免费图片处理软件,不用学习就会用。独有的图片特效、美容、拼图、场景、边框、饰品等功能,加上每天更新的精选素材,可以让你1分钟做出影楼级照片,还能一键分享到新浪微博、人人网。继PC版之后,美图秀秀又推出了iPhone版、Android版、iPad版及网页版
【CMU】深度学习模型中集成优化、约束和控制,33页ppt
专知会员服务
45+阅读 · 2020年5月23日
 【SIGGRAPH 2020】人像阴影处理,Portrait Shadow Manipulation
专知会员服务
28+阅读 · 2020年5月19日
最新《Deepfakes:创造与检测》2020综述论文,36页pdf
专知会员服务
62+阅读 · 2020年5月15日
【CVPR2020】MSG-GAN:用于稳定图像合成的多尺度梯度GAN
专知会员服务
28+阅读 · 2020年4月6日
自回归模型:PixelCNN
专知会员服务
26+阅读 · 2020年3月21日
姿势服装随心换-CVPR2019
专知会员服务
34+阅读 · 2020年1月26日
【GitHub实战】Pytorch实现的小样本逼真的视频到视频转换
专知会员服务
35+阅读 · 2019年12月15日
学习一个宫崎骏画风的图像风格转换GAN
AI科技评论
18+阅读 · 2020年3月13日
旷视研究院新出8000点人脸关键点,堪比电影级表情捕捉
人工智能前沿讲习班
19+阅读 · 2019年5月4日
已删除
AI科技评论
4+阅读 · 2018年8月12日
人脸图像保护和网纹人脸识别
机器学习研究会
8+阅读 · 2017年12月15日
GAN猫的脸
机械鸡
11+阅读 · 2017年7月8日
Arxiv
5+阅读 · 2018年5月5日
Arxiv
3+阅读 · 2018年4月10日
Arxiv
6+阅读 · 2018年1月29日
VIP会员
相关VIP内容
【CMU】深度学习模型中集成优化、约束和控制,33页ppt
专知会员服务
45+阅读 · 2020年5月23日
 【SIGGRAPH 2020】人像阴影处理,Portrait Shadow Manipulation
专知会员服务
28+阅读 · 2020年5月19日
最新《Deepfakes:创造与检测》2020综述论文,36页pdf
专知会员服务
62+阅读 · 2020年5月15日
【CVPR2020】MSG-GAN:用于稳定图像合成的多尺度梯度GAN
专知会员服务
28+阅读 · 2020年4月6日
自回归模型:PixelCNN
专知会员服务
26+阅读 · 2020年3月21日
姿势服装随心换-CVPR2019
专知会员服务
34+阅读 · 2020年1月26日
【GitHub实战】Pytorch实现的小样本逼真的视频到视频转换
专知会员服务
35+阅读 · 2019年12月15日
相关资讯
学习一个宫崎骏画风的图像风格转换GAN
AI科技评论
18+阅读 · 2020年3月13日
旷视研究院新出8000点人脸关键点,堪比电影级表情捕捉
人工智能前沿讲习班
19+阅读 · 2019年5月4日
已删除
AI科技评论
4+阅读 · 2018年8月12日
人脸图像保护和网纹人脸识别
机器学习研究会
8+阅读 · 2017年12月15日
GAN猫的脸
机械鸡
11+阅读 · 2017年7月8日
Top
微信扫码咨询专知VIP会员