美图秀秀又有P图黑科技：上GAN修老照片，消除人脸马赛克，在线就能体验

会员服务 ·

美图秀秀又有P图黑科技：上GAN修老照片，消除人脸马赛克，在线就能体验

2019 年 9 月 5 日 量子位

乾明发自凹非寺
量子位报道 | 公众号 QbitAI

美图秀秀，现在P图新增最新黑科技。

一言以蔽之，不服就GAN（生成对抗网络）。

不仅能够照片模糊、失焦等问题，还能去掉马赛克。

当然，也会顺手帮你美颜。

比如，这是一张20年前的图片，流传至今已经变得模糊了。P图后，效果是这样的：

图片是不模糊了，但是这个美颜效果……Emmm

甚至打上马赛克，它也能给你把皮肤“磨得”相对来说比较平整。

这就是美图最近推出的“老照片修复”功能，能够取得这样的效果，不仅仅只是靠传统P图算法，还用上了GAN。

用GAN来P图

美图的GAN，名为BeautyGAN，由美图影像实验室MTlab研发。

主要用于解决图片被压缩，或者夜拍、抓拍或是抖动造成的照片模糊或者失焦等问题。

修复一张照片通常分两步：人像修复和画质增强。

人像修复

人像修复基本上对人脸进行修复，包括人脸裁框和脸部生成修复。

实现人脸裁框方面，美图舍弃了以往单纯利用眼睛间距来裁切人脸的方式，而采用最小包围盒矩形框来裁切人脸，具体来说是这样的：

先用目前成熟的基于CNN的人脸检测和人脸对齐方法获得图像中的人脸点集，计算其外接矩形，向外拓展得到人脸的裁切矩形。

然后通过人脸的裁切矩形，获得人脸的旋转角度，从原图中裁取摆正后的人脸图像。

脸部修复，就是GAN发挥作用的地方。

美图介绍称，人脸生成存在五官变形、丢失遮挡(如手、刘海等)信息等，导致大部分深度学习生成的人脸和真实人脸存在较大差距，生成的脸一眼就能看出来是假的。

还好StyleGAN出现了，借用图像风格迁移能生成逼真人脸。但这仅仅只是生成，并不能实现一对一的人脸修复。

为了用StyleGAN，美图为其设计了一个编码器-解码器网络形式。

他们说，在这个过程中，如果想复用编码器中的featuremap，保留脸部的五官特征，避免发生变形，就需要将其和解码器对应大小的featuremap连接起来。

与以往采用加的连接形式，美图采用的是concat的方式，可保留编码器结构的部分featuremap，避免脸部严重变形或者丢失脸部遮挡(如手、刘海等)的信息。

实际的操作过程，是在网络中，输入一张s x s的图，经过五次下采样，得到一张大小s32 x s32的featuremap，再经5次上采样，生成一张大小为S x S的修复脸部图。

为了进一步增强BeautyGAN的生成能力，美图还借助了StyleGAN的训练方式。

首先，他们训练了解码器的生成能力，即输入一个大小为s32 x s32的随机向量，通过逐层的上采样加上concat的随机向量，最终生成一张s x s大小的人脸，确保生成的人脸看不出真假。

上述的解码器网络结构就是一个生成器，然后加上判别器，就构成了美图的BeautyGAN。

美图表示，直到解码器结构训练稳定具备生成人脸的能力后，才会与编码器结构合并，并进行整个网络结构的训练。

人像修复之后，就会进入下一阶段。

画质增强

美图表示，在这个过程中，分辨率比较高的图片在进行全图去噪等操作时，比较耗时间。

为了提高计算效率，他们将待修复图缩小到一定尺度，再进行分块、去噪等修复操作。然后通过guided-filter网络结构的画质增强方案恢复为原始分辨率。

之后，再利用超分辨率网络，最终使得画质整体变得更加清晰。

至此，整个图像的处理流程也就大致明了。

美图影像实验室MTlab

最后，简单介绍下这次技术背后的美图影像实验室MTlab。

美图影像实验室（MTlab）成立于2010年。2014年正式独立，目标是利用不断累计的图像数据，训练出更加精准的机器算法，利用算法提供更多服务。

目前，核心技术服务有人脸技术、3D技术、肢体检测、图像恢复、图像增强、增强现实、图像分割、影像生成、极致美颜、美妆技术、AI测肤等11项。

根据官方网站介绍，自2015年以来，美图影像实验室已经发表20多篇论文，其中不乏ICCV、ECCV、CVPR等计算机视觉领域的顶级学术会议。而且，在今年的CVPR和ICCV上的竞赛中，也都获得了有冠军。

基于MTlab，美图在2019年4月推出AI开放平台，对外进行解决方案输出，已经有用宝洁、屈臣氏、欧莱雅、丝芙兰、淘宝、百度等多家公司使用。

现在美图影像实验室MTlab的负责人是万鹏飞，博士毕业于香港科技大学ECE系，本科毕业于中国科学技术大学EEIS系。研究方向主要包括计算机视觉和计算成像。

One more thing…..

还是温馨提示一下吧。

美图这只AI，虽然能够去掉马赛克，但比较重的马赛克，效果并不太理想。

而且也只能去掉人脸上的马赛克，连沸羊羊就不行：

看，根本没啥效果……

所以，有大胆想法的小伙伴们，也不是想GAN就能GAN的。

— 完 —

直播 | 揭秘最强中文NLP预训练模型

量子位 QbitAI · 头条号签约作者

վ'ᴗ' ի 追踪AI技术和产品新动态

喜欢就点「在看」吧 !

登录查看更多

相关内容

美图秀秀

关注 0

美图秀秀是一款傻瓜式的免费图片处理软件，不用学习就会用。独有的图片特效、美容、拼图、场景、边框、饰品等功能，加上每天更新的精选素材，可以让你1分钟做出影楼级照片，还能一键分享到新浪微博、人人网。继PC版之后，美图秀秀又推出了iPhone版、Android版、iPad版及网页版

【CVPR2020】通过获取高质量的关键点对来提升目标检测性能

专知会员服务

44+阅读 · 2020年6月30日

【CMU】深度学习模型中集成优化、约束和控制，33页ppt

专知会员服务

46+阅读 · 2020年5月23日

【SIGGRAPH 2020】人像阴影处理，Portrait Shadow Manipulation

专知会员服务

29+阅读 · 2020年5月19日

最新《Deepfakes：创造与检测》2020综述论文，36页pdf

专知会员服务

65+阅读 · 2020年5月15日

生成式对抗网络(GANs)最新2020综述，41页pdf阐述GAN训练、挑战、解决方案和未来方向

专知会员服务

197+阅读 · 2020年5月14日

【CVPR2020】MSG-GAN:用于稳定图像合成的多尺度梯度GAN

专知会员服务

29+阅读 · 2020年4月6日

Google 发布图片配对基准及挑战：从系列图像重建三维物体和建筑物

专知会员服务

40+阅读 · 2020年4月4日

自回归模型:PixelCNN

专知会员服务

27+阅读 · 2020年3月21日

姿势服装随心换-CVPR2019

专知会员服务

36+阅读 · 2020年1月26日

【GitHub实战】Pytorch实现的小样本逼真的视频到视频转换

专知会员服务

36+阅读 · 2019年12月15日

学习一个宫崎骏画风的图像风格转换GAN

AI科技评论

18+阅读 · 2020年3月13日

AI还原半世纪前的黑白电影和照片：效果惊艳在线可玩，网友大呼“鹅妹子嘤”

量子位

11+阅读 · 2019年5月7日

旷视研究院新出8000点人脸关键点，堪比电影级表情捕捉

人工智能前沿讲习班

19+阅读 · 2019年5月4日

最强GAN修图魔术师：美颜生发摘眼镜、草绘秒变真人脸

极市平台

6+阅读 · 2019年2月28日

让画面更逼真！这个强化超分辨率GAN让老游戏迎来第二春 | 代码+论文+游戏MOD

量子位

7+阅读 · 2019年1月13日

为了修复打码女神脸，他们提出二阶段生成对抗网络EdgeConnect

机器之心

4+阅读 · 2019年1月6日

视频直接变漫画！GAN又有了新玩法 | Demo+代码+论文

量子位

11+阅读 · 2018年12月30日

已删除

AI科技评论

4+阅读 · 2018年8月12日

人脸图像保护和网纹人脸识别

机器学习研究会

8+阅读 · 2017年12月15日

GAN猫的脸

机械鸡

11+阅读 · 2017年7月8日

Social-BiGAT: Multimodal Trajectory Forecasting using Bicycle-GAN and Graph Attention Networks

Arxiv

6+阅读 · 2019年7月17日

VoteNet: A Deep Learning Label Fusion Method for Multi-Atlas Segmentation

Arxiv

5+阅读 · 2019年4月18日

Chinese NER Using Lattice LSTM

Arxiv

5+阅读 · 2018年5月5日

Mask-aware Photorealistic Face Attribute Manipulation

Arxiv

5+阅读 · 2018年4月24日

Camera Style Adaptation for Person Re-identification

Arxiv

3+阅读 · 2018年4月10日

Weakly Supervised Instance Segmentation using Class Peak Response

Arxiv

3+阅读 · 2018年4月3日

Adaptive Correlation Filters with Long-Term and Short-Term Memory for Object Tracking

Arxiv

11+阅读 · 2018年3月23日

Pose-Normalized Image Generation for Person Re-identification

Arxiv

5+阅读 · 2018年2月13日

Discrete Autoencoders for Sequence Models

Arxiv

6+阅读 · 2018年1月29日

DeblurGAN: Blind Motion Deblurring Using Conditional Adversarial Networks

Arxiv

9+阅读 · 2018年1月16日

VIP会员