点击下方卡片,关注“CVer”公众号
AI/CV重磅干货,第一时间送达
换脸见多了,换身材的见过吗?
给定一张脸,就能自动换一个下半身,服饰、身材、肤色都毫无PS痕迹:
核心技术当然还是我们熟悉的GAN,但不同的是,现在身体的每个部分都能被PS了。
从脸,肤色、服饰、头发等身体各个部位,甚至到肢体动作,都能被随意设计和组合,最终“缝”成一张1024 × 1024分辨率的全身照片:
而且这张“缝合怪”还完全没有拼接行为带来的阴影和边界:
怎么做到的?把用于生成人体不同部位的GAN“拼”起来。
这就是Adobe团队最新提出的一种结合多个预训练的GAN进行图像生成的新方法,论文目前已被CVPR 2022接收:
接下来就一起来看看他们到底是如何实现的。
如我们开头所说,这是一种将多个GAN拼接起来使用的方法,研究团队将其称之为InsetGAN。
共分为两类GAN:
全身GAN (Full-Body GAN),基于中等质量的数据进行训练并生成一个人体。
部分GAN,其中包含了多个针对脸部、手、脚等特定部位进行训练的GAN。
这两类GAN的合作方式类似于PS:全身GAN是一张已经有打底线稿的画布,而部分GAN则是一张一张叠在上面的图层。
但不同边界的“图层”在叠到画布上时,一定会有出现对齐问题。
比如,将一张脸添加到身体上时,在肤色的一致性、衣服边界和头发披散的自然性上可能出现细节的扭曲和丢失,或出现伪影(Artifacts):
如何才能更好地协调多个GAN,让它们产生一致的像素呢?
研究团队设计了这样一种架构:
他们首先引入了一个边界框检测器,检测部分GAN生成的特定区域在底层画布,也就是全身GAN生成的区域中的位置,经过裁剪后再将特定区域嵌入。
这一过程相当于找到了两个区域之间的一种随机潜码 (latent code),使得所选区域的边界能够和嵌入区域相匹配,以实现无缝合成。
同时,他们还会对这两个区域进行下采样(Downsample),再次增加图像像素内容的一致性。
基于这种方法,InsetGAN可以在训练后生成多张完整人像,同时肤色、头发和相关姿势都能作出相应调整:
研究团队也与之前的生成全身人像的方法CoModGAN做了比较,都是基于左侧的人体进行面部的替换,显然,InsetGAN生成的面部更加自然:
论文共有6位作者,5位来自Adobe研究院,还有1位来自阿卜杜拉国王科技大学(KAUST)。
其中有Adobe的首席科学家Jingwan Lu,是PS 2020中智能肖像、皮肤平滑、着色和神经风格化等过滤器的主要算法贡献者,也是RealBrush笔刷合成器的开发者。
她目前领导的团队主要致力于利用大数据和生成性AI(比如GAN)来进行视觉内容的创造。
所以,准备好足不出户换身材了吗?(手动狗头)
论文地址:
https://arxiv.org/abs/2203.07293
参考链接:
[1]https://www.youtube.com/watch?v=YKFYEt5hvOo
[2]http://afruehstueck.github.io/insetgan/
ICCV和CVPR 2021论文和代码下载
后台回复:CVPR2021,即可下载CVPR 2021论文和代码开源的论文合集
后台回复:ICCV2021,即可下载ICCV 2021论文和代码开源的论文合集
后台回复:Transformer综述,即可下载最新的3篇Transformer综述PDF
CVer-Transformer交流群成立
扫描下方二维码,或者添加微信:CVer6666,即可添加CVer小助手微信,便可申请加入CVer-Transformer 微信交流群。另外其他垂直方向已涵盖:目标检测、图像分割、目标跟踪、人脸检测&识别、OCR、姿态估计、超分辨率、SLAM、医疗影像、Re-ID、GAN、NAS、深度估计、自动驾驶、强化学习、车道线检测、模型剪枝&压缩、去噪、去雾、去雨、风格迁移、遥感图像、行为识别、视频理解、图像融合、图像检索、论文投稿&交流、PyTorch、TensorFlow和Transformer等。
一定要备注:研究方向+地点+学校/公司+昵称(如Transformer+上海+上交+卡卡),根据格式备注,可更快被通过且邀请进群
▲扫码或加微信: CVer6666,进交流群
CVer学术交流群(知识星球)来了!想要了解最新最快最好的CV/DL/ML论文速递、优质开源项目、学习教程和实战训练等资料,欢迎扫描下方二维码,加入CVer学术交流群,已汇集数千人!
▲扫码进群
▲点击上方卡片,关注CVer公众号
整理不易,请点赞和在看