成为VIP会员查看完整内容
VIP会员码认证
首页
主题
发现
会员
服务
注册
·
登录
0
萌妹子变脸奥巴马!外国小哥微调StyleGAN2和FFHQ,真人视频秒变卡通视频
2020 年 9 月 28 日
新智元
新智元报道
来源:reddit等
编辑:QJP
【新智元导读】
近日,reddit上有网友发布了一段视频,萌妹子的视频通过微调StyleGAN2和FFHQ脸部模型来生成了卡通的奥巴马视频。
外国小哥
Nathan Shipley
使用卡通图像微调StyleGAN2和FFHQ 脸部模型(英伟达的模型可以制作出不存在的逼真人物) ,将这些真人视频转换成卡通版本。
模型融合发生在原有的 FFHQ 模型和微调的模型之间:「
控制广泛细节的底层来自Toon模型,中等和精细的细节来自真实的脸部模型
」,这使得卡通人物的脸看起来很真实。
然后,一张奥巴马总统的真实照片被编码到原始的 FFHQ 模型中,但是由这个新的混合网络生成,所以它看起来像是他的卡通版本。
作者Nathan Shipley是一个动画师和视觉特效艺术家,他表示从前需要几个星期的事情,现在只需要几分钟就能完成(至少对于低分辨率的人脸动画,在一些约束条件下,可以是这么快的速度)
将真实的奥巴马编码到FFHQ的隐空间需要花费几分钟的时间,生成卡通的奥巴马模型只需要大概20秒的时间,然后几乎瞬间生成框架。
「一阶运动」运行在2X 2080Ti上,StyleGAN2使用了TensorFlow,而「一阶运动」使用了Pytorch。
StyleGAN2和FFHQ使用「Layer Blending」来卡通化头像
FFHQ 模型是针对卡通人脸数据集进行微调的,结果是与初始 FFHQ 模型相混合的,控制整个脸型(眼睛大小等)的底层图层取自卡通模型。控制细节的层次取自于真实的 FFHQ 模型。
下面是一些示例图片,展示了Source、Tooned和Stylized的图片:
此外,作者一直在试图解决一个问题: 「使一张脸变卡通化的最佳方式是什么?」,因此建立了一个新的数据集和模型来观察不同层次的训练和混合的结果。
以下是奥巴马总统的一幅漫画:
这是奥巴马的真实图像通过迁移学习来调整训练次数(横轴)和细节(纵轴)得到的不同效果。
还有其他名人的一些卡通化后的效果:
下面是一些使用「一阶运动模型」和视频制作的Uma Thurman的动画效果:
StyleGan2--StyleGAN的升级版,解决了伪影问题
StyleGAN是目前最先进的高分辨率图像合成方法,已被证明可以在各种数据集上可靠地工作。除了逼真的人像,StyleGAN还可以用于生成其他动物,汽车甚至房间。
然而,StyleGAN并不完美,
最明显的缺陷是生成的图像有时包含斑点似的伪影(artifacts)
,而这一缺陷在StyleGAN 2上也被完美解决了。
去年底,NVIDIA的研究人员发布了StyleGAN的升级版——StyleGAN2,重点修复artifacts问题,并进一步提高了生成图像的质量。
图:StyleGAN2生成的人脸图像
StyleGAN2的主要改进包括:
生成的图像质量明显更好(FID分数更高、artifacts减少)
提出替代progressive growing的新方法,牙齿、眼睛等细节更完美
改善了Style-mixing
更平滑的插值(额外的正则化)
训练速度更快
(a)是原始的StyleGAN结构图,其中A表示从W学习的仿射变换,产生了一个style,
(b)展示了原始StyleGAN架构的细节。在这里,将AdaIN分解为先显式归一化再调制的模式,对每个特征图的均值和标准差进行操作。我们还注释了学习的权重(w)、偏差(b)和常量输入(c),并重新绘制了灰色框,使每个框都激活一个style。激活函数(leaky ReLU)总是在添加偏置后立即应用。
(c)对原始架构做了几处改动,包括在开始时删除了一些冗余操作,将b和B的添加移动到style的活动区域之外,并只调整每个feature map的标准差。
(d)是修改后的架构,使我们能够用「demodulation」操作代替 instance normalization,我们将demodulation操作应用于与每个卷积层相关的权重。
重新设计后的StyleGAN2消除了伪影,同时保留了完全的可控性。
同时,StyleGAN2还使用了新方法替代Progressive growing,细节更完美。StyleGAN2使用了一个skip generator和一个残差鉴别器,切换到这种设置显著地改进了FID和PPL。
这个萌妹子的项目目前还没有开源,不过相信这么好的效果,未来的开源是大概率的事情,到时大家可以亲自体验下。
参考链接:http://www.nathanshipley.com/gan
https://www.reddit.com/r/MachineLearning/comments/j0btow/p_toonifying_a_photo_using_stylegan_model/
登录查看更多
点赞并收藏
0
暂时没有读者
0
权益说明
本文档仅做收录索引使用,若发现您的权益受到侵害,请立即联系客服(微信: zhuanzhi02,邮箱:bd@zhuanzhi.ai),我们会尽快为您处理
相关内容
StyleGAN
关注
0
【硬核课】CMU《多模态机器学习》2020课程,附课件与视频
专知会员服务
136+阅读 · 2020年9月3日
一图搞定ML!2020版机器学习技术路线图,35页ppt
专知会员服务
93+阅读 · 2020年7月28日
少标签数据学习,54页ppt
专知会员服务
196+阅读 · 2020年5月22日
【SIGGRAPH 2020】人像阴影处理,Portrait Shadow Manipulation
专知会员服务
28+阅读 · 2020年5月19日
【CVPR2020-中科院计算所】弱监督语义分割的自监督等价注意力机制,Self-supervised Equivariant Attention Mechanism for Weakly Supervised Semantic Segmentation
专知会员服务
75+阅读 · 2020年4月10日
【CVPR2020】MSG-GAN:用于稳定图像合成的多尺度梯度GAN
专知会员服务
27+阅读 · 2020年4月6日
【推荐】用于解缠学习的半监督StyleGAN,Semi-Supervised StyleGAN for Disentanglement Learning
专知会员服务
35+阅读 · 2020年3月13日
姿势服装随心换-CVPR2019
专知会员服务
34+阅读 · 2020年1月26日
【GitHub实战】Pytorch实现的小样本逼真的视频到视频转换
专知会员服务
35+阅读 · 2019年12月15日
【CS294-158 《深度无监督学习》 2019年春】伯克利Pieter Abbeel新开课程(含视频PPT)
专知会员服务
28+阅读 · 2019年11月2日
比AI视频换脸还可怕!DeepMind新AI可生成逼真视频
智东西
10+阅读 · 2019年7月23日
加强版CycleGAN!贾佳亚等提出卡通图与真实人脸转换模型,看女神突破次元壁长啥样
量子位
10+阅读 · 2019年7月11日
【学界】造假AI又进化!只要一张照片,说话唱歌视频自动生成,降维打击Deepfakes丨已开源
GAN生成式对抗网络
12+阅读 · 2019年6月24日
女神背心变内衣,只需草图画几笔 | 中山+字节跳动等新研究
量子位
5+阅读 · 2019年6月7日
谷歌AI动画接龙:只用头尾两帧图像,片刻生成完整视频!
新智元
3+阅读 · 2019年5月31日
最强GAN修图魔术师:美颜生发摘眼镜、草绘秒变真人脸
极市平台
6+阅读 · 2019年2月28日
Github项目推荐 | SC-FEGAN:基于GAN的人脸照片涂鸦编辑
AI研习社
13+阅读 · 2019年2月22日
用英伟达StyleGAN生成老婆吧,他生成了一百多只明日香 | 开源代码
量子位
7+阅读 · 2019年2月13日
【学界】画个草图生成2K高清视频,这份效果惊艳研究值得你跑一跑
GAN生成式对抗网络
8+阅读 · 2018年8月26日
神奇女侠演员下海拍片?都是 ML 算法搞的……这是如何做到的?
Linux爱好者
18+阅读 · 2017年12月17日
Welfare Guarantees in Schelling Segregation
Arxiv
0+阅读 · 2020年12月3日
Dual-Branch Network with Dual-Sampling Modulated Dice Loss for Hard Exudate Segmentation from Colour Fundus Images
Arxiv
0+阅读 · 2020年12月3日
Reciprocal maximum likelihood degrees of diagonal linear concentration models
Arxiv
0+阅读 · 2020年11月28日
Talking-Heads Attention
Arxiv
15+阅读 · 2020年3月5日
Revisiting CycleGAN for semi-supervised segmentation
Arxiv
3+阅读 · 2019年8月30日
ShelfNet for Real-time Semantic Segmentation
Arxiv
7+阅读 · 2018年12月10日
Weakly Supervised Object Detection in Artworks
Arxiv
4+阅读 · 2018年10月5日
Large Scale GAN Training for High Fidelity Natural Image Synthesis
Arxiv
5+阅读 · 2018年9月28日
Virtual-to-Real: Learning to Control in Visual Semantic Segmentation
Arxiv
4+阅读 · 2018年3月18日
CapsuleGAN: Generative Adversarial Capsule Network
Arxiv
10+阅读 · 2018年2月17日
VIP会员
自助开通(推荐)
客服开通
详情
相关主题
StyleGAN
微调
模型融合
混合
英伟达(NVIDIA)
数据集
相关VIP内容
【硬核课】CMU《多模态机器学习》2020课程,附课件与视频
专知会员服务
136+阅读 · 2020年9月3日
一图搞定ML!2020版机器学习技术路线图,35页ppt
专知会员服务
93+阅读 · 2020年7月28日
少标签数据学习,54页ppt
专知会员服务
196+阅读 · 2020年5月22日
【SIGGRAPH 2020】人像阴影处理,Portrait Shadow Manipulation
专知会员服务
28+阅读 · 2020年5月19日
【CVPR2020-中科院计算所】弱监督语义分割的自监督等价注意力机制,Self-supervised Equivariant Attention Mechanism for Weakly Supervised Semantic Segmentation
专知会员服务
75+阅读 · 2020年4月10日
【CVPR2020】MSG-GAN:用于稳定图像合成的多尺度梯度GAN
专知会员服务
27+阅读 · 2020年4月6日
【推荐】用于解缠学习的半监督StyleGAN,Semi-Supervised StyleGAN for Disentanglement Learning
专知会员服务
35+阅读 · 2020年3月13日
姿势服装随心换-CVPR2019
专知会员服务
34+阅读 · 2020年1月26日
【GitHub实战】Pytorch实现的小样本逼真的视频到视频转换
专知会员服务
35+阅读 · 2019年12月15日
【CS294-158 《深度无监督学习》 2019年春】伯克利Pieter Abbeel新开课程(含视频PPT)
专知会员服务
28+阅读 · 2019年11月2日
热门VIP内容
开通专知VIP会员 享更多权益服务
《支持 ML/AI 的下一代智能自主网络系统:性能提升与管理》177页
《飞行训练指导:夜间熟悉》152页
数据:联合作战的新弹药
《混合现实飞行模拟器中的夜视镜仿真:无缝集成真实世界》最新54页
相关资讯
比AI视频换脸还可怕!DeepMind新AI可生成逼真视频
智东西
10+阅读 · 2019年7月23日
加强版CycleGAN!贾佳亚等提出卡通图与真实人脸转换模型,看女神突破次元壁长啥样
量子位
10+阅读 · 2019年7月11日
【学界】造假AI又进化!只要一张照片,说话唱歌视频自动生成,降维打击Deepfakes丨已开源
GAN生成式对抗网络
12+阅读 · 2019年6月24日
女神背心变内衣,只需草图画几笔 | 中山+字节跳动等新研究
量子位
5+阅读 · 2019年6月7日
谷歌AI动画接龙:只用头尾两帧图像,片刻生成完整视频!
新智元
3+阅读 · 2019年5月31日
最强GAN修图魔术师:美颜生发摘眼镜、草绘秒变真人脸
极市平台
6+阅读 · 2019年2月28日
Github项目推荐 | SC-FEGAN:基于GAN的人脸照片涂鸦编辑
AI研习社
13+阅读 · 2019年2月22日
用英伟达StyleGAN生成老婆吧,他生成了一百多只明日香 | 开源代码
量子位
7+阅读 · 2019年2月13日
【学界】画个草图生成2K高清视频,这份效果惊艳研究值得你跑一跑
GAN生成式对抗网络
8+阅读 · 2018年8月26日
神奇女侠演员下海拍片?都是 ML 算法搞的……这是如何做到的?
Linux爱好者
18+阅读 · 2017年12月17日
相关论文
Welfare Guarantees in Schelling Segregation
Arxiv
0+阅读 · 2020年12月3日
Dual-Branch Network with Dual-Sampling Modulated Dice Loss for Hard Exudate Segmentation from Colour Fundus Images
Arxiv
0+阅读 · 2020年12月3日
Reciprocal maximum likelihood degrees of diagonal linear concentration models
Arxiv
0+阅读 · 2020年11月28日
Talking-Heads Attention
Arxiv
15+阅读 · 2020年3月5日
Revisiting CycleGAN for semi-supervised segmentation
Arxiv
3+阅读 · 2019年8月30日
ShelfNet for Real-time Semantic Segmentation
Arxiv
7+阅读 · 2018年12月10日
Weakly Supervised Object Detection in Artworks
Arxiv
4+阅读 · 2018年10月5日
Large Scale GAN Training for High Fidelity Natural Image Synthesis
Arxiv
5+阅读 · 2018年9月28日
Virtual-to-Real: Learning to Control in Visual Semantic Segmentation
Arxiv
4+阅读 · 2018年3月18日
CapsuleGAN: Generative Adversarial Capsule Network
Arxiv
10+阅读 · 2018年2月17日
大家都在搜
MoE
洛克菲勒
大型语言模型
空战战术
ETHZ博士论文
汽车智能化
RE-NET
无人艇
智能推荐
出海产品从 0 到 1 该怎么做
Top
提示
微信扫码
咨询专知VIP会员与技术项目合作
(加微信请备注: "专知")
微信扫码咨询专知VIP会员
Top