【干货】 计算机也会ps图片:TL-GAN(附代码和sildes下载)

【导读】生成对抗网络(GAN/Generative Adversarial Networks)是Ian Goodfellow在2014发表的文章:Generative Adversarial Networks,中最先提出的。GAN在近几年也是机器学习、计算机视觉等方向的研究热点之一。今天给大家带来的是Shaobo GUAN利用TL-GAN生成定制化的逼真面孔照片项目(附Slides下载和代码链接)。


Shaobo GUAN简介:

Insight Data Science的AI研究员,计算和认知神经科学博士,研究兴趣机器学习。个人LinkedIn主页:https://www.linkedin.com/in/shaobo-guan/


我们知道各种版本GAN(如PG-GAN)可以从潜在空间(latent space )中的随机噪声向量生成随机逼真的图像,但是却无法控制图像生成的过程,也就无法定制化的生成图像,控制生成图像的特征。


由于图像由潜在空间中的初始的随机噪声向量生成的,所以如果我们可以理解并控制这些初始的随机噪声向量,那么就可以控制图像的生成过程。TL-GAN(transparent latent-space GAN)在已有训练好的GAN生成器的基础上,将生成器和特征提取器网络组合(coupled feature extractor network)发现潜在空间的特征轴(feature axes)。 当向量沿着潜在空间中的特征轴移动时,生成的图像就会沿着该特征发生变形,这就使得受控合成和编辑图像成为可能。


TL-GAN的idea:

  • 已训练好的GAN

  • 图片特征提取

  • 发现特征轴(TL-GAN架构)



  • 利用特征轴控制图像生成过程


TL-GAN的优点:

  1. 速度更快;

  2. 可以灵活的配置特征提取器提取你想要的图像特征



GitHub上项目代码链接:

https://github.com/SummitKwan/transparent_latent_gan

参考链接

https://blog.insightdatascience.com/generating-custom-photo-realistic-faces-using-ai-d170b1b59255



请关注专知公众号(扫一扫最下面专知二维码,或者点击上方蓝色专知)

  • 后台回复“TLGAN” 就可以获取该Slides下载链接~ 

附全部Slides内容:




-END-

专 · 知


人工智能领域26个主题知识资料全集获取与加入专知人工智能服务群: 欢迎微信扫一扫加入专知人工智能知识星球群,获取专业知识教程视频资料和与专家交流咨询!


请PC登录www.zhuanzhi.ai或者点击阅读原文,注册登录专知,获取更多AI知识资料!


请加专知小助手微信(扫一扫如下二维码添加),加入专知主题群(请备注主题类型:AI、NLP、CV、 KG等)交流~

 AI 项目技术 & 商务合作:bd@zhuanzhi.ai, 或扫描上面二维码联系!

请关注专知公众号,获取人工智能的专业知识!

点击“阅读原文”,使用专知

展开全文
Top
微信扫码咨询专知VIP会员