【导读】生成对抗网络(GAN/Generative Adversarial Networks)是Ian Goodfellow在2014发表的文章:Generative Adversarial Networks,中最先提出的。GAN在近几年也是机器学习、计算机视觉等方向的研究热点之一。今天给大家带来的是Shaobo GUAN利用TL-GAN生成定制化的逼真面孔照片项目(附Slides下载和代码链接)。
Shaobo GUAN简介:
Insight Data Science的AI研究员,计算和认知神经科学博士,研究兴趣机器学习。个人LinkedIn主页:https://www.linkedin.com/in/shaobo-guan/
我们知道各种版本GAN(如PG-GAN)可以从潜在空间(latent space )中的随机噪声向量生成随机逼真的图像,但是却无法控制图像生成的过程,也就无法定制化的生成图像,控制生成图像的特征。
由于图像由潜在空间中的初始的随机噪声向量生成的,所以如果我们可以理解并控制这些初始的随机噪声向量,那么就可以控制图像的生成过程。TL-GAN(transparent latent-space GAN)在已有训练好的GAN生成器的基础上,将生成器和特征提取器网络组合(coupled feature extractor network)发现潜在空间的特征轴(feature axes)。 当向量沿着潜在空间中的特征轴移动时,生成的图像就会沿着该特征发生变形,这就使得受控合成和编辑图像成为可能。
TL-GAN的idea:
TL-GAN的优点:
速度更快;
可以灵活的配置特征提取器提取你想要的图像特征;
GitHub上项目代码链接:
https://github.com/SummitKwan/transparent_latent_gan
参考链接:
https://blog.insightdatascience.com/generating-custom-photo-realistic-faces-using-ai-d170b1b59255
请关注专知公众号(扫一扫最下面专知二维码,或者点击上方蓝色专知)
附全部Slides内容:
-END-
专 · 知
人工智能领域26个主题知识资料全集获取与加入专知人工智能服务群: 欢迎微信扫一扫加入专知人工智能知识星球群,获取专业知识教程视频资料和与专家交流咨询!
请PC登录www.zhuanzhi.ai或者点击阅读原文,注册登录专知,获取更多AI知识资料!
请加专知小助手微信(扫一扫如下二维码添加),加入专知主题群(请备注主题类型:AI、NLP、CV、 KG等)交流~
AI 项目技术 & 商务合作:bd@zhuanzhi.ai, 或扫描上面二维码联系!
请关注专知公众号,获取人工智能的专业知识!
点击“阅读原文”,使用专知