头像秒变像素风,宅男大叔自学AI打造大师级水准,火爆推特

2020 年 8 月 18 日 极市平台
↑ 点击 蓝字  关注极市平台

来源丨量子位

极市导读

 

最近,一位日本宅男大叔佐藤做了一个AI生成肖像画的网站AI Gahaku,10天内用户访问量从0暴增到100万,引爆推特。>>就在明天,极市直播:极市直播丨张志鹏:Ocean/Ocean+: 实时目标跟踪分割算法,小代价,大增益|ECCV2020

最近,一位日本宅 男大 叔佐藤做了一个AI生成肖像画的网站AI Gahaku,10天内用户访问量从0暴增到 100万 ,引爆推特。
简单易操作,上传一张人脸照片,就能生成一张 大师级肖像画
而比技术更神奇的是佐藤自己,因为他是自学AI做出来的,不得不佩服的宅男创造力。
佐藤患有 阿斯伯格症 ——也被俗称成“社交恐惧症”,名副其实的天才病,一般来说,此类患者会在某个领域具有特殊潜能,但不适应普通人的生活。
当然,佐藤的技能点就点在了AI上。

pix2pix,TensorFlow内置的cGAN模型

让大叔此次闻名的AI技术,就是是大名鼎鼎的GAN的变种。
此次的人脸肖像画生成技术,就是大叔在TensorFlow内置的cGAN(条件生成对抗网络)中的 pix2pix 模型上改造而来。
不同于GAN的技术通用性,cGAN更强调特定场景下的发挥,比如AI Gahaku,就只能针对 人脸 ,如果用户上传的是猫脸,则是无法生成结果的。
GAN的特点在于损失函数的自行计算和自动更新,这使得GAN本身具有和迁移学习结合的潜质,在近年来的发展路径上看,更多是把GAN当做手段,去实现迁移学习提出的目标,迁移学习为应用GAN提供具体指向。
TensorFlow的内置pix2pix的是基于cGAN的图像对图像翻译的模型,模型本身已经成熟,直接调用便可运用到对黑白图像着色、图像风格变化等场景的使用上来。
具体到大叔的使用上,利用pix2pix模型,大叔其实是将模型限定在 大师肖像画 的生成上,这也体现了模型本身强大的扩展性。
如何使用,都取决于你自身。
在佐藤的另一款作品PixelMe中,同样使用pix2pix技术,但是生成的是8bit的像素风格头像,一个模型,多种用途。
当然,实际效果因人而异,毕竟严格来说,大叔是在对既有模型进行二次开发,原有的算法和数据结构并未改变,因此性能和效果受到原有模型的限制。

宅男的AI进阶之路

大叔人生经历可以说复杂,从大学退学后,先后干过面包师,参加过护士学校培训课程,但觉得都都不太适合自己,直到他决定运用自己的才智,投身到AI的事业当中去。
那说干就干,就从TensorFlow学起吧。
借助Google Colab的算力资源,大叔从头按着TensorFlow教程学起,不过大叔也确实适合干AI,而不是去蒸糕点。
在学习过程中,佐藤找到了适合自己的方向,迁移学习和GAN,可以较好的实现图像的再生成,使用不同的图像训练数据集,可以针对具体场景进行学习和生成。
GAN属于典型的非监督学习方法,核心原理是让两个神经网络进行“对抗”,通过不断优化参数来得到最优结果,自我博弈。
这种技术主要用在计算机视觉领域,这也是佐藤选择GAN的主要原因。
得益于Google的慷慨,大叔使用的网站服务器和算力资源都较为便宜,大约为一天20美刀,大叔表示,在可接受的能力范围之内,短期不会寻求商业化。

AI for Everyone!

在红了之后,大叔也没飘。
他认为这是在做自己感兴趣的东西,而不是为了经济利益。
出于对技术的热爱,佐藤开始了自己的AI之路,并在两年之后便能上线应用。
这份为梦想而不懈努力的奋斗精神,才是真正值得我们学习的。
毕竟,不是每个人有勇气去自学AI。
参考链接:
https://cloud.google.com/blog/products/ai-machine-learning/using-google-cloud-platform-free-tier-to-scale-out-an-ai-servicehttps://www.tensorflow.org/tutorials/generative/pix2pix
https://ai-art.tokyo/en/#/https://pixel-me.tokyo/en/


推荐阅读



    添加极市小助手微信(ID : cvmart2),备注:姓名-学校/公司-研究方向-城市(如:小极-北大-目标检测-深圳),即可申请加入极市目标检测/图像分割/工业检测/人脸/医学影像/3D/SLAM/自动驾驶/超分辨率/姿态估计/ReID/GAN/图像增强/OCR/视频理解等技术交流群:月大咖直播分享、真实项目需求对接、求职内推、算法竞赛、干货资讯汇总、与 10000+来自港科大、北大、清华、中科院、CMU、腾讯、百度等名校名企视觉开发者互动交流~

    △长按添加极市小助手

    △长按关注极市平台,获取 最新CV干货

    觉得有用麻烦给个在看啦~   
    登录查看更多
    0

    相关内容

    带条件约束的GAN,在生成模型(D)和判别模型(G)的建模中均引入条件变量y(conditional variable y),使用额外信息y对模型增加条件,可以指导数据生成过程。
    系列教程GNN-algorithms之七:《图同构网络—GIN》
    专知会员服务
    47+阅读 · 2020年8月9日
    流畅的Python 中英文版 PDF 高清电子书
    专知会员服务
    80+阅读 · 2020年8月2日
    【ICML 2020 】小样本学习即领域迁移
    专知会员服务
    77+阅读 · 2020年6月26日
    注意力图神经网络的多标签文本分类
    专知会员服务
    111+阅读 · 2020年3月28日
    【干货书】机器学习Python实战教程,366页pdf
    专知会员服务
    338+阅读 · 2020年3月17日
    姿势服装随心换-CVPR2019
    专知会员服务
    34+阅读 · 2020年1月26日
    【GitHub实战】Pytorch实现的小样本逼真的视频到视频转换
    专知会员服务
    35+阅读 · 2019年12月15日
    年薪48万的程序员,他究竟做对了什么?
    机器学习算法与Python学习
    7+阅读 · 2018年12月28日
    开源 AI 技术潜在危机爆发,被大肆用于色情方向
    宅男福音deepfakes开源了
    AI前线
    9+阅读 · 2018年1月31日
    Arxiv
    4+阅读 · 2018年12月20日
    Phrase-Based & Neural Unsupervised Machine Translation
    Arxiv
    4+阅读 · 2018年4月17日
    Arxiv
    6+阅读 · 2018年4月4日
    Arxiv
    6+阅读 · 2018年1月14日
    VIP会员
    相关VIP内容
    系列教程GNN-algorithms之七:《图同构网络—GIN》
    专知会员服务
    47+阅读 · 2020年8月9日
    流畅的Python 中英文版 PDF 高清电子书
    专知会员服务
    80+阅读 · 2020年8月2日
    【ICML 2020 】小样本学习即领域迁移
    专知会员服务
    77+阅读 · 2020年6月26日
    注意力图神经网络的多标签文本分类
    专知会员服务
    111+阅读 · 2020年3月28日
    【干货书】机器学习Python实战教程,366页pdf
    专知会员服务
    338+阅读 · 2020年3月17日
    姿势服装随心换-CVPR2019
    专知会员服务
    34+阅读 · 2020年1月26日
    【GitHub实战】Pytorch实现的小样本逼真的视频到视频转换
    专知会员服务
    35+阅读 · 2019年12月15日
    相关论文
    Arxiv
    4+阅读 · 2018年12月20日
    Phrase-Based & Neural Unsupervised Machine Translation
    Arxiv
    4+阅读 · 2018年4月17日
    Arxiv
    6+阅读 · 2018年4月4日
    Arxiv
    6+阅读 · 2018年1月14日
    Top
    微信扫码咨询专知VIP会员