宫崎骏动画里的新垣结衣见过没？这个开源动漫生成器让你的照片秒变手绘日漫

会员服务 ·

宫崎骏动画里的新垣结衣见过没？这个开源动漫生成器让你的照片秒变手绘日漫

2020 年 3 月 26 日 机器之心

机器之心报道

参与：肖清、思

随手拍张照片，顺势转换为宫崎骏、新海诚等日漫大师的手绘风格作品，这个专门生成动漫图像的 GAN，实测很好用。

机器之心根据真实店铺照片生成的效果图，一度以为，这就是某个日漫番剧的截图。

尽管最近 2019 年的图灵奖颁给了计算机图形学、颁给了皮克斯 3D 动画，但很多人可能认为二维动漫更有意思一些。像宫崎骏、新海诚这些大师手绘下的动漫，才有了灵魂，张张都能成为壁纸，而整个日漫也以二维为核心。

如果有模型能将真实画面转化为日漫风格的手绘画面，那一定非常炫酷。最近机器之心发现确实有这些模型，从 CartoonGAN 到 AnimeGAN 都能生成非常有意思的图像。

这里有一个 TensorFlow 新项目，它实现了 AnimeGAN，并提供了预训练模型。也就是说，我们下载后可以直接试试生成效果。作为日漫风格的爱好者，我们很快就试用了一下新项目。

项目地址：https://github.com/TachibanaYoshino/AnimeGAN

虽然原项目给出的最佳示例很多都是街景，但我们发现各种场景也都还行，如下是我们试用的原图与生成效果。看看第一张樱花道生成效果，忽然有一种《千与千寻》的感觉。

如果只针对人物，转换效果也是非常不错的。我们尝试将新垣结衣的照片输入 AnimeGAN 模型，然后就有如下这种神奇的画风，感觉直接用到动漫里也没什么问题了。

在原 GitHub 项目中，作者还给了非常多的示例，上面只是机器之心试用的结果，你也可以来用一用。

AnimeGAN

整个项目实现的是论文「AnimeGAN: a novel lightweight GAN for photo animation」中所提方法，作者在论文中分别将 AnimeGAN 与 CartoonGAN、ComixGAN 进行对比。

从图中可以看到，AnimeGAN 在细节方面的表现要优于以上两种方法，色彩相对而言更加自然，涂抹感也没有那么强烈。最明显的是第二行的效果图，使用 AnimeGAN 生成的漫画更加接近宫崎骏的画风。

方法简介

对于这个项目的 AnimeGAN，如下所示为 AnimeGAN 所采用的生成器网络与判别器网络。看起来模型整体是比较常规地一个卷积神经网络，但它会采用实例归一化以及新型的 LReLU 激活函数。

除了架构细节上的更新外，作者还提出了以下三个新的损失函数：

灰度风格（grayscale style）loss
灰度对抗（grayscale adversarial）loss
色彩重构（color reconstruction）loss

这些损失函数能够让生成图片的风格更加接近于真实的漫画风格。

下表比较了 ACartoonGAN 与 AnimeGAN 的模型大小与推理速度。可以明显看出，AnimeGAN 是个相对轻量级的 GAN，具有更少的参数量以及更快的推理速度。

总体来说，新提出来的 AnimeGAN 是一种轻量级的生成对抗模型，它采用了较少的模型参数，以及引入格拉姆矩阵（Gram matrix）来加强照片的风格。研究者的方法需要采用一系列真实图片与一系列动漫图片做训练，且这些图片并不需要成对匹配，这就表明训练数据非常容易获得。

项目实测

我们在 Ubuntu 18.04 下对本项目进行了测试，相关依赖环境如下：

python 3.6.8
tensorflow-gpu 1.8
opencv
tqdm
numpy
glob
argparse

这些依赖项可以说都是 CV 中常用的扩展库，我们就不用费尽心思去解决各种依赖环境冲突的问题了，这里给个好评。

以下是本项目的训练及测试详细流程。我们首先将 AnimeGAN 项目克隆到本地，在 Jupyter notebook 中输入：

!git clone https://github.com/TachibanaYoshino/AnimeGAN

将工作目录切换到 AnimeGAN：

import os
os.chdir('AnimeGAN')
print(os.getcwd())

接下来下载项目作者提供的预训练模型，使用 vim download_staffs.sh 创建一个 Shell 文件，输入如下命令：

URL=https://github.com/TachibanaYoshino/AnimeGAN/releases/download/Haoyao-style_V1.0/Haoyao-style.zip
ZIP_FILE=./checkpoint/Haoyao-style.zip
TARGET_DIR=./checkpoint/saved_model

mkdir -p ./checkpoint
wget -N $URL -O $ZIP_FILE
mkdir -p $TARGET_DIR
unzip $ZIP_FILE -d $TARGET_DIR
rm $ZIP_FILE

DatesetURL=https://github.com/TachibanaYoshino/AnimeGAN/releases/download/dataset-1/dataset.zip
ZIP_FILE=./dataset.zip
TARGET_DIR=./dataset

rm -rf dataset
wget -N $DatesetURL -O $ZIP_FILE
unzip $ZIP_FILE -d $TARGET_DIR
rm $ZIP_FILE

VGG_FILE=./vgg19_weight/vgg19.npy
wget --load-cookies /tmp/cookies.txt "https://docs.google.com/uc?export=download&confirm=$(wget --quiet --save-cookies /tmp/cookies.txt --keep-session-cookies --no-check-certificate 'https://docs.google.com/uc?export=download&id=1U5HCRpZWAbDVLipNoF8t0ZHpwCRX7kdF' -O- | sed -rn 's/.*confirm=([0-9A-Za-z_]+).*/\1\n/p')&id=1U5HCRpZWAbDVLipNoF8t0ZHpwCRX7kdF" -O $VGG_FILE && rm -rf /tmp/cookies.txt

保存后退出，以上命令会将预训练的模型、vgg19 权重以及训练数据集下载并保存到其对应目录下。在 notebook 中运行：

!bash download_staffs.sh

至此即完成所有准备工作，运行如下代码就可以对模型进行训练了：

!python main.py --phase train --dataset Hayao --epoch 101 --init_epoch 1

AnimeGAN 的训练过程如下图所示：

当进行测试时，我们需要将用于测试的图片保存到 dataset/test/real 目录下，并运行如下代码：

!python test.py --checkpoint_dir checkpoint/saved_model --test_dir dataset/test/real --style_name H

当看到以上输出说明程序已经成功运行完成，生成结果保存在 results 文件夹下。可以看到，在 P100 GPU 上生成一幅图片需要大约 2.3 秒左右。

本文为机器之心报道，转载请联系本公众号获得授权。

✄------------------------------------------------

加入机器之心（全职记者 / 实习生）：hr@jiqizhixin.com

投稿或寻求报道：content @jiqizhixin.com

广告 & 商务合作：bd@jiqizhixin.com

登录查看更多

相关内容

GAN

关注 91

GAN：生成性对抗网，深度学习模型的一种，在神经网络模型中引入竞争机制，非常流行。

【SIGGRAPH 2020】人像阴影处理，Portrait Shadow Manipulation

专知会员服务

29+阅读 · 2020年5月19日

Google 发布图片配对基准及挑战：从系列图像重建三维物体和建筑物

专知会员服务

40+阅读 · 2020年4月4日

【CVPR2020-斯坦福】从RGB-D扫描对抗纹理优化，Adversarial Texture Optimization

专知会员服务

17+阅读 · 2020年3月21日

CVPR 2020 论文开源项目合集

专知会员服务

110+阅读 · 2020年3月12日

姿势服装随心换-CVPR2019

专知会员服务

36+阅读 · 2020年1月26日

必读的10篇 CVPR 2019【生成对抗网络】相关论文和代码

专知会员服务

33+阅读 · 2020年1月10日

完整版！《GAN实战：生成对抗网络深度学习》在线书与代码，牛津大学Jakub著作 (附下载)

专知会员服务

354+阅读 · 2019年12月25日

【GitHub实战】Pytorch实现的小样本逼真的视频到视频转换

专知会员服务

36+阅读 · 2019年12月15日

【ICIP 2019 Tutorials】图像到图像的转换（Image-to-Image Translation）,英伟达研究员Ming-Yu Liu

专知会员服务

27+阅读 · 2019年8月10日

学习一个宫崎骏画风的图像风格转换GAN

AI科技评论

18+阅读 · 2020年3月13日

图像分区域合成，这个新方法实现了人脸的「精准整容」

机器之心

6+阅读 · 2019年12月16日

能生成逼真图像的不只有 GAN

机器学习算法与Python学习

8+阅读 · 2019年6月6日

Snapchat的新滤镜，将我怀里的女朋友秒变胡茬大汉

腾讯创业

4+阅读 · 2019年5月17日

草图秒变风景照，英伟达神笔马良GaoGAN终于开源了

新智元

14+阅读 · 2019年4月17日

项目 | 基于GAN的人脸照片涂鸦编辑

机器学习算法与Python学习

5+阅读 · 2019年3月1日

Github项目推荐 | SC-FEGAN：基于GAN的人脸照片涂鸦编辑

AI研习社

13+阅读 · 2019年2月22日

用英伟达StyleGAN生成老婆吧，他生成了一百多只明日香 | 开源代码

量子位

7+阅读 · 2019年2月13日

教程 | 如何使用变分自编码器VAE生成动漫人物形象

机器之心

3+阅读 · 2018年4月14日

ST-CGAN 用GAN实现阴影检测和阴影去除

极市平台

7+阅读 · 2017年12月14日

Revisiting CycleGAN for semi-supervised segmentation

Arxiv

3+阅读 · 2019年8月30日

GAN Dissection: Visualizing and Understanding Generative Adversarial Networks

Arxiv

11+阅读 · 2018年12月8日

CapsuleGAN: Generative Adversarial Capsule Network

Arxiv

4+阅读 · 2018年9月25日

Sem-GAN: Semantically-Consistent Image-to-Image Translation

Arxiv

4+阅读 · 2018年7月12日

GANE: A Generative Adversarial Network Embedding

Arxiv

5+阅读 · 2018年5月21日

Attentive Generative Adversarial Network for Raindrop Removal from a Single Image

Arxiv

3+阅读 · 2018年5月6日

XGAN: Unsupervised Image-to-Image Translation for Many-to-Many Mappings

Arxiv

3+阅读 · 2018年4月25日

Understanding Humans in Crowded Scenes: Deep Nested Adversarial Learning and A New Benchmark for Multi-Human Parsing

Arxiv

3+阅读 · 2018年4月10日

DeblurGAN: Blind Motion Deblurring Using Conditional Adversarial Networks

Arxiv

9+阅读 · 2018年1月16日

StarGAN: Unified Generative Adversarial Networks for Multi-Domain Image-to-Image Translation

Arxiv

5+阅读 · 2017年11月24日

VIP会员