DeOldify：用GAN为黑白照片重新着色 - 专知

会员服务 ·

0

DeOldify：用GAN为黑白照片重新着色

2018 年 11 月 2 日 论智

来源：GitHub

编译：Bot

编者按：今天，一位reddit网友分享了自己近期的一个项目，他训练了一个用于着色和恢复旧图像的深度学习模型，效果很不错。虽然是未完成品，我们在这里先把这个项目简单介绍给大家，感兴趣的读者可以去Github上继续围观。

着色效果

鉴于模型的目标是为黑白旧照片着色，我们先看看它的输出效果。

1890年俄罗斯圣彼得堡皇家剧院的芭蕾舞剧“睡美人”剧照

在客厅休息的女人（1920年，瑞典）

医学生和摆好pose的骨架（1980年）

夏威夷冲浪者（1890年）

Whirling Horse（1898年）

Miller＆Bert Shoemaker经营的冷饮机柜台（1899年）

19世纪80年代的巴黎

鸟瞰爱丁堡（1920s）

德克萨斯妇女（1938年）

人们围观电视机（1936年）

地理课（1850年）

吸鸦片者（1880年）

旧金山朴次茅斯广场（1851年）

技术细节

根据作者的介绍，这是一个基于深度学习的模型，它主要结合了以下几种方法：

自我注意生成对抗网络（SAGAN）。除了生成器是个预训练的Unet，作者参考了SAGAN那篇论文，把去年以来非常火的谱归一化和注意力机制引入自己的模型。他也尝试过Wasserstein GAN，但效果不尽如人意。
Progressive Growing of GAN（arxiv.org/abs/1706.08500）。作者借鉴了这篇论文中提出的训练结构，让神经网络层数保持不变，逐步改变输入的大小、调整学习率，以确保图像大小的成功转换。而这种方法也确实有效——不进加快了训练速度，更稳定，可扩展性也更强。
两倍规模更新规则（TTUR）（arxiv.org/abs/1706.08500）。这也是SAGAN用来稳定训练的方法之一，它本质上不难理解，就是一对一的生成器/判别器迭代和判别器学习率更高。
生成器的损失。这分为两部分：其一是VGG16的基本感知损失（或者说特征损失），也就是生成器输出的图像和真实图像的偏差；其二是判别器的损失。感知损失本身并不足以产生良好的结果，相反地，它会鼓励生成器输出一堆带棕色/绿色/蓝色色块的图像去“欺骗”判别器。所以为了避免这个问题，最关键的一点是意识到GAN实际上是在学习损失函数，损失设置会极大影响模型最后的性能。

这个模型优点是几乎对所有类别的图像都有用，这在上一节中已经得到印证。更重要的是，它还只是一个组件，并不是一个完整的、成熟的成果。作者也表示，他的下一个项目是“defade”模型，就是继续训练相同的模型重建图像，解决现阶段模型存在的对比度/亮度失真等问题，下图是改进效果：

存在的问题

在开发的过程中，作者也发现了DeOldify的许多问题，它们到目前都还没有一个准确的结论：

模型需要事先微调图像大小才能获得最好的输出结果，在生成图像时，模型显然对图像的纵横比/大小有一定的依赖性。
这个模型对内存的要求很高，1080TI完全不够用。
不能在Unet上用零填充，因为模型输出的右侧和底边会出现奇怪的边框。
模型更喜欢把衣服着色为蓝色。

除了上面精选出的优良结果，模型确实也有不少着色失败的例子，比如下面这只“红色”的手：

塞内卡土著（1908年）

Github地址：github.com/jantic/DeOldify/blob/master/README.md

星标论智，每天获取最新资讯

登录查看更多

33

相关内容

GAN

GAN：生成性对抗网，深度学习模型的一种，在神经网络模型中引入竞争机制，非常流行。

【Google】平滑对抗训练，Smooth Adversarial Training

【Google】平滑对抗训练，Smooth Adversarial Training

专知会员服务

49+阅读 · 2020年7月4日

【中科院自动化所】视觉对抗样本生成技术概述

【中科院自动化所】视觉对抗样本生成技术概述

专知会员服务

37+阅读 · 2020年4月15日

【CVPR2020】MSG-GAN:用于稳定图像合成的多尺度梯度GAN

【CVPR2020】MSG-GAN:用于稳定图像合成的多尺度梯度GAN

专知会员服务

29+阅读 · 2020年4月6日

【FAIR-CVPR2020】PIFuHD:多级像素对齐隐式功能，实现高分辨率三维人体数字化

【FAIR-CVPR2020】PIFuHD:多级像素对齐隐式功能，实现高分辨率三维人体数字化

专知会员服务

29+阅读 · 2020年4月5日

【CVPR2020-斯坦福】从RGB-D扫描对抗纹理优化，Adversarial Texture Optimization

【CVPR2020-斯坦福】从RGB-D扫描对抗纹理优化，Adversarial Texture Optimization

专知会员服务

17+阅读 · 2020年3月21日

【Google AI应用】利用机器学习来“短时预报”高分辨率的降水:Using Machine Learning to “Nowcast” Precipitation in High Resolution

【Google AI应用】利用机器学习来“短时预报”高分辨率的降水:Using Machine Learning to “Nowcast” Precipitation in High Resolution

专知会员服务

22+阅读 · 2020年1月15日

完整版！《GAN实战：生成对抗网络深度学习》在线书与代码，牛津大学Jakub著作 (附下载)

完整版！《GAN实战：生成对抗网络深度学习》在线书与代码，牛津大学Jakub著作 (附下载)

专知会员服务

354+阅读 · 2019年12月25日

【AAAI2020论文】分类感知的生成式对抗网络，具有分类文本生成的层次进化学习 (附pdf)

专知会员服务

21+阅读 · 2019年11月19日

【NeurIPS2019】基于累加噪声的对抗鲁棒性（Certified Adversarial Robustness with Additive Noise），Changyou Chen

【NeurIPS2019】基于累加噪声的对抗鲁棒性（Certified Adversarial Robustness with Additive Noise），Changyou Chen

专知会员服务

36+阅读 · 2019年11月12日

生成式对抗网络GAN异常检测

生成式对抗网络GAN异常检测

专知会员服务

118+阅读 · 2019年10月13日

能生成逼真图像的不只有 GAN

能生成逼真图像的不只有 GAN

机器学习算法与Python学习

8+阅读 · 2019年6月6日

AI还原半世纪前的黑白电影和照片：效果惊艳在线可玩，网友大呼“鹅妹子嘤”

AI还原半世纪前的黑白电影和照片：效果惊艳在线可玩，网友大呼“鹅妹子嘤”

量子位

11+阅读 · 2019年5月7日

O-GAN：简单修改，让GAN的判别器变成一个编码器！

O-GAN：简单修改，让GAN的判别器变成一个编码器！

PaperWeekly

4+阅读 · 2019年3月8日

为了修复打码女神脸，他们提出二阶段生成对抗网络EdgeConnect

为了修复打码女神脸，他们提出二阶段生成对抗网络EdgeConnect

机器之心

4+阅读 · 2019年1月6日

拆台BigGan：“失败”图像生成集锦

拆台BigGan：“失败”图像生成集锦

论智

5+阅读 · 2018年11月19日

旧照片着色修复神器！自注意力GAN效果惊艳

旧照片着色修复神器！自注意力GAN效果惊艳

GAN生成式对抗网络

7+阅读 · 2018年11月3日

重磅突破：从36.8到52.52，引入自我注意力模块的SAGAN

重磅突破：从36.8到52.52，引入自我注意力模块的SAGAN

论智

5+阅读 · 2018年5月24日

StarGAN-多领域图像翻译

StarGAN-多领域图像翻译

CreateAMind

4+阅读 · 2017年12月26日

拍照手抖有救了！DeblurGAN消除运动模糊效果惊人 | 附论文+代码

拍照手抖有救了！DeblurGAN消除运动模糊效果惊人 | 附论文+代码

量子位

3+阅读 · 2017年11月26日

GAN猫的脸

机械鸡

11+阅读 · 2017年7月8日

Self-training with Noisy Student improves ImageNet classification

Arxiv

15+阅读 · 2019年11月11日

Lipschitz Generative Adversarial Nets

Arxiv

8+阅读 · 2019年2月15日

ESRGAN: Enhanced Super-Resolution Generative Adversarial Networks

ESRGAN: Enhanced Super-Resolution Generative Adversarial Networks

Arxiv

6+阅读 · 2018年9月17日

Generating Realistic Geology Conditioned on Physical Measurements with Generative Adversarial Networks

Generating Realistic Geology Conditioned on Physical Measurements with Generative Adversarial Networks

Arxiv

6+阅读 · 2018年7月5日

Learning Semantic Sentence Embeddings using Pair-wise Discriminator

Arxiv

6+阅读 · 2018年6月15日

Self-Attention Generative Adversarial Networks

Arxiv

8+阅读 · 2018年5月21日

Constrained-CNN losses forweakly supervised segmentation

Arxiv

5+阅读 · 2018年5月12日

DeblurGAN: Blind Motion Deblurring Using Conditional Adversarial Networks

Arxiv

4+阅读 · 2018年4月3日

Wasserstein Auto-Encoders

Arxiv

7+阅读 · 2018年3月12日

Progressive Growing of GANs for Improved Quality, Stability, and Variation

Arxiv

3+阅读 · 2017年11月3日

VIP会员

相关主题

纽约州立大学布法罗分校

深度学习模型

相关VIP内容

【Google】平滑对抗训练，Smooth Adversarial Training

【Google】平滑对抗训练，Smooth Adversarial Training

专知会员服务

49+阅读 · 2020年7月4日

【中科院自动化所】视觉对抗样本生成技术概述

【中科院自动化所】视觉对抗样本生成技术概述

专知会员服务

37+阅读 · 2020年4月15日

【CVPR2020】MSG-GAN:用于稳定图像合成的多尺度梯度GAN

【CVPR2020】MSG-GAN:用于稳定图像合成的多尺度梯度GAN

专知会员服务

29+阅读 · 2020年4月6日

【FAIR-CVPR2020】PIFuHD:多级像素对齐隐式功能，实现高分辨率三维人体数字化

【FAIR-CVPR2020】PIFuHD:多级像素对齐隐式功能，实现高分辨率三维人体数字化

专知会员服务

29+阅读 · 2020年4月5日

【CVPR2020-斯坦福】从RGB-D扫描对抗纹理优化，Adversarial Texture Optimization

【CVPR2020-斯坦福】从RGB-D扫描对抗纹理优化，Adversarial Texture Optimization

专知会员服务

17+阅读 · 2020年3月21日

【Google AI应用】利用机器学习来“短时预报”高分辨率的降水:Using Machine Learning to “Nowcast” Precipitation in High Resolution

【Google AI应用】利用机器学习来“短时预报”高分辨率的降水:Using Machine Learning to “Nowcast” Precipitation in High Resolution

专知会员服务

22+阅读 · 2020年1月15日

完整版！《GAN实战：生成对抗网络深度学习》在线书与代码，牛津大学Jakub著作 (附下载)

完整版！《GAN实战：生成对抗网络深度学习》在线书与代码，牛津大学Jakub著作 (附下载)

专知会员服务

354+阅读 · 2019年12月25日

【AAAI2020论文】分类感知的生成式对抗网络，具有分类文本生成的层次进化学习 (附pdf)

专知会员服务

21+阅读 · 2019年11月19日

【NeurIPS2019】基于累加噪声的对抗鲁棒性（Certified Adversarial Robustness with Additive Noise），Changyou Chen

【NeurIPS2019】基于累加噪声的对抗鲁棒性（Certified Adversarial Robustness with Additive Noise），Changyou Chen

专知会员服务

36+阅读 · 2019年11月12日

生成式对抗网络GAN异常检测

生成式对抗网络GAN异常检测

专知会员服务

118+阅读 · 2019年10月13日

热门VIP内容

开通专知VIP会员享更多权益服务

【CMU博士论文】数据驱动决策中的激励、信息与不确定性

DGP双粒度提示框架：图增强大模型助力欺诈检测

【ICCV2025】ESSENTIAL：用于视频类增量学习的情景记忆与语义记忆整合

唯快不破：大型语言模型高效架构综述

相关资讯

能生成逼真图像的不只有 GAN

能生成逼真图像的不只有 GAN

机器学习算法与Python学习

8+阅读 · 2019年6月6日

AI还原半世纪前的黑白电影和照片：效果惊艳在线可玩，网友大呼“鹅妹子嘤”

AI还原半世纪前的黑白电影和照片：效果惊艳在线可玩，网友大呼“鹅妹子嘤”

量子位

11+阅读 · 2019年5月7日

O-GAN：简单修改，让GAN的判别器变成一个编码器！

O-GAN：简单修改，让GAN的判别器变成一个编码器！

PaperWeekly

4+阅读 · 2019年3月8日

为了修复打码女神脸，他们提出二阶段生成对抗网络EdgeConnect

为了修复打码女神脸，他们提出二阶段生成对抗网络EdgeConnect

机器之心

4+阅读 · 2019年1月6日

拆台BigGan：“失败”图像生成集锦

拆台BigGan：“失败”图像生成集锦

论智

5+阅读 · 2018年11月19日

旧照片着色修复神器！自注意力GAN效果惊艳

旧照片着色修复神器！自注意力GAN效果惊艳

GAN生成式对抗网络

7+阅读 · 2018年11月3日

重磅突破：从36.8到52.52，引入自我注意力模块的SAGAN

重磅突破：从36.8到52.52，引入自我注意力模块的SAGAN

论智

5+阅读 · 2018年5月24日

StarGAN-多领域图像翻译

StarGAN-多领域图像翻译

CreateAMind

4+阅读 · 2017年12月26日

拍照手抖有救了！DeblurGAN消除运动模糊效果惊人 | 附论文+代码

拍照手抖有救了！DeblurGAN消除运动模糊效果惊人 | 附论文+代码

量子位

3+阅读 · 2017年11月26日

GAN猫的脸

机械鸡

11+阅读 · 2017年7月8日

相关论文

Self-training with Noisy Student improves ImageNet classification

Arxiv

15+阅读 · 2019年11月11日

Lipschitz Generative Adversarial Nets

Arxiv

8+阅读 · 2019年2月15日

ESRGAN: Enhanced Super-Resolution Generative Adversarial Networks

ESRGAN: Enhanced Super-Resolution Generative Adversarial Networks

Arxiv

6+阅读 · 2018年9月17日

Generating Realistic Geology Conditioned on Physical Measurements with Generative Adversarial Networks

Generating Realistic Geology Conditioned on Physical Measurements with Generative Adversarial Networks

Arxiv

6+阅读 · 2018年7月5日

Learning Semantic Sentence Embeddings using Pair-wise Discriminator

Arxiv

6+阅读 · 2018年6月15日

Self-Attention Generative Adversarial Networks

Arxiv

8+阅读 · 2018年5月21日

Constrained-CNN losses forweakly supervised segmentation

Arxiv

5+阅读 · 2018年5月12日

DeblurGAN: Blind Motion Deblurring Using Conditional Adversarial Networks

Arxiv

4+阅读 · 2018年4月3日

Wasserstein Auto-Encoders

Arxiv

7+阅读 · 2018年3月12日

Progressive Growing of GANs for Improved Quality, Stability, and Variation

Arxiv

3+阅读 · 2017年11月3日

大家都在搜

CMU博士论文

无人机集群

久别重逢话双塔

软件无线电

论文浅尝 - ICLR2020 | 通过神经逻辑归纳学习有效地解释

微信扫码咨询专知VIP会员