会员服务 ·

0

体积减半画质翻倍，他用TensorFlow实现了这个图像极度压缩模型

2018 年 5 月 14 日 量子位 特别关注前沿科技

林鳞编译整理
量子位出品 | 公众号 QbitAI

体积小，但清晰度高。

就有这么一种基于生成式对抗网络（GAN）的极度图像压缩框架，经它之手的图像虽然体积被压缩不少，但分辨率着实感人。和同类框架相比，它的效果尤为惊艳。

△ 此算法（2379 Bytes）和BPG（2565 Bytes）画质对比

△ 此算法（2379 Bytes）和WebP（6066 Bytes）画质对比

△ 此算法（2379 Bytes）和JPEG2000（2447 Bytes）画质对比

△ 此算法（2379 Bytes）和原图画质对比

就是这样一个体积小一半但画质高一倍的算法，自上个月在arXiv出现后便引发关注。

看了研究论文Generative Adversarial Networks for Extreme Learned Image Compression后，网友大呼希望这群来自苏黎世联邦理工学院的程序员们开个源。

△ 作者团队

好消息是，近日，Github网友Justin-Tan用TensorFlow实现了这项研究，我们一起看看这个爆火的压缩大法实现~

实现用法及结果

实现的第一步得准备工具，也是就是TensorFlow 1.8。

TensorFlow 1.8地址：
https://github.com/tensorflow/tensorflow

在batch size是1的情况下训练，每经过一定的步数中 (默认值为128)，重建的样例/summary就会被定期写入，每10次迭代后保存检查点。

这些全局压缩的图像来自于Cityscapes中leftImg8bit数据集，总体来看，效果还比较好。

△ C=8 channel，多规格鉴别器

下图是量化的C=4、8、16 channel图像比较——

实现细节/扩展

你可以在下找到预训练模型，它在C=8的channel bottleneck和多规格鉴别器损失进行全局压缩。这个模型已经用Cityscapes中的leftIma8bit训练了64次。

这个网络的架构是基于论文 Perceptual Losses for Real-Time Style Transfer and Super-Resolution中的附录中提供的描述完成的，项目中最初提到的多规格鉴别器的损失是基于论文 High-Resolution Image Synthesis and Semantic Manipulation with Conditional GANs完成的。

如果你还想增加扩展，可以在Network分类下新写一个@staticmethod版块，类似下面这样：

如果想更改超参数和toggle feature，可在config.py中设置。

相关地址和资料

如果你对这个压缩大法感兴趣，这刚好有几份资料可以拿去用：

论文Generative Adversarial Networks for Extreme Learned Image Compression地址：
https://arxiv.org/pdf/1804.02958.pdf

项目首页：
https://data.vision.ee.ethz.ch/aeirikur/extremecompression/#publication

复现项目地址：
https://github.com/Justin-Tan/generative-compression

论文Perceptual Losses for Real-Time Style Transfer
and Super-Resolution地址：
https://cs.stanford.edu/people/jcjohns/eccv16/

论文High-Resolution Image Synthesis and Semantic Manipulation with Conditional GANs地址：
https://tcwang0509.github.io/pix2pixHD/

— 完 —

加入社群

量子位AI社群16群开始招募啦，欢迎对AI感兴趣的同学，加小助手微信qbitbot7入群；

此外，量子位专业细分群(自动驾驶、CV、NLP、机器学习等)正在招募，面向正在从事相关领域的工程师及研究人员。

进群请加小助手微信号qbitbot6，并务必备注相应群的关键词~通过审核后我们将邀请进群。（专业群审核较严，敬请谅解）

诚挚招聘

量子位正在招募编辑/记者，工作地点在北京中关村。期待有才气、有热情的同学加入我们！相关细节，请在量子位公众号(QbitAI)对话界面，回复“招聘”两个字。

量子位 QbitAI · 头条号签约作者

վ'ᴗ' ի 追踪AI技术和产品新动态

登录查看更多

2

相关内容

TensorFlow

Google发布的第二代深度学习系统TensorFlow

深度学习模型图难画论文难中？这个ML Visual利器帮你快速画出漂亮的模型图,160个模板

深度学习模型图难画论文难中？这个ML Visual利器帮你快速画出漂亮的模型图,160个模板

专知会员服务

895+阅读 · 2022年3月1日

为什么批处理规范会导致梯度爆炸，Why Batch Norm Causes Exploding Gradients

为什么批处理规范会导致梯度爆炸，Why Batch Norm Causes Exploding Gradients

专知会员服务

17+阅读 · 2020年4月2日

【阿里巴巴达摩院】TResNet: 高性能的GPU专用架构，GPU-Dedicated Architecture

【阿里巴巴达摩院】TResNet: 高性能的GPU专用架构，GPU-Dedicated Architecture

专知会员服务

33+阅读 · 2020年4月1日

【CVPR2020】用于图像超分辨率的深度展开网络，Deep Unfolding Network for Image Super-Resolution

【CVPR2020】用于图像超分辨率的深度展开网络，Deep Unfolding Network for Image Super-Resolution

专知会员服务

44+阅读 · 2020年3月26日

图像分类技巧集，17页ppt《Bag of Tricks for Image Classification》

图像分类技巧集，17页ppt《Bag of Tricks for Image Classification》

专知会员服务

95+阅读 · 2020年3月12日

《深度学习》圣经花书的数学推导、原理与Python代码实现

《深度学习》圣经花书的数学推导、原理与Python代码实现

专知会员服务

324+阅读 · 2020年3月6日

TensorFlow Lite指南实战《TensorFlow Lite A primer》，附48页PPT

TensorFlow Lite指南实战《TensorFlow Lite A primer》，附48页PPT

专知会员服务

70+阅读 · 2020年1月17日

【ICIP2019教程-NVIDIA】图像到图像转换，附7份PPT下载

【ICIP2019教程-NVIDIA】图像到图像转换，附7份PPT下载

专知会员服务

55+阅读 · 2019年11月20日

【超分辨率| 2019最新综述】图像超分辨率的深度学习，附PDF（Deep Learning for Image Super-resolution: A Survey）

【超分辨率| 2019最新综述】图像超分辨率的深度学习，附PDF（Deep Learning for Image Super-resolution: A Survey）

专知会员服务

60+阅读 · 2019年11月16日

Keras作者François Chollet推荐的开源图像搜索引擎项目Sis

Keras作者François Chollet推荐的开源图像搜索引擎项目Sis

专知会员服务

30+阅读 · 2019年10月17日

一文读懂图像压缩算法

一文读懂图像压缩算法

七月在线实验室

17+阅读 · 2018年5月2日

如何设计基于深度学习的图像压缩算法

如何设计基于深度学习的图像压缩算法

论智

41+阅读 · 2018年4月26日

CNN图像风格迁移的原理及TensorFlow实现

CNN图像风格迁移的原理及TensorFlow实现

数据挖掘入门与实战

5+阅读 · 2018年4月18日

资源 | GitHub新项目：轻松使用多种预训练卷积网络抽取图像特征

资源 | GitHub新项目：轻松使用多种预训练卷积网络抽取图像特征

机器之心

12+阅读 · 2018年4月16日

基于GAN的极限图像压缩框架

基于GAN的极限图像压缩框架

论智

12+阅读 · 2018年4月15日

keras系列︱深度学习五款常用的已训练模型

keras系列︱深度学习五款常用的已训练模型

数据挖掘入门与实战

10+阅读 · 2018年3月27日

风格迁移原理及tensorflow实现-附代码

风格迁移原理及tensorflow实现-附代码

机器学习研究会

19+阅读 · 2018年3月25日

拍照手抖有救了！DeblurGAN消除运动模糊效果惊人 | 附论文+代码

拍照手抖有救了！DeblurGAN消除运动模糊效果惊人 | 附论文+代码

量子位

3+阅读 · 2017年11月26日

OpenCV+深度学习预训练模型，简单搞定图像识别 | 教程

OpenCV+深度学习预训练模型，简单搞定图像识别 | 教程

量子位

7+阅读 · 2017年8月22日

GitHub上大热的Deep Photo终于有TensorFlow版了！

GitHub上大热的Deep Photo终于有TensorFlow版了！

量子位

4+阅读 · 2017年8月14日

Object detection on aerial imagery using CenterNet

Object detection on aerial imagery using CenterNet

Arxiv

6+阅读 · 2019年8月22日

Active Generative Adversarial Network for Image Classification

Arxiv

4+阅读 · 2019年6月17日

3D Hand Shape and Pose Estimation from a Single RGB Image

3D Hand Shape and Pose Estimation from a Single RGB Image

Arxiv

17+阅读 · 2019年3月3日

Deep High-Resolution Representation Learning for Human Pose Estimation

Arxiv

5+阅读 · 2019年2月25日

BoxNet: Deep Learning Based Biomedical Image Segmentation Using Boxes Only Annotation

Arxiv

4+阅读 · 2018年6月2日

High-Resolution Deep Convolutional Generative Adversarial Networks

Arxiv

4+阅读 · 2018年5月10日

DeblurGAN: Blind Motion Deblurring Using Conditional Adversarial Networks

Arxiv

4+阅读 · 2018年4月3日

Combination of Hidden Markov Random Field and Conjugate Gradient for Brain Image Segmentation

Arxiv

8+阅读 · 2018年3月13日

Activation Maximization Generative Adversarial Nets

Arxiv

5+阅读 · 2018年1月30日

Fluorescence Microscopy Image Segmentation Using Convolutional Neural Network With Generative Adversarial Networks

Arxiv

18+阅读 · 2018年1月22日

VIP会员

相关主题

生成式对抗网络

相关VIP内容

深度学习模型图难画论文难中？这个ML Visual利器帮你快速画出漂亮的模型图,160个模板

深度学习模型图难画论文难中？这个ML Visual利器帮你快速画出漂亮的模型图,160个模板

专知会员服务

895+阅读 · 2022年3月1日

为什么批处理规范会导致梯度爆炸，Why Batch Norm Causes Exploding Gradients

为什么批处理规范会导致梯度爆炸，Why Batch Norm Causes Exploding Gradients

专知会员服务

17+阅读 · 2020年4月2日

【阿里巴巴达摩院】TResNet: 高性能的GPU专用架构，GPU-Dedicated Architecture

【阿里巴巴达摩院】TResNet: 高性能的GPU专用架构，GPU-Dedicated Architecture

专知会员服务

33+阅读 · 2020年4月1日

【CVPR2020】用于图像超分辨率的深度展开网络，Deep Unfolding Network for Image Super-Resolution

【CVPR2020】用于图像超分辨率的深度展开网络，Deep Unfolding Network for Image Super-Resolution

专知会员服务

44+阅读 · 2020年3月26日

图像分类技巧集，17页ppt《Bag of Tricks for Image Classification》

图像分类技巧集，17页ppt《Bag of Tricks for Image Classification》

专知会员服务

95+阅读 · 2020年3月12日

《深度学习》圣经花书的数学推导、原理与Python代码实现

《深度学习》圣经花书的数学推导、原理与Python代码实现

专知会员服务

324+阅读 · 2020年3月6日

TensorFlow Lite指南实战《TensorFlow Lite A primer》，附48页PPT

TensorFlow Lite指南实战《TensorFlow Lite A primer》，附48页PPT

专知会员服务

70+阅读 · 2020年1月17日

【ICIP2019教程-NVIDIA】图像到图像转换，附7份PPT下载

【ICIP2019教程-NVIDIA】图像到图像转换，附7份PPT下载

专知会员服务

55+阅读 · 2019年11月20日

【超分辨率| 2019最新综述】图像超分辨率的深度学习，附PDF（Deep Learning for Image Super-resolution: A Survey）

【超分辨率| 2019最新综述】图像超分辨率的深度学习，附PDF（Deep Learning for Image Super-resolution: A Survey）

专知会员服务

60+阅读 · 2019年11月16日

Keras作者François Chollet推荐的开源图像搜索引擎项目Sis

Keras作者François Chollet推荐的开源图像搜索引擎项目Sis

专知会员服务

30+阅读 · 2019年10月17日

热门VIP内容

开通专知VIP会员享更多权益服务

【牛津博士论文】零样本强化学习综述

《美军条令：陆军指挥官与规划人员地理空间指南》60页

战术边缘指挥控制：防务面临的核心挑战

迈向开放世界检测：综述

相关资讯

一文读懂图像压缩算法

一文读懂图像压缩算法

七月在线实验室

17+阅读 · 2018年5月2日

如何设计基于深度学习的图像压缩算法

如何设计基于深度学习的图像压缩算法

论智

41+阅读 · 2018年4月26日

CNN图像风格迁移的原理及TensorFlow实现

CNN图像风格迁移的原理及TensorFlow实现

数据挖掘入门与实战

5+阅读 · 2018年4月18日

资源 | GitHub新项目：轻松使用多种预训练卷积网络抽取图像特征

资源 | GitHub新项目：轻松使用多种预训练卷积网络抽取图像特征

机器之心

12+阅读 · 2018年4月16日

基于GAN的极限图像压缩框架

基于GAN的极限图像压缩框架

论智

12+阅读 · 2018年4月15日

keras系列︱深度学习五款常用的已训练模型

keras系列︱深度学习五款常用的已训练模型

数据挖掘入门与实战

10+阅读 · 2018年3月27日

风格迁移原理及tensorflow实现-附代码

风格迁移原理及tensorflow实现-附代码

机器学习研究会

19+阅读 · 2018年3月25日

拍照手抖有救了！DeblurGAN消除运动模糊效果惊人 | 附论文+代码

拍照手抖有救了！DeblurGAN消除运动模糊效果惊人 | 附论文+代码

量子位

3+阅读 · 2017年11月26日

OpenCV+深度学习预训练模型，简单搞定图像识别 | 教程

OpenCV+深度学习预训练模型，简单搞定图像识别 | 教程

量子位

7+阅读 · 2017年8月22日

GitHub上大热的Deep Photo终于有TensorFlow版了！

GitHub上大热的Deep Photo终于有TensorFlow版了！

量子位

4+阅读 · 2017年8月14日

相关论文

Object detection on aerial imagery using CenterNet

Object detection on aerial imagery using CenterNet

Arxiv

6+阅读 · 2019年8月22日

Active Generative Adversarial Network for Image Classification

Arxiv

4+阅读 · 2019年6月17日

3D Hand Shape and Pose Estimation from a Single RGB Image

3D Hand Shape and Pose Estimation from a Single RGB Image

Arxiv

17+阅读 · 2019年3月3日

Deep High-Resolution Representation Learning for Human Pose Estimation

Arxiv

5+阅读 · 2019年2月25日

BoxNet: Deep Learning Based Biomedical Image Segmentation Using Boxes Only Annotation

Arxiv

4+阅读 · 2018年6月2日

High-Resolution Deep Convolutional Generative Adversarial Networks

Arxiv

4+阅读 · 2018年5月10日

DeblurGAN: Blind Motion Deblurring Using Conditional Adversarial Networks

Arxiv

4+阅读 · 2018年4月3日

Combination of Hidden Markov Random Field and Conjugate Gradient for Brain Image Segmentation

Arxiv

8+阅读 · 2018年3月13日

Activation Maximization Generative Adversarial Nets

Arxiv

5+阅读 · 2018年1月30日

Fluorescence Microscopy Image Segmentation Using Convolutional Neural Network With Generative Adversarial Networks

Arxiv

18+阅读 · 2018年1月22日

大家都在搜

CMU博士论文

无人机集群

牛津博士论文

久别重逢话双塔

再见，TD-SCDMA！

微信扫码咨询专知VIP会员