体积减半画质翻倍,他用TensorFlow实现了这个图像极度压缩模型

2018 年 5 月 14 日 量子位 特别关注前沿科技
林鳞 编译整理
量子位 出品 | 公众号 QbitAI

体积小,但清晰度高。

就有这么一种基于生成式对抗网络(GAN)的极度图像压缩框架,经它之手的图像虽然体积被压缩不少,但分辨率着实感人。和同类框架相比,它的效果尤为惊艳。

 此算法(2379 Bytes)和BPG(2565 Bytes)画质对比

 此算法(2379 Bytes)和WebP(6066 Bytes)画质对比

 此算法(2379 Bytes)和JPEG2000(2447 Bytes)画质对比

 此算法(2379 Bytes)和原图画质对比

就是这样一个体积小一半但画质高一倍的算法,自上个月在arXiv出现后便引发关注。

看了研究论文Generative Adversarial Networks for Extreme Learned Image Compression后,网友大呼希望这群来自苏黎世联邦理工学院的程序员们开个源。

 作者团队

好消息是,近日,Github网友Justin-Tan用TensorFlow实现了这项研究,我们一起看看这个爆火的压缩大法实现~

实现用法及结果

实现的第一步得准备工具,也是就是TensorFlow 1.8。

TensorFlow 1.8地址:
https://github.com/tensorflow/tensorflow

在batch size是1的情况下训练,每经过一定的步数中 (默认值为128),重建的样例/summary就会被定期写入,每10次迭代后保存检查点。



这些全局压缩的图像来自于Cityscapes中leftImg8bit数据集,总体来看,效果还比较好。

 C=8 channel,多规格鉴别器

下图是量化的C=4、8、16 channel图像比较——



实现细节/扩展

你可以在 下找到预训练模型,它在C=8的channel bottleneck和多规格鉴别器损失进行全局压缩。这个模型已经用Cityscapes中的leftIma8bit训练了64次。

这个网络的架构是基于论文 Perceptual Losses for Real-Time Style Transfer and Super-Resolution中的附录中提供的描述完成的,项目中最初提到的多规格鉴别器的损失是基于论文 High-Resolution Image Synthesis and Semantic Manipulation with Conditional GANs完成的。

如果你还想增加扩展,可以在Network分类下新写一个@staticmethod版块,类似下面这样:



如果想更改超参数和toggle feature,可在config.py中设置。

相关地址和资料

如果你对这个压缩大法感兴趣,这刚好有几份资料可以拿去用:

论文Generative Adversarial Networks for Extreme Learned Image Compression地址:
https://arxiv.org/pdf/1804.02958.pdf

项目首页:
https://data.vision.ee.ethz.ch/aeirikur/extremecompression/#publication

复现项目地址:
https://github.com/Justin-Tan/generative-compression

论文Perceptual Losses for Real-Time Style Transfer
and Super-Resolution地址:
https://cs.stanford.edu/people/jcjohns/eccv16/

论文High-Resolution Image Synthesis and Semantic Manipulation with Conditional GANs地址:
https://tcwang0509.github.io/pix2pixHD/

加入社群

量子位AI社群16群开始招募啦,欢迎对AI感兴趣的同学,加小助手微信qbitbot7入群;


此外,量子位专业细分群(自动驾驶、CV、NLP、机器学习等)正在招募,面向正在从事相关领域的工程师及研究人员。


进群请加小助手微信号qbitbot6,并务必备注相应群的关键词~通过审核后我们将邀请进群。(专业群审核较严,敬请谅解)

诚挚招聘

量子位正在招募编辑/记者,工作地点在北京中关村。期待有才气、有热情的同学加入我们!相关细节,请在量子位公众号(QbitAI)对话界面,回复“招聘”两个字。

量子位 QbitAI · 头条号签约作者

վ'ᴗ' ի 追踪AI技术和产品新动态


登录查看更多
2

相关内容

Google发布的第二代深度学习系统TensorFlow
《深度学习》圣经花书的数学推导、原理与Python代码实现
TensorFlow Lite指南实战《TensorFlow Lite A primer》,附48页PPT
专知会员服务
69+阅读 · 2020年1月17日
【ICIP2019教程-NVIDIA】图像到图像转换,附7份PPT下载
专知会员服务
54+阅读 · 2019年11月20日
Keras作者François Chollet推荐的开源图像搜索引擎项目Sis
专知会员服务
29+阅读 · 2019年10月17日
一文读懂图像压缩算法
七月在线实验室
16+阅读 · 2018年5月2日
如何设计基于深度学习的图像压缩算法
论智
41+阅读 · 2018年4月26日
CNN图像风格迁移的原理及TensorFlow实现
数据挖掘入门与实战
5+阅读 · 2018年4月18日
基于GAN的极限图像压缩框架
论智
11+阅读 · 2018年4月15日
keras系列︱深度学习五款常用的已训练模型
数据挖掘入门与实战
10+阅读 · 2018年3月27日
风格迁移原理及tensorflow实现-附代码
机器学习研究会
19+阅读 · 2018年3月25日
GitHub上大热的Deep Photo终于有TensorFlow版了!
量子位
4+阅读 · 2017年8月14日
Object detection on aerial imagery using CenterNet
Arxiv
6+阅读 · 2019年8月22日
Arxiv
5+阅读 · 2018年1月30日
VIP会员
相关资讯
一文读懂图像压缩算法
七月在线实验室
16+阅读 · 2018年5月2日
如何设计基于深度学习的图像压缩算法
论智
41+阅读 · 2018年4月26日
CNN图像风格迁移的原理及TensorFlow实现
数据挖掘入门与实战
5+阅读 · 2018年4月18日
基于GAN的极限图像压缩框架
论智
11+阅读 · 2018年4月15日
keras系列︱深度学习五款常用的已训练模型
数据挖掘入门与实战
10+阅读 · 2018年3月27日
风格迁移原理及tensorflow实现-附代码
机器学习研究会
19+阅读 · 2018年3月25日
GitHub上大热的Deep Photo终于有TensorFlow版了!
量子位
4+阅读 · 2017年8月14日
Top
微信扫码咨询专知VIP会员