自动编码器是什么？教你如何使用自动编码器增强模糊图像

会员服务 ·

自动编码器是什么？教你如何使用自动编码器增强模糊图像

2020 年 3 月 30 日 THU数据派

作者：PRATEEK JOSHI

翻译：程超

本文约2200字，建议阅读6分钟

本文首先介绍了基于神经网络的自动编码器，然后介绍如何使用自动编码器增强模糊图像。

标签：计算机视觉

概述

自动编码器是什么？自动编码器是如何工作的？本文将回答这些问题。
我们将通过一个案例——如何提高模糊图像的分辨率，来探讨自动编码器的概念。

简介

你还记得胶卷相机的时代吗？冲洗照片是一个神秘的过程，只有摄影师和专业人士才能够驾轻就熟。大多数人的印象中只有弥漫着昏暗红光的暗室。简而言之，冲洗照片是一个耗时的过程。

后来数码相机革命开始了，过往的时代一去不复返！我们甚至不想再打印照片了——大多数人的照片存储在智能手机、笔记本电脑或云上。

暗室

即使现在，我们也会遇到（点击鼠标的时候）模糊、像素化和模糊的图片。我对此深表愧疚，很多人都在努力呈现出完美的图片。这正是深度学习和自动编码器的用武之地。

下面将介绍什么是自动编码器，以及工作原理。然后，我们会给一个实际案例——基于Python中的自动编码器提高图像的分辨率。

必备条件：熟悉Keras，基于神经网络和卷积层的图像分类。如果你需要回顾这些概念，可以参考以下：

神经网络概论（免费课程）

https://courses.analyticsvidhya.com/courses/Introduction-to-Neural-Networks?utm_source=blog&utm_medium=what-is-autoencoder-enhance-image-resolution
建立你的第一个图像分类模型
https://www.analyticsvidhya.com/blog/2019/01/build-image-classification-model-10-minutes/?utm_source=blog&utm_medium=what-is-autoencoder-enhance-image-resolution

一、什么是自动编码器

Pulkit Sharma 在文章中给出了如下定义：

“自动编码器本质上是学习输入数据低维特征表示的神经网络结构。”

自动编码器由两个相连的网络组成：编码器和解码器。编码器的目的是获取一个输入（x）并产生一个特征映射（z）：

这个特征映射（z）的大小或长度通常小于x。为什么是这样呢？

因为我们只希望z捕获可以描述输入数据的有意义的变化因子，因此z的形状通常小于x。

现在，问题是我们如何获得这个特征表示（z）？我们如何训练这个模型？为此，我们可以在提取的特征之上添加一个解码器网络，然后训练模型：

二、关于图像去噪自编码器

我们将在本文中解决的问题与图像去噪自动编码器的功能有关。下面我们详细介绍下如何利用自动编码器消除图像中的噪声。

假设我们有一组手写数字图像，其中一些已经损坏。以下是一些带有噪点（损坏）的图像：

从图像中去除这种噪声被称为图像去噪问题。 所需的输出是干净的图像，其中大部分噪声被去除，如下所示：

但是自动编码器如何从图像中去除这种噪声呢？

正如我们在上一节中已经看到的，自动编码器试图重建输入数据。因此，如果我们把损坏的图像作为输入，自动编码器将尝试重建噪声图像。

那么，我们该怎么办呢？改变结构？答案是否定的！

这里需要的是一个小调整。我们可以通过使用原始图像和重构图像来计算损耗，而不是使用输入和重构输出来计算损耗。下图说明了我的观点：

图像去噪自编码器

现在我们已经熟悉了去噪自动编码器的功能，下面我们回到期望使用自动编码器解决的问题。

三、问题描述-使用自动编码器提高图像分辨率

对这个问题相信你不会陌生。我们大多数人遇到模糊图像都很郁闷，都希望图片能清晰些。下面我们将使用自动编码器解决该问题！

假设我们有一组低分辨率的人脸图像。我们的任务是提高这些图像的分辨率。可以借助Photoshop等照片编辑工具来完成此操作。但是，当手头有成千上万张图像时，我们需要一种更智能的方法来执行此任务。

以下是一些示例图像及其原始图像：

四、使用Python实现自动编码器

让我们打开我们的Juyter Notebook并导入所需的库：

下载数据集

我们的研究基于流行的“Labeled Faces in the Wild”数据集。它设计用于研究无约束人脸识别问题。然而，在这里我们的目标不是人脸识别，而是建立一个模型来提高图像分辨率。

让我们下载和提取数据集：

# download dataset! wget http://vis-www.cs.umass.edu/lfw/lfw.tgz# extract dataset! tar -xvzf lfw.tgz

此数据集将被提取到多个文件夹中。因此，捕获所有图像的文件路径是很重要的。我们可以借助glob库轻松地做到这一点。

#capture paths to imagesface_images = glob.glob('lfw/**/*.jpg')

加载和预处理图像

图像的原始大小是250×250像素。然而，在一般配置的系统上处理这些图像需要消耗相当多的计算资源。因此，我们需要裁剪所有图像的尺寸。

模型的训练数据准备

接下来，我们将数据集（图像）分成两组——训练和验证。我们将使用训练集来训练我们的模型，并用验证集来评估模型的性能：

让我们来看看数据集中的图像：

这个案例的思想和去噪自动编码器非常相似。

我们将对输入图像做一些修改，并使用原始图像计算损失。作为一个提高分辨率的任务，我们降低原始图像的分辨率，并将其输入到模型中。

如下是处理后的输入图片：

我们将使用下面的函数来降低所有图像的分辨率，并创建一组单独的低分辨率图像。

准备输入图像

降低所有图像的分辨率，包括训练集和验证集。

模型创建

模型的结构定义如下：

可以根据需要修改该结构。你可以改变层的数量，改变层的类型，使用正则化，以及其他很多参数。当下我们继续使用这个结构。

模型结构可视化对于调试（如果出现错误）很有帮助。在Keras中很容易实现，仅需执行<model name>.summary( )函数即可：

autoencoder.summary()

我们最终可以训练我们的模型：

预测（增强图像）

predictions = autoencoder.predict(val_x_px)

后记

本教程讲解了自动编码器，我们基于图像去噪的思路实现了提高图像分辨率。我们可以将其扩展到其他很多地方。

例如，我们也可以使用这种技术来提高低分辨率视频的质量。因此，即使没有给图像打上标签，我们也可以处理图像数据并解决一些实际问题。如果您还有其他基于无监督学习的图像处理案例或技术，请在下面的评论部分中共享它。

原文标题：

What are Autoencoders? Learn How to Enhance a Blurred Image using an Autoencoder!

原文链接：

https://www.analyticsvidhya.com/blog/2020/02/what-is-autoencoder-enhance-image-resolution/

——END——

登录查看更多

相关内容

模糊图像

关注 1

高效医疗图像分析的统一表示

专知会员服务

36+阅读 · 2020年6月23日

【SIGGRAPH 2020】人像阴影处理，Portrait Shadow Manipulation

专知会员服务

29+阅读 · 2020年5月19日

一本有意思的书！《用Python做数学》，265页pdf使用编程探索代数，统计，微积分! Doing Math with Python: Use Programming to Explore Algebra, Statistics, Calculus, and More

专知会员服务

173+阅读 · 2020年4月27日

Sklearn 与 TensorFlow 机器学习实用指南,385页pdf

专知会员服务

130+阅读 · 2020年3月15日

30篇「CVPR2020」高赞论文抢先看！看计算机视觉2020在研究什么？

专知会员服务

50+阅读 · 2020年2月28日

基于深度网络的自监督视觉特征学习综述，附24页论文下载

专知会员服务

66+阅读 · 2020年1月15日

【O’Reilly讲座】基于深度学习的异常检测方法用于检测大型数据集的质量：Anomaly detection using deep learning to measure the quality of large datasets

专知会员服务

31+阅读 · 2020年1月11日

【斯坦福大学】场景图谱表示在计算机视觉中的应用，41页ppt

专知会员服务

52+阅读 · 2020年1月8日

图像内容自动描述技术综述

专知会员服务

88+阅读 · 2019年11月17日

【MLA 2019】图像的非监督增强匹配，清华大学张长水教授

专知会员服务

28+阅读 · 2019年11月6日

Deep Image Prior——图像恢复入门

中国人工智能学会

15+阅读 · 2019年2月16日

如何使用注意力模型生成图像描述？

AI研习社

9+阅读 · 2018年8月6日

实践 | 如何使用深度学习为照片自动生成文本描述？

七月在线实验室

10+阅读 · 2018年5月21日

如何设计基于深度学习的图像压缩算法

论智

41+阅读 · 2018年4月26日

【干货】深入理解变分自编码器

专知

21+阅读 · 2018年3月22日

视频 | 论文最爱的变分自编码器（ VAE），不了解一下？

AI科技评论

13+阅读 · 2018年3月17日

教你用TensorFlow和自编码器模型生成手写数字（附代码）

数据派THU

3+阅读 · 2017年11月21日

【教程】如何使用深度学习为照片自动生成文本描述？

GAN生成式对抗网络

20+阅读 · 2017年11月19日

教程 | 如何使用深度学习为照片自动生成文本描述？

机器之心

10+阅读 · 2017年11月15日

教程 | 深度学习：自动编码器基础和类型

机器之心

5+阅读 · 2017年9月23日

Image Segmentation Using Deep Learning: A Survey

Arxiv

47+阅读 · 2020年1月15日

Residual Non-local Attention Networks for Image Restoration

Arxiv

9+阅读 · 2019年3月24日

Foreground-aware Image Inpainting

Arxiv

4+阅读 · 2019年1月17日

A Probe into Understanding GAN and VAE models

Arxiv

9+阅读 · 2018年12月13日

Sem-GAN: Semantically-Consistent Image-to-Image Translation

Arxiv

4+阅读 · 2018年7月12日

Sentiment Transfer using Seq2Seq Adversarial Autoencoders

Arxiv

4+阅读 · 2018年4月10日

TVAE: Triplet-Based Variational Autoencoder using Metric Learning

Arxiv

3+阅读 · 2018年4月3日

Noise2Noise: Learning Image Restoration without Clean Data

Arxiv

5+阅读 · 2018年3月12日

Recurrent Residual Convolutional Neural Network based on U-Net (R2U-Net) for Medical Image Segmentation

Arxiv

13+阅读 · 2018年2月20日

A Generative Model For Zero Shot Learning Using Conditional Variational Autoencoders

Arxiv

9+阅读 · 2018年1月27日

VIP会员