初学者的 Keras：实现卷积神经网络

2019 年 9 月 8 日 Python程序员

Keras是一个简单易用但功能强大的 Python 深度学习库。在这篇文章中，我们将用 Keras 构建一个简单的卷积神经网络（CNN），并训练它来解实际问题。

这篇文章适用于完全初学 Keras 的人，但假设有 CNNs 的基本背景知识。我对卷积神经网络的介绍涵盖了你在这篇文章中需要知道的一切（以及更多内容），如果需要，请先阅读。

我们现在就开始!

想要代码吗？完整的源代码在末尾。

我们将处理一个经典的计算机视觉入门问题：MNIST 手写数字分类。很简单：给定一个图像，将其分类为一个数字。

MNIST 数据集中的样本图像

MNIST 数据集中的每个图像都是 28x28，包含一个居中的灰度数字。我们的 CNN 将获取一个图像并输出 10 个可能的类中的一个（每个数字一个）。

我假设你已经有了一个基本的 Python 安装（可能是这样）。让我们先下载一些我们需要的包：

注意：我们需要安装 tensorflow ，因为我们要在 TensorFlow 后端上运行 Keras（即 TensorFlow 将装备 Keras ）。

现在你应该能够导入这些包并浏览 MNIST 数据集：

在开始之前，我们将把图像像素值从 [0，255] 规范化为 [-0.5，0.5] 以使网络更容易训练（使用较小的中心值通常会得到更好的结果）。我们还将把每个图像从（28，28）改为（28，28，1），因为 Keras 需要第三维度。

我们准备好开始构建我们的 CNN 了！

每个 Keras 模型要么使用表示层的线性堆栈的 Sequential 类构建，要么使用更可定制的功能 Model 类。我们将使用更简单的Sequential 模型，因为我们的 CNN 将是一个层的线性堆栈。

我们首先实例化一个 Sequential 模型：

Sequential 构造函数接受一个 Keras Layers 数组。我们将为 CNN 使用三种类型的层：卷积层、最大池层和 Softmax 层。

这是我们在我的 CNN 简介中使用的 CNN 设置。如果你对这三种层的任何一种都不满意的话，请阅读这篇文章。

num_filters, filter_size 和 pool_size 是设置 CNN 超参数的自解释变量。
任何 Sequential 模型中的第一层都必须指定输入 input_shape，因此我们在 Conv2D上执行此操作。一旦指定了此输入形状，Keras 将自动推断后续层的输入形状。
Softmax 输出层有 10 个节点，每个类一个。

在开始培训之前，我们需要配置训练过程。我们在编译过程中确定了3个关键因素：

优化器。我们将坚持用一个非常好的默认设置：Adam 基于梯度的优化器。Keras 还有许多其他优化器，你也可以查看。
损失函数。因为我们使用的是 SoftMax 输出层，所以我们将使用交叉熵损失。Keras 区分 binary_crossentropy （2类）和 categorical_crossentropy（>2 类），因此我们将使用后者。查看所有的 Keras 损失函数.
度量列表。因为这是一个分类问题，所以我们只会有关于准确度度量的 Keras 报告。

下面是编译的样子：