摘要

对气象数据进行聚类在多个方面都是一项有价值的工作。结果可以在更大的气象预报框架内以各种方式使用，或者可以简单地用作表征特定感兴趣区域的气候差异分析工具。这项研究提出了一种基于在大约 11 个月的长时间范围内，温度时间序列相似性对地理位置进行聚类的方法。为此，使用了一种利用深度学习的新兴且强大的聚类技术，称为深度表示聚类 (DRC)。此外，提出了一种时间序列特定的 DRC 算法，以解决该领域的当前差距。最后，与传统的数值气象预报（NWP）相比，基于深度学习的气象预报作为一种获得更快速预测的手段，是一个越来越普遍的研究课题。由于它们是控制大气行为的已知物理方程，即 Navier-Stokes 方程，因此探索了将这些定律重新表述为基于物理的损失函数的概念，特别感兴趣的是用这种损失函数训练的模型是否可以胜过它的基线对应物。

图 15：时间序列聚类方法流程图

1 引言

气象预报有着悠久的历史，它植根于基本的物理原理。 20 世纪初的科学家们注意到，大气可以被视为一种流体，因此可以使用偏微分方程 (PDE) 进行建模，并建立了描述流体特性随时间和空间变化的物理原理 [21]。这些在气象预报领域被称为数值气象预报 (NWP) 的方法随着时间的推移有了很大的改进，目前代表了标准的气象建模方法。然而，深度学习和机器学习方法的进步引起了人们对将数据驱动的方法应用于气象建模和预测问题的极大兴趣。此外，正在进行研究以专门解决在物理过程建模中使用深度学习方法的问题，其中与气象一样，通常有关于可以利用的过程的现有信息。

机器和深度学习技术（如聚类）也可用于分析气象数据。这通常是为了将在广泛区域内经历相似气象模式的时间段组合在一起，但也可以将在很长一段时间内经历相似气象模式的地理区域组合在一起。这两种方法都可以帮助建立更广泛的气象预报框架，而后者也可以用来提供一个地区气候差异的一般特征。

这项研究以几种方式增加了深度学习和大气/气候建模领域。首先，使用一种强大的新型聚类算法，在此称为深度表示聚类 (DRC)，将美国聚类到在时间序列形状和气象动态方面具有相似性的地理区域。其次，将解决当前对 DRC 研究的空白。具体来说，据我们所知，还没有发布任何时间序列特定的 DRC 算法。相反，在处理时间序列数据时，大多数人在其聚类算法的核心使用基于欧几里德的距离度量，这可能会产生不良结果。最后，探讨了在深度学习模型中利用已知物理定律进行 24 小时气象预报的前景。

1.1 动机与背景

1.1.1 深层气象预报中的聚类分析

聚类

获得准确气象预报的复杂性和难度怎么强调都不为过。基本过程是高度非线性、混沌和非平稳的。虽然这些类型的现象可以通过神经网络建模，但以任何方式暗示正在经历的气象模式类型的信息可以在更广泛的预测框架中使用。这使一些研究人员转向了对气象数据进行聚类并使用聚类的性质和成员资格来通知神经网络 [22] 的想法。此外，为了对区域气候进行分类，对地理位置进行分组的历史由来已久[17]。一种尚未探索的方法是直接使用时间序列数据和适当的时间序列距离度量来解释时间序列的形状。这样做会产生与大气测量结果相似的位置集群。同样，这些结果可用于各种目的。在气象预报框架中，这可用于构建特定于集群的模型，以了解每个集群中气象的典型复杂行为。通过为每个集群拟合独特的模型，他们有更好的机会通过关注这些位置的典型行为来学习在其集群中观察到的复杂关系。聚类结果也可以更普遍地用作对一个地区的气候进行广泛分类的一种方式。

动力学

在某些研究领域中，时间序列分析的研究与动力系统的研究存在脱钩。在处理气象数据时，始终认识到每个时间序列只是较大动力系统的一维投影这一事实很重要，特别是因为我们希望部分基于每个时间序列的潜在动力学相似性来驱动集群形成地点。出于这个原因，提出的 DRC 算法特别注意驱动动态感知集群的形成。

1.1.2 时间序列的深度表示聚类

时间序列聚类

聚类时间序列数据存在一些独特的挑战。这源于这样一个事实，即聚类需要使用距离度量或度量来确定点的相似性或相异性。在静态数据的情况下，数据点或向量 x ∈ R n 表示观察的 n 个特征，而时间序列向量 y ∈ R n 表示系统某些特征的时间测量值。测量静态数据向量之间的相似性通常与欧几里德距离相关联，并且适当地如此。但是，要理解为什么这在时间数据的情况下可能会出现问题，请考虑图 1 中的时间序列。

图 1. 除了相位之外，两个正弦波完全相同。如果使用欧几里德距离进行比较，它们将被认为远不如预期的相似。此外，时间序列质心计算通常最好使用 dtw 重心平均或其变体来完成。

虽然很明显，这是两个相位稍有偏移的相同正弦波，并且在聚类的情况下应该被认为是高度相似的，但欧几里德距离会产生一种错误的不相似感。为了通过气象模式的相似性对地理位置进行分组，我们的距离测量必须考虑时间变化和变化。

质心计算是许多聚类算法的另一个基本组成部分。就像欧几里得距离会错误地表示两个时间序列的真实相似性一样，用于质心计算的算术平均值也会产生不自然的时间序列平均值。具体来说，算术平均值通常会产生一个在形状方面严重扭曲的平均值，因此不能恰当地代表其组成部分。回到图 1，可以看出算术平均曲线（绿色）是两个正弦波形的错误表示，而红色曲线是基于动态时间规整 (DTW) 的平均值，稍后将更详细地介绍，对于这些时间序列来说是一个更好的“平均值”。

为什么选择深度表示聚类 (DRC)？

深度表示聚类描述了一类使用神经网络来辅助聚类任务的模型。主要方法结合了表示学习（通常通过自动编码器）和聚类损失，以驱动形成集群友好的表示。由于该过程通常涉及表示学习，因此 DRC 非常适合高维、复杂的数据，因为它可以映射到低维表示。这在计算上和避免维度灾难方面都很有用。由于这项研究的聚类任务涉及长而复杂的时间序列，DRC 是一种自然的方法。最后，M. Cuturi 和 M. Blondel 最近的研究工作产生了动态时间扭曲 (DTW) 损失的可微版本，称为 soft-DTW [23]，这很重要，主要有两个原因。首先，时间序列不能与标准欧几里得距离函数在相似性方面进行适当比较。取而代之的是像 DTW 这样的东西，或者像 soft-DTW 这样的松弛，对于解释形状的相似性是必要的。其次，由于 DRC 是一种基于神经网络的方法，因此训练中使用的所有损失函数必须是可微的，以便通过反向传播促进参数优化，这是标准 DTW 所缺乏的特性。由于这些原因，softDTW 的开发非常适合创建可以适当处理时间序列数据的 DRC 算法。

1.1.3 深度气象预报

有很多理由考虑使用深度学习方法来模拟物理过程，尤其是大气动力学。首先，传统的 NWP 方法在计算上非常昂贵，因为相关的 PDE 必须在每个预测周期用新的初始条件和边界条件求解。此外，增强预测能力和预测分辨率需要增加计算资源。具体来说，研究人员已经表明，将预测分辨率翻倍需要计算能力提高一个数量级 [24]。另一方面，一旦训练了深度学习模型，获得预测的速度相对较快。

其次，数据驱动的方法很灵活，可用于帮助从业者快速开始在没有出现区域高分辨率 NWP 的位置进行本地化预测。这对军队来说是一个显着的好处。例如，当部队被派往建立新的前哨时，首要任务之一是建造一个机场，以便可以进行进出基地的运输和行动。了解和预测机场内外气象的能力对于前哨基地的成功至关重要。然而，这不仅适用于机场运营。各种任务规划都需要准确的气象评估，在许多此类海外环境中，没有提供高分辨率预测的区域/本地 NWP 模型。由参谋长联席会议发布的题为“气象和海洋行动”的联合出版物 3-59 [25] 明确阐述了这一点，指出其联合气象和海洋 (METOC) 行动的基石是准确性、一致性、相关性和及时性。为了实现准确度目标，他们指出，“METOC 数据和信息在代表当前和未来环境状态时必须是可衡量的正确”[25]。关于及时性，他们说，“及时性原则取决于产品源自最新的可用数据，快速处理和传播，并在适当的时间整合到规划和执行过程中”[25]。深度学习、数据驱动的模型通过提供一种快速获得任何给定区域的预测的方法，专门解决了准确性和及时性目标。

最后，尽管最近才成为主流研究领域，但数据驱动的方法并不排除结合已知的物理原理。原始方程提供了大气量如何在空间和时间上相互变化的数学描述，对于手头的问题而言是有价值的信息，而与特定的建模方法无关。这些方程可以在神经网络训练框架中使用，以激励符合已知物理定律的预测。这种方法利用了这些变量之间已知的物理关系，同时也受益于深度神经网络（DNN）提供的通用函数逼近能力[26]。