近日,谷歌发布了他们使用深度学习预测天气的最新结果,在对之前降水量预报的研究基础上,提出了名字为MetNet的神经网络。
此网络模型专门用于降水预报,可以预测未来8小时内高精度降水概率分布地图,分辨率1千米,时间步长2分钟;预测结果超越目前最好的基于物理模型的数值算法 (High Precision Rapid Refresh-HRRR)。
论文下载地址:https://arxiv.org/pdf/2003.12140.pdf
与传统的数值方法相比,神经网络方法有着更加丰富的输入,卫星地图、地面雷法、天气观测站能够提供连续的时间空间结构数据。
MetNet 不依赖于大气动力学领域的物理定律,能够通过反向传播学习,直接从观测数据中预测天气。
如上图所示,整个网络架构以深度神经网络(DNNs)为基础,先使用一个共享的卷积神经网络,将输入图片降采样。然后再使用卷积 LSTM 网络处理输入图像的时间序列问题。最后一个模块是轴注意力 (Axial Attention) 网络,作用是对时空编码进行解码,这个轴注意力可以理解为对自注意力机制的加速。
基于神经网络的天气模型
该网络的输入数据为每个时刻的卫星云图,雷达数据,经纬度,海拔,当前时间,待预测时间。每个时刻的卫星云图有16张,来自不同波段的光学成相。
输出数据为一个离散的概率分布,估计美国大陆每平方公里的给定降水率的概率,单位是毫米每小时。即输出数据为三维向量,包含一维时间和二维空间上的降水量。
在具体的模型运行过程中,地图精度为1千米,每64km*64km运行一次。在考虑云层和降水区域的移动和大气的相关运动情况下,与输出区域相比,输入数据的实际物理覆盖范围要大得多。
由于处理1024kmx1024km分辨率需要消耗非常大的内存,研究人员对输入数据进行下采样以降低计算需求,同时保持了输入数据中相关天气的模式。随后利用基于LSTM的时域编码器在时间维度上进行降采样,将先前90mins的数据以15mins的间隔进行编码。时域编码器的输出随后被送入到空间聚合器中,并给予自注意力机制高效地抽取数据中长程空间相关性。
整个天气预测模型可以简化为上面这个公式,给定输入,用训练后的θ,可以得到一个条件概率。θ的训练由反向传播求得,即最小化实际值与预测值之间的差额。
值得注意的是,给定的数据集并不是连续的,处理方法是把离散值的分组成不同的区间。
更为具体一些,如上图所示,除了输入,模型主体有3个部分,包括空间下采样器、时间编码器、空间聚合器。
空间下采样器:MetNet使用卷积和池层在空间层面上处理输入的数据,根据时间维度对切片进行处理,每个输入切片被封装的空间维度为256*256,然后对每个切片进行适合神经网络层的处理。
时间编码器:这部分是把上面的空间切片按照时间顺序提供给循环神经网络,循环神经网络能够测量输入数据的时间动态,并且能够根据这个动态找出相关的模式信息(上下文)。
空间聚合器:这部分包含8个轴注意力网络,其中4个是沿宽度操作的,4个是沿高度操作的。这8个网络的作用是使MetNet的接收域涵盖全局信息。
实验:准确率远超物理模型
研究人员根据一个降水率预测基准对 MetNet 进行评估,并将结果与两个基线进行比较:NOAA 高分辨率快速刷新 HRRR 系统,这是目前在美国运行的物理天气预测模型;一个估计降水场运动(即光流)的基线模型,它是一种在预测时间少于 2 小时时,表现也很好的方法。
谷歌的神经天气模型的一个显著优点是,它是为密集并行计算而优化的,并且非常适合在专用硬件(如 TPU)上运行。无论是针对纽约市这样的特定地点还是针对整个美国,预测可以在几秒钟内并行进行。而像 HRRR 这样的物理模型在超级计算机上的运行时间约为一小时。
在下面的图表中,研究人员量化了 MetNet、HRRR 和光流基线模型之间的性能差异。这里展示了这三个模型所取得的性能,在降水率阈值为 1.0mm/h(相当于小雨)时使用 F1 分数进行评估。MetNet 神经天气模型能够在 8 小时内超过 NOAA-HRRR 系统,并且始终优于基于流量的模型。
1.0 mm/h 降水率(越高越好)下的 F1 得分评估性能。神经天气模型(MetNet)比目前在美国运行的基于物理的模型(HRRR)的时间尺度要提前 8 小时
。
由于大气的随机性,未来天气状况的不确定性随着预测时间的延长而增加。
MetNet 是一个概率模型,随着预测时间的延长,预测的不确定性在可视化中表现为预测的日益平滑。相反,HRRR 并不直接进行概率预测,而是会对未来的降水情况进行单一的预测。下图比较了 MetNet 模型和 HRRR 模型的输出。
从 NOAA MRMS 系统获得的 MetNet(上)和 HRRR(下)到地面真值(中)的输出之间的比较。注意,虽然 HRRR 模型预测的结构似乎更接近于基本事实,但预测的结构可能严重错误。
与MetNet模型相比,HRRR 物理模型的预测更清晰、更结构化。但其结构,特别是预测结构的准确时间和位置的精度较低。这是由于初始情况和模型参数的不确定性造成的。
HRRR(左)从许多可能的结果中预测单个潜在的未来结果(红色),而 MetNet(右)能够解释不确定性。
另外,研究人员对 HRRR 和 MetNet模型之间进行了比较,结果如下面这个视频所示☟
点击“
阅读原文” 查看 ICLR 系列论文解读