AI攻占实时天气预测？谷歌命名MetNet，实力吊打物理预测模型！

会员服务 ·

AI攻占实时天气预测？谷歌命名MetNet，实力吊打物理预测模型！

2020 年 4 月 6 日 AI科技评论

作者 | 蒋宝尚

编辑 | 丛末

近日，谷歌发布了他们使用深度学习预测天气的最新结果，在对之前降水量预报的研究基础上，提出了名字为MetNet的神经网络。

此网络模型专门用于降水预报，可以预测未来8小时内高精度降水概率分布地图，分辨率1千米，时间步长2分钟；预测结果超越目前最好的基于物理模型的数值算法 (High Precision Rapid Refresh-HRRR)。

论文下载地址：https://arxiv.org/pdf/2003.12140.pdf

与传统的数值方法相比，神经网络方法有着更加丰富的输入，卫星地图、地面雷法、天气观测站能够提供连续的时间空间结构数据。

MetNet 不依赖于大气动力学领域的物理定律，能够通过反向传播学习，直接从观测数据中预测天气。

MetNet 的结构

如上图所示，整个网络架构以深度神经网络（DNNs）为基础，先使用一个共享的卷积神经网络，将输入图片降采样。然后再使用卷积 LSTM 网络处理输入图像的时间序列问题。最后一个模块是轴注意力 (Axial Attention) 网络，作用是对时空编码进行解码，这个轴注意力可以理解为对自注意力机制的加速。

基于神经网络的天气模型

该网络的输入数据为每个时刻的卫星云图，雷达数据，经纬度，海拔，当前时间，待预测时间。每个时刻的卫星云图有16张，来自不同波段的光学成相。

输出数据为一个离散的概率分布，估计美国大陆每平方公里的给定降水率的概率，单位是毫米每小时。即输出数据为三维向量，包含一维时间和二维空间上的降水量。

在具体的模型运行过程中，地图精度为1千米，每64km*64km运行一次。在考虑云层和降水区域的移动和大气的相关运动情况下，与输出区域相比，输入数据的实际物理覆盖范围要大得多。

由于处理1024kmx1024km分辨率需要消耗非常大的内存，研究人员对输入数据进行下采样以降低计算需求，同时保持了输入数据中相关天气的模式。随后利用基于LSTM的时域编码器在时间维度上进行降采样，将先前90mins的数据以15mins的间隔进行编码。时域编码器的输出随后被送入到空间聚合器中，并给予自注意力机制高效地抽取数据中长程空间相关性。

整个天气预测模型可以简化为上面这个公式，给定输入，用训练后的θ，可以得到一个条件概率。θ的训练由反向传播求得，即最小化实际值与预测值之间的差额。

值得注意的是，给定的数据集并不是连续的，处理方法是把离散值的分组成不同的区间。

输入数据和MetNet结构示意图

更为具体一些，如上图所示，除了输入，模型主体有3个部分，包括空间下采样器、时间编码器、空间聚合器。

空间下采样器：MetNet使用卷积和池层在空间层面上处理输入的数据，根据时间维度对切片进行处理，每个输入切片被封装的空间维度为256*256，然后对每个切片进行适合神经网络层的处理。
时间编码器：这部分是把上面的空间切片按照时间顺序提供给循环神经网络，循环神经网络能够测量输入数据的时间动态，并且能够根据这个动态找出相关的模式信息（上下文）。
空间聚合器：这部分包含8个轴注意力网络，其中4个是沿宽度操作的，4个是沿高度操作的。这8个网络的作用是使MetNet的接收域涵盖全局信息。