AI攻占实时天气预测?谷歌命名MetNet,实力吊打物理预测模型!

2020 年 4 月 6 日 AI科技评论


作者 | 蒋宝尚
编辑 | 丛   末


近日,谷歌发布了他们使用深度学习预测天气的最新结果,在对之前降水量预报的研究基础上,提出了名字为MetNet的神经网络。

此网络模型专门用于降水预报,可以预测未来8小时内高精度降水概率分布地图,分辨率1千米,时间步长2分钟;预测结果超越目前最好的基于物理模型的数值算法 (High Precision Rapid Refresh-HRRR)。

论文下载地址:https://arxiv.org/pdf/2003.12140.pdf


与传统的数值方法相比,神经网络方法有着更加丰富的输入,卫星地图、地面雷法、天气观测站能够提供连续的时间空间结构数据。

MetNet 不依赖于大气动力学领域的物理定律,能够通过反向传播学习,直接从观测数据中预测天气。

MetNet 的结构

如上图所示,整个网络架构以深度神经网络(DNNs)为基础,先使用一个共享的卷积神经网络,将输入图片降采样。然后再使用卷积 LSTM 网络处理输入图像的时间序列问题。最后一个模块是轴注意力 (Axial Attention) 网络,作用是对时空编码进行解码,这个轴注意力可以理解为对自注意力机制的加速。


1


基于神经网络的天气模型


该网络的输入数据为每个时刻的卫星云图,雷达数据,经纬度,海拔,当前时间,待预测时间。每个时刻的卫星云图有16张,来自不同波段的光学成相。

输出数据为一个离散的概率分布,估计美国大陆每平方公里的给定降水率的概率,单位是毫米每小时。即输出数据为三维向量,包含一维时间和二维空间上的降水量。


在具体的模型运行过程中,地图精度为1千米,每64km*64km运行一次。在考虑云层和降水区域的移动和大气的相关运动情况下,与输出区域相比,输入数据的实际物理覆盖范围要大得多。

由于处理1024kmx1024km分辨率需要消耗非常大的内存,研究人员对输入数据进行下采样以降低计算需求,同时保持了输入数据中相关天气的模式。随后利用基于LSTM的时域编码器在时间维度上进行降采样,将先前90mins的数据以15mins的间隔进行编码。时域编码器的输出随后被送入到空间聚合器中,并给予自注意力机制高效地抽取数据中长程空间相关性。


整个天气预测模型可以简化为上面这个公式,给定输入,用训练后的θ,可以得到一个条件概率。θ的训练由反向传播求得,即最小化实际值与预测值之间的差额。

值得注意的是,给定的数据集并不是连续的,处理方法是把离散值的分组成不同的区间。

输入数据和MetNet结构示意图

更为具体一些,如上图所示,除了输入,模型主体有3个部分,包括空间下采样器、时间编码器、空间聚合器。

  • 空间下采样器:MetNet使用卷积和池层在空间层面上处理输入的数据,根据时间维度对切片进行处理,每个输入切片被封装的空间维度为256*256,然后对每个切片进行适合神经网络层的处理。

  • 时间编码器:这部分是把上面的空间切片按照时间顺序提供给循环神经网络,循环神经网络能够测量输入数据的时间动态,并且能够根据这个动态找出相关的模式信息(上下文)。

  • 空间聚合器:这部分包含8个轴注意力网络,其中4个是沿宽度操作的,4个是沿高度操作的。这8个网络的作用是使MetNet的接收域涵盖全局信息。



2


实验:准确率远超物理模型

研究人员根据一个降水率预测基准对 MetNet 进行评估,并将结果与两个基线进行比较:NOAA 高分辨率快速刷新 HRRR 系统,这是目前在美国运行的物理天气预测模型;一个估计降水场运动(即光流)的基线模型,它是一种在预测时间少于 2 小时时,表现也很好的方法。

谷歌的神经天气模型的一个显著优点是,它是为密集并行计算而优化的,并且非常适合在专用硬件(如 TPU)上运行。无论是针对纽约市这样的特定地点还是针对整个美国,预测可以在几秒钟内并行进行。而像 HRRR 这样的物理模型在超级计算机上的运行时间约为一小时。

在下面的图表中,研究人员量化了 MetNet、HRRR 和光流基线模型之间的性能差异。这里展示了这三个模型所取得的性能,在降水率阈值为 1.0mm/h(相当于小雨)时使用 F1 分数进行评估。MetNet 神经天气模型能够在 8 小时内超过 NOAA-HRRR 系统,并且始终优于基于流量的模型。

1.0 mm/h 降水率(越高越好)下的 F1 得分评估性能。神经天气模型(MetNet)比目前在美国运行的基于物理的模型(HRRR)的时间尺度要提前 8 小时

由于大气的随机性,未来天气状况的不确定性随着预测时间的延长而增加。 MetNet 是一个概率模型,随着预测时间的延长,预测的不确定性在可视化中表现为预测的日益平滑。相反,HRRR 并不直接进行概率预测,而是会对未来的降水情况进行单一的预测。下图比较了 MetNet 模型和 HRRR 模型的输出。


从 NOAA MRMS 系统获得的 MetNet(上)和 HRRR(下)到地面真值(中)的输出之间的比较。注意,虽然 HRRR 模型预测的结构似乎更接近于基本事实,但预测的结构可能严重错误。

与MetNet模型相比,HRRR 物理模型的预测更清晰、更结构化。但其结构,特别是预测结构的准确时间和位置的精度较低。这是由于初始情况和模型参数的不确定性造成的。
 

HRRR(左)从许多可能的结果中预测单个潜在的未来结果(红色),而 MetNet(右)能够解释不确定性。


另外,研究人员对 HRRR 和 MetNet模型之间进行了比较,结果如下面这个视频所示☟





点击“ 阅读原文” 查看 ICLR 系列论文解读
登录查看更多
1

相关内容

向您推介实时天气 - 迄今最为精美的天气应用程序。针对 iOS 10 进行了优化设置!
【IJCAI2020】图神经网络预测结构化实体交互
专知会员服务
43+阅读 · 2020年5月13日
【ACL2020-Google】逆向工程配置的神经文本生成模型
专知会员服务
17+阅读 · 2020年4月20日
近期必读的5篇顶会WWW2020【推荐系统】相关论文-Part2
专知会员服务
70+阅读 · 2020年4月7日
自回归模型:PixelCNN
专知会员服务
27+阅读 · 2020年3月21日
【华侨大学】基于混合深度学习算法的疾病预测模型
专知会员服务
97+阅读 · 2020年1月21日
必读的7篇IJCAI 2019【图神经网络(GNN)】相关论文-Part2
专知会员服务
61+阅读 · 2020年1月10日
ACL 2019开源论文 | 基于Attention的知识图谱关系预测
从十篇热门学术论文看计算机视觉的未来
计算机视觉life
6+阅读 · 2019年9月11日
开学综合症有救了!17篇最新AI论文不容错过
PaperWeekly
6+阅读 · 2019年3月1日
如何为LSTM重新构建输入数据(Keras)
全球人工智能
6+阅读 · 2017年10月13日
Do RNN and LSTM have Long Memory?
Arxiv
19+阅读 · 2020年6月10日
Arxiv
12+阅读 · 2018年9月5日
Arxiv
5+阅读 · 2018年5月5日
Arxiv
6+阅读 · 2018年4月4日
Arxiv
7+阅读 · 2018年1月30日
Arxiv
5+阅读 · 2017年12月29日
VIP会员
相关VIP内容
【IJCAI2020】图神经网络预测结构化实体交互
专知会员服务
43+阅读 · 2020年5月13日
【ACL2020-Google】逆向工程配置的神经文本生成模型
专知会员服务
17+阅读 · 2020年4月20日
近期必读的5篇顶会WWW2020【推荐系统】相关论文-Part2
专知会员服务
70+阅读 · 2020年4月7日
自回归模型:PixelCNN
专知会员服务
27+阅读 · 2020年3月21日
【华侨大学】基于混合深度学习算法的疾病预测模型
专知会员服务
97+阅读 · 2020年1月21日
必读的7篇IJCAI 2019【图神经网络(GNN)】相关论文-Part2
专知会员服务
61+阅读 · 2020年1月10日
相关论文
Do RNN and LSTM have Long Memory?
Arxiv
19+阅读 · 2020年6月10日
Arxiv
12+阅读 · 2018年9月5日
Arxiv
5+阅读 · 2018年5月5日
Arxiv
6+阅读 · 2018年4月4日
Arxiv
7+阅读 · 2018年1月30日
Arxiv
5+阅读 · 2017年12月29日
Top
微信扫码咨询专知VIP会员