第1章引言

二十一世纪的第二个十年是一个快速技术革新的时期。强大的计算机、快速的网速和智能设备以及爆炸性的科技产业的扩散，共同创造了在深度和广度上前所未有的信息洪流。这种数据流太庞大了，仅靠人类是无法分析的。计算机科学和技术的进步已经开启了使用人工智能（AI）来协助完成这项任务。海军部（DON）已经认识到人工智能的效用，并对这项技术的应用进行了投资。这些应用之一是使用人工智能，特别是深度学习和神经网络，来消化卫星图像的巨大数据集，为预测目的对数据进行分割和分类[1]。在过去，DON天气预报员和情报分析员会手动解释这些数据并进行预测。在未来，人工智能驱动的模型可以协助预报员和分析员提供比人类分析员单独产生的预测更准确的预测。

为了自动从卫星图像数据集中提取信息用于分类和预测，目前的研究主要集中在使用监督学习算法，如深度卷积神经网络（DCNN）。DCNNs已经被成功地应用于图像的自动分类[2]。在这个应用中，图像被输入到一个DCNN中，它从图像的通道中提取信息来预测图像中包含的内容，然后在输出端提供一个决定，如果图像的内容属于一个特定的类别（例如，图像是一张船的图片）。这种方法已经被用来对给定的户外图像中的天气进行分类[3]。本论文提出，同样的方法可用于对气象学目的的卫星遥感图像进行分类，如将降水事件分为对流型和层状型，这两类对流描述了典型的上下运动和二元加热的垂直剖面，这些过程对所有空间和时间尺度的大气现象至关重要。

贝叶斯深度学习是人工智能/机器学习（AI/ML）社区中一个发展良好的领域，它通过考虑模型在权重空间中的不确定性，实现了模型复杂性和数据拟合之间的平衡，为经典的深度学习方法提供了一个替代方案。Kendall和Gal[4]首次证明贝叶斯深度学习方法提高了神经网络的性能，同时为计算机视觉任务的预测提供了不确定性估计。

这项工作的重点是量化在多光谱卫星数据上训练的深度学习模型的不确定性，并在Petković和Orescanin[5]以前的工作基础上，将多个贝叶斯卷积神经网络（BCN）架构应用于同一任务。具体来说，多光谱无源微波（PMW）卫星数据将被用作几种不同类型的BCNN的输入数据，目的是提供可被同化到大气预报模型中的合成对流型观测数据和相关不确定性。此外，使用这些贝叶斯神经网络得到的结果将作为这些不同的贝叶斯方法的基准，并将进行分析，以研究在类似的输入数据下每个模型的输出差异。所产生的合成产品、贝叶斯神经网络的使用以及所使用的贝叶斯方法的基准标记，对这一应用是新颖的，是对计算机科学和气象学领域的原创性贡献。

1.1 问题陈述

本论文要解决的问题主要有两个。首先，贝叶斯深度学习在对流天气类型预测中的应用还没有发生过。虽然Petković和Orescanin[5]将传统的深度学习应用于这一任务并取得了巨大的成功，但有几个原因说明贝叶斯深度学习的推进可能是有利的。首先，传统的深度学习模型只是输出一个预测，而BCNN不仅会做出预测，而且会输出模型在该预测中的不确定性。这种不确定性可以进一步用于确定该预测是否符合决策中的信心阈值。Orescanin等人在[6]的研究中证明了前面两个原因。此外，对预测的不确定性进行建模，可以对模型进行训练，使这些不确定性最小化，并根据不同的不确定性类型改善预测结果。具体来说，Kendall和Gal证明了BCNN可以通过对不确定性的建模来训练学习损失衰减，这比非贝叶斯基线模型提高了高达3%的模型精度[4]。

开发一个能够准确分类降水事件的BCNN，同时提供不确定性的估计，可以在很多方面使DON受益。首先，这项任务将提供来自单一来源的信息，而以前（没有BCNN）需要两种仪器来测量。详细说来，从PMW观测中得出对流类型，目前需要在PMW传感器数据之外使用降水事件的天底点雷达观测。有了BCNN，这个任务就可以通过一个PMW传感器仪器和BCNN一起完成了。此外，证明在气象背景下量化BCNN卫星图像分类预测的不确定性的能力，可以为DON其他卫星-遥感应用中的BCNN研究提供基础。例如，卫星数据的自动对流和层状分类将有助于约束卫星衍生的降水估计，因为对流和层状降水的微观物理和运动结构有很大不同。这种改进的观测结果最终可能有助于改进美国国防部数值模式中各种大气过程的表现，如海军全球环境模式（NAVGEM）、海洋/大气耦合中尺度预测系统（COAMPS）和未来几代模式，如利用NUMA核心的海军环境预测系统（NEPTUNE）。

第二个要解决的问题是对各种贝叶斯方法的原始性能和不确定性量化的质量进行基准测试。关于这些不确定性，Kendall和Gal[4]证明了有可能通过BCNN架构在神经网络中提取无常和认识上的不确定性。此外，还可以估计模型的无常和认识上的不确定性。在BCNN中对不确定性进行建模，可以使用户量化由于观测（即输入数据）中的噪声而导致的模型不确定性，而对认识上的不确定性进行建模，可以量化由于模型相对于真实模型的偏差而导致的不确定性。只要有足够的数据，认识上的不确定性是可以被解释的，并且可以减少。

该领域研究的一个发展趋势是对贝叶斯方法进行基准测试，以便更好地了解每种方法固有的性能权衡。截至目前，Filos等人[7]使用病人视网膜的临床扫描来检测是否存在糖尿病视网膜病变，对贝叶斯模型进行了基准测试。本论文将在这一研究的基础上，利用大规模的、平衡的、可操作的PMW图像数据集开发新的贝叶斯基准。使用该数据集开发贝叶斯基准可以为DON提供一个真实世界的操作基准，以促进该领域的未来研究和发展。

1.2 研究目标

本论文有两个主要研究任务。第一个任务是将PMW多光谱卫星图像中的降水事件分类为对流性或层状。第二项任务是为即将实施的三种贝叶斯方法提供性能基准。

本论文要解决的研究目标如下：

1.确定贝叶斯CNN是否能比确定性CNN和运行中的戈达德剖析算法（GPROF）更准确地对云对流等级进行分类。

2.确定哪些贝叶斯CNN模型架构在多谱段卫星数据上表现良好。

3.调查对三种不同类型的不确定性进行建模并通过所述不确定性进行过滤如何影响贝叶斯模型的分类性能。

4.研究通过三种不确定性类型进行估计和过滤的模型性能折衷。

5.开发新的贝叶斯模型基准，用于大规模数据集，并用其评估贝叶斯模型的性能。

为了实现这些目标，本论文将提出并开发三个BCNN模型，以便从无源微波（PMW）卫星图像中对云层对流等级（层状与对流）进行分类。此外，BCNN模型的性能将与NASA目前用于该任务的算法（GPROF）和确定性CNN的性能进行比较。

接下来，将根据几个标准指标对开发的BCNN模型的性能进行分析。本论文的创新之处在于开发了一系列的基准，以量化模型预测在空间背景下的不确定性。这些基准将确定总的预测不确定性、无误差的不确定性和认识上的不确定性中的空间不确定性。最后，将研究提供无误差和表观不确定性估计的效用，并探讨估计总不确定性与估计无误差和表观不确定性的模型性能权衡。

1.3 组织

本论文将首先概述贝叶斯深度学习、该领域过去和现在的研究，以及本论文将如何建立在以前的工作之上。此外，还将详细介绍贝叶斯方法的推导。接下来，将对实验方法进行深入讨论。这一部分将包括对所使用的数据集、实现的模型架构、使用的指标和贝叶斯模型基准的实现的讨论。在方法论部分之后是详细说明实验结果的部分。最后，将详细介绍研究结论和未来工作。