Clouds play an important role in the Earth's energy budget and their behavior is one of the largest uncertainties in future climate projections. Satellite observations should help in understanding cloud responses, but decades and petabytes of multispectral cloud imagery have to date received only limited use. This study reduces the dimensionality of satellite cloud observations by grouping them via a novel automated, unsupervised cloud classification technique by using a convolutional neural network. Our technique combines a rotation-invariant autoencoder with hierarchical agglomerative clustering to generate cloud clusters that capture meaningful distinctions among cloud textures, using only raw multispectral imagery as input. Thus, cloud classes are defined without reliance on location, time/season, derived physical properties, or pre-designated class definitions. We use this approach to generate a unique new cloud dataset, the AI-driven cloud classification atlas (AICCA), which clusters 22 years of ocean images from the Moderate Resolution Imaging Spectroradiometer (MODIS) on NASA's Aqua and Terra instruments - 800 TB of data or 198 million patches roughly 100 km x 100 km (128 x 128 pixels) - into 42 AI-generated cloud classes. We show that AICCA classes involve meaningful distinctions that employ spatial information and result in distinct geographic distributions, capturing, for example, stratocumulus decks along the West coasts of North and South America. AICCA delivers the information in multi-spectral images in a compact form, enables data-driven diagnosis of patterns of cloud organization, provides insight into cloud evolution on timescales of hours to decades, and helps democratize climate research by facilitating access to core data.
翻译:云云在地球的能源预算中起着重要作用, 其行为是未来气候预测中最大的不确定因素之一。 卫星观测应有助于理解云的反应, 但数十年多光谱云图像和小字节迄今只得到有限的使用。 本研究通过使用一个革命性神经网络, 将卫星云的云分解技术分组, 从而降低卫星云观测的维度。 我们的技术将旋转不易变自动、 不受监督的云分解技术与等级分级的云分解组合在一起, 以生成云层群群, 捕捉云体之间有意义的区别, 仅使用原始多光谱图像作为投入。 因此, 云级的确定并不依赖于地点、 时间/ 季节、 衍生的物理属性或预指定的类别定义。 我们使用这种方法生成独特的新云数据集, AI- 驱动的云分类图集将22年的海洋图像集中起来, 这些图像来自美国航天局的氨基和铁质谱仪( MODIS), 数据800 或大约1.98万分的云级的云层图段 x 100公里的云层 。 (xx128x) 地理级, 我们利用了不同的气候分类, 组织 将不同的图像数据 的图像数据, 组织 将不同的图像 将数据 进行 将 向 的 ASBAL 组织 AS 递解到 AL AL 组织 的 向 的 的 AL AI- cal 的 的 的 的 向 向 AS AS 向 向 的 的 的 的 递增 AL AL 递增 递增 递增 递 的 的 的 的 递 的 的 的 的 的 的 的 的 的 的 的 的 的 的 的 的 的 的 的 的 的 的 的 AL 的 的 的 递增 AL AL AL AL AL 递 递 递 递 递 的 AL 的 递 递 的 的 的 的 的 的 的 的 递 提供 AL AL AL AL AL AL AL AL 的 的