A central challenge in climate science and applied mathematics is developing data-driven models of multiscale systems that capture both stationary statistics and responses to external perturbations. Current neural climate emulators aim to resolve the atmosphere-ocean system in all its complexity but often struggle to reproduce forced responses, limiting their use in causal studies such as Green's function experiments. To explore the origin of these limitations, we first examine a simplified dynamical system that retains key features of climate variability. We interpret the results through linear response theory, providing a rigorous framework to evaluate neural models beyond stationary statistics and to probe causal mechanisms. We argue that the ability of emulators of multiscale systems to reproduce perturbed statistics depends critically on (i) the choice of an appropriate coarse-grained representation and (ii) careful parameterizations of unresolved processes. These insights highlight reduced-order models, tailored to specific goals, processes, and scales, as valuable alternatives to general-purpose emulators. We next consider a real-world application by developing a neural model to investigate the joint variability of the surface temperature field and radiative fluxes. The model infers a multiplicative noise process directly from data, largely reproduces the system's probability distribution, and enables causal studies through forced responses. We discuss its limitations and outline directions for future work. Overall, these results expose key challenges in data-driven modeling of multiscale physical systems and underscore the value of coarse-grained, stochastic approaches, with response theory providing a principled framework to guide model design and enhance causal understanding.


翻译:气候科学与应用数学的一个核心挑战是发展能够同时捕捉多尺度系统的稳态统计特性与对外部扰动响应的数据驱动模型。当前基于神经网络的气候模拟器旨在以全复杂度解析大气-海洋系统,但往往难以复现强迫响应,这限制了其在格林函数实验等因果研究中的应用。为探究这些局限性的根源,我们首先考察了一个保留气候变率关键特征的简化动力系统。我们通过线性响应理论阐释结果,为评估神经模型提供了超越稳态统计的严谨框架,并用于探究因果机制。我们认为,多尺度系统模拟器复现扰动统计量的能力关键取决于:(i)选择合适的粗粒度表示方法,以及(ii)对未解析过程的精细参数化。这些见解凸显了针对特定目标、过程和尺度定制的降阶模型,可作为通用模拟器的有效替代方案。随后我们通过构建一个神经模型研究地表温度场与辐射通量的联合变率,展示了该方法在实际场景中的应用。该模型直接从数据中推断乘性噪声过程,基本复现了系统的概率分布,并通过强迫响应实现了因果研究。我们讨论了该模型的局限性并展望了未来研究方向。总体而言,这些结果揭示了多尺度物理系统数据驱动建模中的关键挑战,强调了粗粒度随机方法的价值,而响应理论为指导模型设计和深化因果理解提供了原则性框架。

0
下载
关闭预览

相关内容

深度学习与基础模型在天气预测中的应用:综述
专知会员服务
24+阅读 · 1月15日
【CVPR2022】MSDN: 零样本学习的互语义蒸馏网络
专知会员服务
21+阅读 · 2022年3月8日
时空数据挖掘:综述
专知
34+阅读 · 2022年6月30日
LibRec 每周算法:LDA主题模型
LibRec智能推荐
29+阅读 · 2017年12月4日
Spark机器学习:矩阵及推荐算法
LibRec智能推荐
16+阅读 · 2017年8月3日
国家自然科学基金
0+阅读 · 2015年12月31日
国家自然科学基金
0+阅读 · 2015年12月31日
国家自然科学基金
0+阅读 · 2015年12月31日
国家自然科学基金
0+阅读 · 2014年12月31日
国家自然科学基金
0+阅读 · 2014年12月31日
VIP会员
相关资讯
时空数据挖掘:综述
专知
34+阅读 · 2022年6月30日
LibRec 每周算法:LDA主题模型
LibRec智能推荐
29+阅读 · 2017年12月4日
Spark机器学习:矩阵及推荐算法
LibRec智能推荐
16+阅读 · 2017年8月3日
相关基金
国家自然科学基金
0+阅读 · 2015年12月31日
国家自然科学基金
0+阅读 · 2015年12月31日
国家自然科学基金
0+阅读 · 2015年12月31日
国家自然科学基金
0+阅读 · 2014年12月31日
国家自然科学基金
0+阅读 · 2014年12月31日
Top
微信扫码咨询专知VIP会员