**在气候科学中,面对持续的建模和观测挑战,阻碍了我们对气候系统的理解,统计机器学习近年来成为了一个潜在的盟友。现代机器学习方法承诺利用来自气候模型模拟、卫星影像或现场测量的大量数据,推动我们对气候系统的理解,从而提升我们预见气候变化不利后果的能力。然而,如果没有与气候科学社区需求对接的共同努力,这一承诺可能会因资源浪费和未实现的期望而导致失望。**在本论文中,我们提出了一套设计机器学习模型的指导原则,帮助与气候科学社区的期望对接。这些指导原则包括:为问题有意义地指定模型,优先选择数学透明的模型,强调概率建模,并融入领域知识。接着,我们选择重点关注基于核的学习器,这是一类基于数据点之间相似度度量的机器学习算法,符合这些指导原则,并提供了关于其在回归任务中应用的相关背景。**本论文的核心贡献包括三项研究,展示了如何通过基于核的学习器来帮助应对气候科学中的挑战。**在第三章,我们从方法论角度出发,提出了一个框架和理论保证,说明如何在回归中融入气候科学中可能出现的一类领域知识:数据生成过程的因果结构。在第四章,我们考虑了气候科学中的一个应用建模挑战:开发便宜的替代计算密集型气候模型,称为气候模型模拟器。我们展示了如何将高斯过程(GP)建模融入一个基于物理动机的能量平衡模型,使我们能够制定一个简单的表面温度概率模拟器。我们称这个模拟器为FaIRGP,它可以从数据中学习,并优于纯粹基于过程的模拟器,同时保持由融入的能量平衡模型带来的稳健性。在第五章,我们考虑了气候科学中的一个应用观测挑战:获取气溶胶垂直剖面的全球估计。我们提出了一个基于高斯过程(GP)和卫星气溶胶反演算法启发式方法的贝叶斯模型,通过气溶胶光学深度测量和垂直分辨的气象数据来推断气溶胶垂直消光剖面。最后,在第六章中,我们对所展示的工作进行了总结,讨论了局限性,并提出了未来研究的方向。