Multivariate spatially-oriented data sets are prevalent in the environmental and physical sciences. Scientists seek to jointly model multiple variables, each indexed by a spatial location, to capture any underlying spatial association for each variable and associations among the different dependent variables. Multivariate latent spatial process models have proved effective in driving statistical inference and rendering better predictive inference at arbitrary locations for the spatial process. High-dimensional multivariate spatial data, which is the theme of this article, refers to data sets where the number of spatial locations and the number of spatially dependent variables is very large. The field has witnessed substantial developments in scalable models for univariate spatial processes, but such methods for multivariate spatial processes, especially when the number of outcomes are moderately large, are limited in comparison. Here, we extend scalable modeling strategies for a single process to multivariate processes. We pursue Bayesian inference which is attractive for full uncertainty quantification of the latent spatial process. Our approach exploits distribution theory for the Matrix-Normal distribution, which we use to construct scalable versions of a hierarchical linear model of coregionalization (LMC) and spatial factor models that deliver inference over a high-dimensional parameter space including the latent spatial process. We illustrate the computational and inferential benefits of our algorithms over competing methods using simulation studies and an analysis of a massive vegetation index data set.


翻译:在环境和物理科学中,以空间位置为索引的科学家寻求共同模拟多个变量,每个变量以空间位置为索引,以捕捉每个变量和不同依附变量之间关联的任何基本空间联系。多变量潜伏空间过程模型已证明在推动统计推导和为空间过程在任意地点提供更好的预测推导方面是有效的。高维多变量空间数据是本篇文章的主题,它是指空间位置数量和空间依赖变量数量非常大的数据集。这个领域在可伸缩的空间过程模型方面出现了重大发展,但多变量空间过程的这种方法,特别是结果数量不大的情况下,在比较方面是有限的。在这里,我们将单一过程的可扩缩模型战略推广到多变量过程。我们追求对潜在空间过程的充分不确定性量化具有吸引力的巴伊斯式空间数据推断。我们的方法利用矩阵-惯性分布理论来构建可伸缩模型的可伸缩版性直线模型,用以构建可伸缩的单位空间空间空间空间进程模型,包括高空间度的可变化模型,并用高空间度模型来解释。

0
下载
关闭预览

相关内容

Processing 是一门开源编程语言和与之配套的集成开发环境(IDE)的名称。Processing 在电子艺术和视觉设计社区被用来教授编程基础,并运用于大量的新媒体和互动艺术作品中。
剑桥大学《数据科学: 原理与实践》课程,附PPT下载
专知会员服务
49+阅读 · 2021年1月20日
【干货书】机器学习速查手册,135页pdf
专知会员服务
125+阅读 · 2020年11月20日
因果图,Causal Graphs,52页ppt
专知会员服务
246+阅读 · 2020年4月19日
2019年机器学习框架回顾
专知会员服务
35+阅读 · 2019年10月11日
MIT新书《强化学习与最优控制》
专知会员服务
275+阅读 · 2019年10月9日
已删除
将门创投
7+阅读 · 2019年10月15日
Auto-Encoding GAN
CreateAMind
7+阅读 · 2017年8月4日
VIP会员
相关资讯
已删除
将门创投
7+阅读 · 2019年10月15日
Auto-Encoding GAN
CreateAMind
7+阅读 · 2017年8月4日
Top
微信扫码咨询专知VIP会员