This thesis focuses on data that has complex spatio-temporal structure and on probabilistic graphical models that learn the structure in an interpretable and scalable manner. We target two research areas of interest: Gaussian graphical models for tensor-variate data and summarization of complex time-varying texts using topic models. This work advances the state-of-the-art in several directions. First, it introduces a new class of tensor-variate Gaussian graphical models via the Sylvester tensor equation. Second, it develops an optimization technique based on a fast-converging proximal alternating linearized minimization method, which scales tensor-variate Gaussian graphical model estimations to modern big-data settings. Third, it connects Kronecker-structured (inverse) covariance models with spatio-temporal partial differential equations (PDEs) and introduces a new framework for ensemble Kalman filtering that is capable of tracking chaotic physical systems. Fourth, it proposes a modular and interpretable framework for unsupervised and weakly-supervised probabilistic topic modeling of time-varying data that combines generative statistical models with computational geometric methods. Throughout, practical applications of the methodology are considered using real datasets. This includes brain-connectivity analysis using EEG data, space weather forecasting using solar imaging data, longitudinal analysis of public opinions using Twitter data, and mining of mental health related issues using TalkLife data. We show in each case that the graphical modeling framework introduced here leads to improved interpretability, accuracy, and scalability.
翻译:此日志侧重于具有复杂的时空结构的数据, 以及以可解释和可缩放的方式学习结构的概率图形模型。 我们针对两个感兴趣的研究领域: 高斯图形模型, 用于演示变异数据, 以及使用主题模型对复杂时间变化文本进行总和。 这项工作在几个方向上推进了最新艺术水平。 首先, 它通过 Sylvester Extoror等式, 引入了一个新的“ 温度变化” Gaussian 图形模型类别。 其次, 它开发了一种优化技术, 其基础是快速对准准的准度交替的线性温度图形模型, 将快速变异性高斯图形模型的估算与现代大数据设置相匹配。 第三, 它将Kronecker- 结构( 反向) 共变异模型与 音点部分差异方程式( PDEE) 相连接, 并引入一个新的框架, 用来跟踪混乱的物理系统。 第四, 它提出一个模型和可解释的模型, 使用不超缩和弱的模型, 数据模型, 数据模型, 使用实时的模型, 数据模型, 数据模型, 和 模型, 模型, 模型, 将数据模拟的模型, 和 模型, 模型, 模型, 模型, 模型, 模型, 模型, 模型, 模型, 模型, 模型, 模型, 模型, 模型, 模型, 模型, 模型, 模型, 模型, 模型, 模型, 模型, 模型, 模型, 模型, 模型, 模型, 模型, 模型, 模型, 模型, 模型, 模型, 模型, 模型, 模型, 模型, 模型, 模型, 模型, 模型, 模型, 模型, 模型, 模型, 模型, 模型, 模型, 模型, 模型, 模型, 模型, 模型, 模型, 模型, 模型, 模型, 模型, 模型, 模型, 模型, 模型, 模型, 模型, 模型, 模型, 模型, 模型, 模型, 模型, 模型, 模型, 模型, 模型, 模型, 模型, 模型, 模型, 模型