用于多变量二进制数据的 MCMC MMC (Divide-and-Conquer MCMC for Multivariate Binary Data) - 专知论文

会员服务 ·

0

MCMC · binary · 估计/估计量 · 马尔可夫链蒙特卡罗 · 子采样 ·

2021 年 2 月 17 日

Divide-and-Conquer MCMC for Multivariate Binary Data

翻译：用于多变量二进制数据的 MCMC MMC

Suchit Mehrotra,Halley Brantley,Jacob Westman,Lauren Bangerter,Arnab Maity

We analyze a large database of de-identified Medicare Advantage claims from a single large US health insurance provider, where the number of individuals available for analysis are an order of magnitude larger than the number of potential covariates. This type of data, dubbed `tall data', often does not fit in memory, and estimating parameters using traditional Markov Chain Monte Carlo (MCMC) methods is a computationally infeasible task. We show how divide-and-conquer MCMC, which splits the data into disjoint subsamples and runs a MCMC algorithm on each sample in parallel before combining results, can be used with a multivariate probit factor model. We then show how this approach can be applied to large medical datasets to provide insights into questions of interest to the medical community. We also conduct a simulation study, comparing two posterior combination algorithms with a mean-field stochastic variational approach, showing that divide-and-conquer MCMC should be preferred over variational inference when estimating the latent correlation structure between binary responses is of primary interest.

翻译：我们分析一个单一的大型美国医疗保险提供商提供的关于确定医疗福利索赔的大型数据库,其中可供分析的人数数量比潜在共同变量的数量要大得多。这类称为“全部数据”的数据往往不适应记忆,并且使用传统的Markov 链条蒙特卡洛(MCMC)方法估算参数,这是一项计算不可行的任务。我们展示了如何将数据分为分解子样本并同时对每个样本同时进行MCMC算法的分解和合并结果,在计算结果之前,可以同时使用多变量的分辨参数模型。然后我们展示了如何将这种方法应用于大型医疗数据集,以深入了解医学界感兴趣的问题。我们还进行了模拟研究,将两种后种混合算法与平均场的分解变法进行比较,表明在估计二进制反应之间潜在的相关性结构时,偏好偏向偏向偏向偏向偏向偏向偏向偏向偏向偏向差异的混合模型。

0

相关内容

MCMC

INRIA最新「机器学习理论」新书，229页pdf原理性阐述机器学习

INRIA最新「机器学习理论」新书，229页pdf原理性阐述机器学习

专知会员服务

69+阅读 · 2021年3月27日

INRIA 最新《机器学习理论》课程笔记，176页pdf

专知会员服务

51+阅读 · 2020年12月14日

【干货书】机器学习速查手册，135页pdf

【干货书】机器学习速查手册，135页pdf

专知会员服务

127+阅读 · 2020年11月20日

【新书】R语言统计学习，R for Statistical Learning，301页pdf

专知会员服务

30+阅读 · 2020年11月4日

神经网络序列数据建模，229页ppt，Modeling Sequential Data with Neural Nets

神经网络序列数据建模，229页ppt，Modeling Sequential Data with Neural Nets

专知会员服务

67+阅读 · 2020年7月25日

图解FixMatch的半监督学习，The Illustrated FixMatch for Semi-Supervised Learning

图解FixMatch的半监督学习，The Illustrated FixMatch for Semi-Supervised Learning

专知会员服务

26+阅读 · 2020年4月2日

在线变分推断，76页ppt，A Regret Bound for Online Variational Inference

在线变分推断，76页ppt，A Regret Bound for Online Variational Inference

专知会员服务

21+阅读 · 2019年12月2日

Connections between Support Vector Machines, Wasserstein distance and gradient-penalty GANs

Connections between Support Vector Machines, Wasserstein distance and gradient-penalty GANs

专知会员服务

36+阅读 · 2019年10月17日

机器学习入门的经验与建议

机器学习入门的经验与建议

专知会员服务

94+阅读 · 2019年10月10日

最新BERT相关论文清单，BERT-related Papers

最新BERT相关论文清单，BERT-related Papers

专知会员服务

53+阅读 · 2019年9月29日

人工智能 | SCI期刊专刊信息3条

人工智能 | SCI期刊专刊信息3条

Call4Papers

5+阅读 · 2019年1月10日

Unsupervised Learning via Meta-Learning

Unsupervised Learning via Meta-Learning

CreateAMind

43+阅读 · 2019年1月3日

Disentangled的假设的探讨

Disentangled的假设的探讨

CreateAMind

9+阅读 · 2018年12月10日

【论文推荐】最新六篇主题模型相关论文—领域特定知识库、神经变分推断、动态和静态主题模型

【论文推荐】最新六篇主题模型相关论文—领域特定知识库、神经变分推断、动态和静态主题模型

专知

19+阅读 · 2018年6月26日

Hierarchical Disentangled Representations

Hierarchical Disentangled Representations

CreateAMind

4+阅读 · 2018年4月15日

【论文推荐】最新六篇主题模型相关论文—收敛率、大规模、深度主题建模、优化、情绪强度、广义动态主题模型

【论文推荐】最新六篇主题模型相关论文—收敛率、大规模、深度主题建模、优化、情绪强度、广义动态主题模型

专知

11+阅读 · 2018年3月29日

分布式TensorFlow入门指南

分布式TensorFlow入门指南

机器学习研究会

4+阅读 · 2017年11月28日

【论文】变分推断（Variational inference)的总结

【论文】变分推断（Variational inference)的总结

机器学习研究会

39+阅读 · 2017年11月16日

【推荐】RNN/LSTM时序预测

【推荐】RNN/LSTM时序预测

机器学习研究会

25+阅读 · 2017年9月8日

Auto-Encoding GAN

Auto-Encoding GAN

CreateAMind

7+阅读 · 2017年8月4日

On bandwidth selection problems in nonparametric trend estimation under martingale difference errors

Arxiv

0+阅读 · 2021年4月12日

Inference from Non-Random Samples Using Bayesian Machine Learning

Arxiv

0+阅读 · 2021年4月12日

Bayesian exponential random graph models for populations of networks

Arxiv

0+阅读 · 2021年4月11日

Mean-field Approximation for Stochastic Population Processes in Networks under Imperfect Information

Arxiv

0+阅读 · 2021年4月11日

Multiplicative non-Gaussian model error estimation in data assimilation

Arxiv

0+阅读 · 2021年4月10日

Statistical inference for a stochastic wave equation with Malliavin calculus

Arxiv

0+阅读 · 2021年4月9日

Approximate Bayesian inference from noisy likelihoods with Gaussian process emulated MCMC

Arxiv

0+阅读 · 2021年4月8日

Generalized Bayesian Likelihood-Free Inference Using Scoring Rules Estimators

Arxiv

0+阅读 · 2021年4月8日

Synthetic Likelihood in Misspecified Models: Consequences and Corrections

Arxiv

0+阅读 · 2021年4月8日

Interference and Generalization in Temporal Difference Learning

Arxiv

8+阅读 · 2020年3月13日

VIP会员

文章信息

相关主题

估计/估计量

马尔可夫链蒙特卡罗

相关VIP内容

INRIA最新「机器学习理论」新书，229页pdf原理性阐述机器学习

INRIA最新「机器学习理论」新书，229页pdf原理性阐述机器学习

专知会员服务

69+阅读 · 2021年3月27日

INRIA 最新《机器学习理论》课程笔记，176页pdf

专知会员服务

51+阅读 · 2020年12月14日

【干货书】机器学习速查手册，135页pdf

【干货书】机器学习速查手册，135页pdf

专知会员服务

127+阅读 · 2020年11月20日

【新书】R语言统计学习，R for Statistical Learning，301页pdf

专知会员服务

30+阅读 · 2020年11月4日

神经网络序列数据建模，229页ppt，Modeling Sequential Data with Neural Nets

神经网络序列数据建模，229页ppt，Modeling Sequential Data with Neural Nets

专知会员服务

67+阅读 · 2020年7月25日

图解FixMatch的半监督学习，The Illustrated FixMatch for Semi-Supervised Learning

图解FixMatch的半监督学习，The Illustrated FixMatch for Semi-Supervised Learning

专知会员服务

26+阅读 · 2020年4月2日

在线变分推断，76页ppt，A Regret Bound for Online Variational Inference

在线变分推断，76页ppt，A Regret Bound for Online Variational Inference

专知会员服务

21+阅读 · 2019年12月2日

Connections between Support Vector Machines, Wasserstein distance and gradient-penalty GANs

Connections between Support Vector Machines, Wasserstein distance and gradient-penalty GANs

专知会员服务

36+阅读 · 2019年10月17日

机器学习入门的经验与建议

机器学习入门的经验与建议

专知会员服务

94+阅读 · 2019年10月10日

最新BERT相关论文清单，BERT-related Papers

最新BERT相关论文清单，BERT-related Papers

专知会员服务

53+阅读 · 2019年9月29日

热门VIP内容

开通专知VIP会员享更多权益服务

《乌克兰无人机产业：志愿者与政策在构建新兴无人机产业中的协同作用》最新报告

《人工智能辅助决策中的数据可视化：系统性综述》

人工智能驱动弹药制造现代化：美国陆军转型之路

《敏捷作战部署中枢纽-辐条基地选址优化研究》80页

相关资讯

人工智能 | SCI期刊专刊信息3条

人工智能 | SCI期刊专刊信息3条

Call4Papers

5+阅读 · 2019年1月10日

Unsupervised Learning via Meta-Learning

Unsupervised Learning via Meta-Learning

CreateAMind

43+阅读 · 2019年1月3日

Disentangled的假设的探讨

Disentangled的假设的探讨

CreateAMind

9+阅读 · 2018年12月10日

【论文推荐】最新六篇主题模型相关论文—领域特定知识库、神经变分推断、动态和静态主题模型

【论文推荐】最新六篇主题模型相关论文—领域特定知识库、神经变分推断、动态和静态主题模型

专知

19+阅读 · 2018年6月26日

Hierarchical Disentangled Representations

Hierarchical Disentangled Representations

CreateAMind

4+阅读 · 2018年4月15日

【论文推荐】最新六篇主题模型相关论文—收敛率、大规模、深度主题建模、优化、情绪强度、广义动态主题模型

【论文推荐】最新六篇主题模型相关论文—收敛率、大规模、深度主题建模、优化、情绪强度、广义动态主题模型

专知

11+阅读 · 2018年3月29日

分布式TensorFlow入门指南

分布式TensorFlow入门指南

机器学习研究会

4+阅读 · 2017年11月28日

【论文】变分推断（Variational inference)的总结

【论文】变分推断（Variational inference)的总结

机器学习研究会

39+阅读 · 2017年11月16日

【推荐】RNN/LSTM时序预测

【推荐】RNN/LSTM时序预测

机器学习研究会

25+阅读 · 2017年9月8日

Auto-Encoding GAN

Auto-Encoding GAN

CreateAMind

7+阅读 · 2017年8月4日

相关论文

On bandwidth selection problems in nonparametric trend estimation under martingale difference errors

Arxiv

0+阅读 · 2021年4月12日

Inference from Non-Random Samples Using Bayesian Machine Learning

Arxiv

0+阅读 · 2021年4月12日

Bayesian exponential random graph models for populations of networks

Arxiv

0+阅读 · 2021年4月11日

Mean-field Approximation for Stochastic Population Processes in Networks under Imperfect Information

Arxiv

0+阅读 · 2021年4月11日

Multiplicative non-Gaussian model error estimation in data assimilation

Arxiv

0+阅读 · 2021年4月10日

Statistical inference for a stochastic wave equation with Malliavin calculus

Arxiv

0+阅读 · 2021年4月9日

Approximate Bayesian inference from noisy likelihoods with Gaussian process emulated MCMC

Arxiv

0+阅读 · 2021年4月8日

Generalized Bayesian Likelihood-Free Inference Using Scoring Rules Estimators

Arxiv

0+阅读 · 2021年4月8日

Synthetic Likelihood in Misspecified Models: Consequences and Corrections

Arxiv

0+阅读 · 2021年4月8日

Interference and Generalization in Temporal Difference Learning

Arxiv

8+阅读 · 2020年3月13日

微信扫码咨询专知VIP会员