Hierarchical Bayesian methods enable information sharing across multiple related regression problems. While standard practice is to model regression parameters (effects) as (1) exchangeable across datasets and (2) correlated to differing degrees across covariates, we show that this approach exhibits poor statistical performance when the number of covariates exceeds the number of datasets. For instance, in statistical genetics, we might regress dozens of traits (defining datasets) for thousands of individuals (responses) on up to millions of genetic variants (covariates). When an analyst has more covariates than datasets, we argue that it is often more natural to instead model effects as (1) exchangeable across covariates and (2) correlated to differing degrees across datasets. To this end, we propose a hierarchical model expressing our alternative perspective. We devise an empirical Bayes estimator for learning the degree of correlation between datasets. We develop theory that demonstrates that our method outperforms the classic approach when the number of covariates dominates the number of datasets, and corroborate this result empirically on several high-dimensional multiple regression and classification problems.


翻译:虽然标准做法是将回归参数(效应)建模为(1) 可互换的跨数据集和(2) 与各种千差数不同程度相关联,但我们认为,当共变数的数量超过数据集的数量时,这一方法的统计性能较差。例如,在统计遗传学中,我们可能会倒退数千个人在多达数百万个基因变异(变数)方面的数十种特性(确定数据集(反应))。当分析师比数据集有更多的共变数时,我们争辩说,模型效果往往比较自然,因为:(1) 共变数之间可以互换,(2) 跨数据集不同程度相关。为此,我们提出一个等级模型,表达我们不同的视角。我们设计了一个经验性海湾估计器,用于学习数据集之间相互关系的程度。我们开发了一种理论,表明当共变数的数量主宰数据集的数量时,我们的方法比经典的方法要差,我们用几个高维的多重回归和分类问题来验证这一结果。

0
下载
关闭预览

相关内容

【2021新书】机器学习模型生产部署实践,161页pdf,
专知会员服务
110+阅读 · 2021年6月11日
剑桥大学《数据科学: 原理与实践》课程,附PPT下载
专知会员服务
47+阅读 · 2021年1月20日
专知会员服务
41+阅读 · 2020年12月18日
专知会员服务
50+阅读 · 2020年12月14日
【干货书】机器学习速查手册,135页pdf
专知会员服务
123+阅读 · 2020年11月20日
【2020新书】概率机器学习,附212页pdf与slides
专知会员服务
105+阅读 · 2020年11月12日
强化学习最新教程,17页pdf
专知会员服务
171+阅读 · 2019年10月11日
已删除
将门创投
12+阅读 · 2019年7月1日
Hierarchically Structured Meta-learning
CreateAMind
23+阅读 · 2019年5月22日
Transferring Knowledge across Learning Processes
CreateAMind
26+阅读 · 2019年5月18日
Unsupervised Learning via Meta-Learning
CreateAMind
41+阅读 · 2019年1月3日
Hierarchical Disentangled Representations
CreateAMind
4+阅读 · 2018年4月15日
【学习】Hierarchical Softmax
机器学习研究会
4+阅读 · 2017年8月6日
Arxiv
3+阅读 · 2020年5月1日
Arxiv
9+阅读 · 2019年4月19日
Arxiv
3+阅读 · 2018年2月24日
VIP会员
相关VIP内容
【2021新书】机器学习模型生产部署实践,161页pdf,
专知会员服务
110+阅读 · 2021年6月11日
剑桥大学《数据科学: 原理与实践》课程,附PPT下载
专知会员服务
47+阅读 · 2021年1月20日
专知会员服务
41+阅读 · 2020年12月18日
专知会员服务
50+阅读 · 2020年12月14日
【干货书】机器学习速查手册,135页pdf
专知会员服务
123+阅读 · 2020年11月20日
【2020新书】概率机器学习,附212页pdf与slides
专知会员服务
105+阅读 · 2020年11月12日
强化学习最新教程,17页pdf
专知会员服务
171+阅读 · 2019年10月11日
Top
微信扫码咨询专知VIP会员