We present the backbone method, a generic framework that enables sparse and interpretable supervised machine learning methods to scale to ultra-high dimensional problems. We solve sparse regression problems with $10^7$ features in minutes and $10^8$ features in hours, as well as decision tree problems with $10^5$ features in minutes. The proposed method operates in two phases; we first determine the backbone set, that consists of potentially relevant features, by solving a number of tractable subproblems; then, we solve a reduced problem, considering only the backbone features. For the sparse regression problem, we show that, under certain assumptions and with high probability, the backbone set consists of the true relevant features. Numerical experiments on both synthetic and real-world datasets demonstrate that our method outperforms or competes with state-of-the-art methods in ultra-high dimensional problems, and competes with optimal solutions in problems where exact methods scale, both in terms of recovering the true relevant features and in its out-of-sample predictive performance.


翻译:我们提出主干法,这是一个通用框架,使稀有和可解释的受监督的机器学习方法能够推广到超高维问题。我们用每分钟10瓦7美元的特征和每小时10瓦8美元的特征解决稀疏回归问题,用每分钟10瓦5美元的特征解决决策树问题。拟议方法分两个阶段运作;我们首先确定由潜在相关特征组成的主干法,通过解决若干可移植的子问题;然后,我们解决一个减少的问题,只考虑主干法。对于稀少的回归问题,我们表明,在某些假设和可能性很高的情况下,主干法由真实的相关特征组成。合成和真实世界数据集的量化实验表明,在超高维问题中,我们的方法优于或与最先进的方法竞争,在精确方法规模的问题上,无论是从恢复真正相关特征的角度,还是从模拟的预测性能中,都与最佳解决方案竞争。

0
下载
关闭预览

相关内容

【干货书】机器学习速查手册,135页pdf
专知会员服务
124+阅读 · 2020年11月20日
【2020新书】图机器学习,Graph-Powered Machine Learning
专知会员服务
339+阅读 · 2020年1月27日
【CMU】机器学习导论课程(Introduction to Machine Learning)
专知会员服务
58+阅读 · 2019年8月26日
Hierarchically Structured Meta-learning
CreateAMind
23+阅读 · 2019年5月22日
Transferring Knowledge across Learning Processes
CreateAMind
26+阅读 · 2019年5月18日
强化学习的Unsupervised Meta-Learning
CreateAMind
17+阅读 · 2019年1月7日
Unsupervised Learning via Meta-Learning
CreateAMind
41+阅读 · 2019年1月3日
Hierarchical Disentangled Representations
CreateAMind
4+阅读 · 2018年4月15日
Machine Learning:十大机器学习算法
开源中国
19+阅读 · 2018年3月1日
【论文】变分推断(Variational inference)的总结
机器学习研究会
39+阅读 · 2017年11月16日
Auto-Encoding GAN
CreateAMind
7+阅读 · 2017年8月4日
Arxiv
0+阅读 · 2021年6月17日
Arxiv
13+阅读 · 2019年11月14日
Deep Learning
Arxiv
6+阅读 · 2018年8月3日
Arxiv
4+阅读 · 2018年3月19日
Arxiv
3+阅读 · 2017年12月14日
VIP会员
相关资讯
Hierarchically Structured Meta-learning
CreateAMind
23+阅读 · 2019年5月22日
Transferring Knowledge across Learning Processes
CreateAMind
26+阅读 · 2019年5月18日
强化学习的Unsupervised Meta-Learning
CreateAMind
17+阅读 · 2019年1月7日
Unsupervised Learning via Meta-Learning
CreateAMind
41+阅读 · 2019年1月3日
Hierarchical Disentangled Representations
CreateAMind
4+阅读 · 2018年4月15日
Machine Learning:十大机器学习算法
开源中国
19+阅读 · 2018年3月1日
【论文】变分推断(Variational inference)的总结
机器学习研究会
39+阅读 · 2017年11月16日
Auto-Encoding GAN
CreateAMind
7+阅读 · 2017年8月4日
相关论文
Arxiv
0+阅读 · 2021年6月17日
Arxiv
13+阅读 · 2019年11月14日
Deep Learning
Arxiv
6+阅读 · 2018年8月3日
Arxiv
4+阅读 · 2018年3月19日
Arxiv
3+阅读 · 2017年12月14日
Top
微信扫码咨询专知VIP会员