This paper extends recent work on boosting random forests to model non-Gaussian responses. Given an exponential family $\mathbb{E}[Y|X] = g^{-1}(f(X))$ our goal is to obtain an estimate for $f$. We start with an MLE-type estimate in the link space and then define generalised residuals from it. We use these residuals and some corresponding weights to fit a base random forest and then repeat the same to obtain a boost random forest. We call the sum of these three estimators a \textit{generalised boosted forest}. We show with simulated and real data that both the random forest steps reduces test-set log-likelihood, which we treat as our primary metric. We also provide a variance estimator, which we can obtain with the same computational cost as the original estimate itself. Empirical experiments on real-world data and simulations demonstrate that the methods can effectively reduce bias, and that confidence interval coverage is conservative in the bulk of the covariate distribution.


翻译:本文扩展了最近关于将随机森林推向非加西语响应模型的工作。 根据指数式家庭 $\mathbb{E}[Y ⁇ X] = g ⁇ -1}(f(X)), 我们的目标是获得美元估计数。 我们从链接空间的 MLE 类型估算开始, 然后从中定义一般的残留物。 我们用这些残留物和一些相应的重量来适应一个基准随机森林, 然后重复同样的重量来获取随机森林。 我们称这三个估计者的总和为 \ text{clectenized Profed Form} 。 我们用模拟和真实的数据显示, 随机森林步骤减少了测试设定的日志相似性, 我们把它当作我们的主要指标。 我们还提供了差异估计器, 我们可以用与原始估算本身相同的计算成本来获得。 真实世界数据和模拟的实验表明, 方法可以有效减少偏差, 而信任间隔范围在共位分配中是保守的。

0
下载
关闭预览

相关内容

专知会员服务
51+阅读 · 2020年12月14日
最新《深度卷积神经网络理论》报告,35页ppt
专知会员服务
46+阅读 · 2020年11月30日
专知会员服务
124+阅读 · 2020年9月8日
Keras François Chollet 《Deep Learning with Python 》, 386页pdf
专知会员服务
154+阅读 · 2019年10月12日
A Technical Overview of AI & ML in 2018 & Trends for 2019
待字闺中
17+阅读 · 2018年12月24日
已删除
将门创投
5+阅读 · 2018年7月25日
Hierarchical Disentangled Representations
CreateAMind
4+阅读 · 2018年4月15日
算法|随机森林(Random Forest)
全球人工智能
3+阅读 · 2018年1月8日
【推荐】决策树/随机森林深入解析
机器学习研究会
5+阅读 · 2017年9月21日
Auto-Encoding GAN
CreateAMind
7+阅读 · 2017年8月4日
Arxiv
0+阅读 · 2021年4月19日
Arxiv
0+阅读 · 2021年4月18日
Arxiv
0+阅读 · 2021年4月15日
Fitting a manifold of large reach to noisy data
Arxiv
0+阅读 · 2021年4月15日
Hyperspherical Variational Auto-Encoders
Arxiv
4+阅读 · 2018年9月26日
VIP会员
相关VIP内容
相关资讯
A Technical Overview of AI & ML in 2018 & Trends for 2019
待字闺中
17+阅读 · 2018年12月24日
已删除
将门创投
5+阅读 · 2018年7月25日
Hierarchical Disentangled Representations
CreateAMind
4+阅读 · 2018年4月15日
算法|随机森林(Random Forest)
全球人工智能
3+阅读 · 2018年1月8日
【推荐】决策树/随机森林深入解析
机器学习研究会
5+阅读 · 2017年9月21日
Auto-Encoding GAN
CreateAMind
7+阅读 · 2017年8月4日
Top
微信扫码咨询专知VIP会员