在《决策树之玩转借贷俱乐部》和《集成树之玩转借贷俱乐部》两贴中,斯蒂文用决策树,随机森林和提升树预测了借贷俱乐部里面的贷款的良恶性。老板最近听说了极度梯度提升(XGBoost),而且知道几乎每个参加 Kaggle 比赛的人都会用它。老板想让斯蒂文精通它,并且用来预测借贷俱乐部 (Lending Club) 的贷款的良恶性。
斯蒂文还是 XGBoost 模型的小白,为了把它摸得清清楚楚,他决定
先打好基础,用简单的数据来理解该模型的性质和特点 (见第一章)
然后把模型用到贷款数据上,并逐步调整参数得出最优模型 (见第二章)
关于 XGBoost 模型的详解介绍,可参考《极度梯度提升》一贴。
进入王的机器公众号,在对话框回复 ML16 可下载代码 (HTML) 和相关数据 (csv)
第一章 - XGBoost 基础版
1.1 模型初探
1.2 数据预处理
1.3 交叉验证
1.4 特征选择
1.5 提前终止
1.6 多线程运行
1.7 调整超参数
第二章 - XGBoost 进阶版
2.1 数据预处理
2.2 参数介绍
2.3 调参步骤
2.4 模型比对
总结
转自:王的机器
完整内容请点击“阅读原文”