catboost原理介绍,与lightgbm和xgboost比较优劣?

catboost/catboost git上新开源了又一神器,但是对原理的具体介绍较少,哪位来简单介绍下,并与xgboost和lightgbm做下优劣…
关注者
129
被浏览
120,208
登录后你可以
不限量看优质回答私信答主深度交流精彩内容一键收藏

多样化模型的ensemble可以非常有效的提升泛化能力,很多Kaggle比赛中会把Catboost+LightGBM+XGBoost分别建模再ensemble,有非常好的表现。强烈推荐一个国产开源工具HyperGBM,自动对三个模型做超参数优化然后Ensemble,而且包括前面的数据预处理和特征变化,就是所谓的全Pipeline优化,比如连续型的特征如何做缺失值填充、如何做归一化,类别型的怎么做encoding,前面的数据管道不同后面模型的超参数也需要有相应的变化。