二分类、多分类、回归任务,一个项目get竞赛必备模型

2020 年 11 月 29 日 机器之心

机器之心报道

机器之心编辑部
数据挖掘类比赛必备模型,四种实现方法,你值得拥有。

数据科学竞赛是学习各类算法、深入理解数据科学、提升和挑战自己的绝佳机会,而这些竞赛中有一些常用的模型。

近日,有开发者在 GitHub 上开源了一个包含数据挖掘类比赛常用模型的项目,主要涵盖二分类、多分类以及回归任务。项目代码全部使用 Python 实现。


项目地址:https://github.com/QLMX/data_mining_models

该项目包含二分类模型、多分类模型以及回归模型,它们分别基于 lightgbm 实现、xgboost 实现、keras 实现和 pytorch 实现:

 lightgbm

  • binary_class.py :lightgbm 实现的二分类

  • multi_class.py :lightgbm 实现的多分类

  • regression.py :lightgbm 实现的回归

  • multi_class_custom_feval.py :lightgbm 自定义评价函数实现多分类

  • multi_class_weight_loss.py :lightgbm 多类别不平衡问题,实现类别加权优化


xgboost

  • binary_class.py :xgboost 实现的二分类

  • multi_class.py :xgboost 实现的多分类

  • regression.py :xgboost 实现的回归


 keras 实现的 mlp

  • binary_class.py :keras 实现的 mlp,做二分类任务

  • multi_class.py :keras 实现的 mlp,做多分类任务

  • regression.py :keras 实现的 mlp,做回归任务


 pytorch 实现的 mlp

  • binary_class.py :pytorch 实现的 mlp,做二分类任务

  • multi_class.py :pytorch 实现的 mlp,做多分类任务

  • regression.py :实现的 mlp,做回归任务


环境设置

可以直接通过 pip install -r requirements.txt 安装指定的函数包,具体的函数包如下:

pandasnumpymatplotlibsklearntensorflow==1.12.0keras==2.2.4pytorchseabornlightgbm==2.2.1xgboost==0.90

项目解读

第一部分 lightgbm 的数据是基于拍拍贷比赛截取的一部分特征,随机选择了 5000 个训练数据,3000 个测试数据。针对其中 gender、cell_province 等类别特征,直接进行重新编码处理。

第二部分又基于 xgboost 实现了二分类、多分类和回归任务。

第三、四部分是深度网络部分,是基于 keras 实现的多层感知机网络 (mlp)。pytorch 主要用于图像处理任务,在数据挖掘类比赛中很少用到,但该项目整理了基于 pytorch 实现的 mlp 做分类与回归任务代码。

项目作者对项目的各部分进行了详细的解读,具体参考以下内容:


参考链接:
https://mp.weixin.qq.com/s/t6EpWmLWP81DcJ7AUro3Ng
https://mp.weixin.qq.com/s/Td0Vrx9YO5rEn66L4C42Zw
https://mp.weixin.qq.com/s/XaB1BsLL_Va7dGL0S0rUOQ
https://zhuanlan.zhihu.com/p/80381974

2020 NeurIPS MeetUp

12月6日北京,机器之心将举办2020 NeurIPS MeetUp。活动设置4个Keynote、 12篇论文报告与30个Poster,邀请顶级专家、论文作者与现场参会观众共同交流。

点击阅读原文,立即报名。

© THE END 

转载请联系本公众号获得授权

投稿或寻求报道:content@jiqizhixin.com

登录查看更多
1

相关内容

一图搞定ML!2020版机器学习技术路线图,35页ppt
专知会员服务
93+阅读 · 2020年7月28日
【2020新书】Python金融大数据分析宝典,426页pdf与代码
专知会员服务
151+阅读 · 2020年7月11日
【干货书】高级应用深度学习,294页pdf
专知会员服务
153+阅读 · 2020年6月20日
一网打尽!100+深度学习模型TensorFlow与Pytorch代码实现集合
Keras作者François Chollet推荐的开源图像搜索引擎项目Sis
专知会员服务
29+阅读 · 2019年10月17日
快速上手笔记,PyTorch模型训练实用教程(附代码)
LASSO回归与XGBoost:融合模型预测房价
论智
32+阅读 · 2018年8月8日
手把手教你用Python库Keras做预测(附代码)
数据派THU
14+阅读 · 2018年5月30日
案例 | lightgbm算法优化-不平衡二分类问题(附代码)
入门 | 区分识别机器学习中的分类与回归
机器之心
3+阅读 · 2017年12月16日
解决机器学习问题有通法!看这一篇就够了!
大数据文摘
4+阅读 · 2017年9月18日
深度学习实战(二)——基于Keras 的深度学习
乐享数据DataScientists
15+阅读 · 2017年7月13日
Arxiv
0+阅读 · 2021年1月28日
Adaptive Neural Trees
Arxiv
4+阅读 · 2018年12月10日
Arxiv
14+阅读 · 2018年4月18日
Arxiv
5+阅读 · 2015年9月14日
VIP会员
相关资讯
快速上手笔记,PyTorch模型训练实用教程(附代码)
LASSO回归与XGBoost:融合模型预测房价
论智
32+阅读 · 2018年8月8日
手把手教你用Python库Keras做预测(附代码)
数据派THU
14+阅读 · 2018年5月30日
案例 | lightgbm算法优化-不平衡二分类问题(附代码)
入门 | 区分识别机器学习中的分类与回归
机器之心
3+阅读 · 2017年12月16日
解决机器学习问题有通法!看这一篇就够了!
大数据文摘
4+阅读 · 2017年9月18日
深度学习实战(二)——基于Keras 的深度学习
乐享数据DataScientists
15+阅读 · 2017年7月13日
Top
微信扫码咨询专知VIP会员