作者:Baymax
(https://github.com/DeqianBai)
目前是一名在读研究生,研究方向是机器学习和强化学习;该项目地址,可点击“阅读原文”直达:
https://github.com/DeqianBai/Your-first-machine-learning-Project---End-to-End-in-Python
这是一个完整的,端到端的机器学习项目,非常适合有一定基础后拿来练习,以提高对完整机器学习项目的认识。
使用提供的建筑能源数据开发一个模型,该模型可以预测建筑物的能源之星得分,
然后解释结果以找到最能预测得分的变量。
这是一个受监督的回归机器学习任务:给定一组包含目标(在本例中为分数)的数据,我们希望训练一个可以学习将特征(也称为解释变量)映射到目标的模型。
受监督问题: 我们可以知道数据的特征和目标,我们的目标是训练可以学习两者之间映射关系的模型。
回归问题: Energy Star Score是一个连续变量。
在训练中,我们希望模型能够学习特征和分数之间的关系,因此我们给出了特征和答案。然后,为了测试模型的学习效果,我们在一个从未见过答案的测试集上进行评估
数据清理,探索性数据分析,特征工程和选择等常见问题的解决办法
随机搜索,网格搜索,交叉验证等方法寻找最优超参数
可视化决策树
对完整的机器学习项目流程建立一个宏观的了解
baideqian@hrbeu.edu.cn
baideqian@foxmail.com