趣味机器学习入门小项目(附教程与数据)

2017 年 11 月 16 日 机器学习算法与Python学习

微信公众号

关键字全网搜索最新排名

【机器学习算法】:排名第一

【机器学习】:排名第一

【Python】:排名第三

【算法】:排名第四

没有任何理论可以代替实践,虽然教材和课程能让你掌握一些基本原理,但在尝试应用时,你会发现具体操作起来比较困难。因此项目有助于提高应用机器学习的技巧,此外在找工作中也会给自己增添一些筹码。

这个项目的目标是将现成模型应用到不同的数据集。首先,你会根据直觉为问题找到对应的模型,实践检验该模型是否对数据丢失具有鲁棒性、是否适合处理哪种类别特征;其次,本项目将教会你快速设计初始模型的技能,在实际应用中,我们一般会先找到一个简单模型进行快速实现以确定一个baseline,逐步提升模型性能,而不是一蹴而就的完成;最后,这个练习可以帮助你掌握建模的流程。下面我里除了一个机器学习问题处理的通用性步骤例如:

  1. 导入数据

  2. 数据清洗

  3. 将数据集拆成训练/测试或交叉验证集

  4. 预处理

  5. 变换

  6. 特征工程

因为使用现成的模型,这促使你有更多的机会专注于学习上述的这些关键步骤,通过以下教程可以练习回归、分类和聚类算法。


首先介绍一下该项目中所使用到的数据源:

  1. UCI机器学习库——350多个可检索数据集,几乎涵盖每一个主题。

    http://archive.ics.uci.edu/ml/

  2. Kaggle数据集——Kaggle社区上的100多个数据集。

    https://www.kaggle.com/datasets

  3. Data.gov——由美国政府发布的开放数据集。

    https://www.data.gov/

其次是教程,项目中的模型使用Python的第三方库Scikit-learn进行快速实现,需要了解scikit-learn的安装以及使用方法(参考官方手册),具体如下:

  1. Python:sklearn——sklearn数据包官方教程 

    http://scikit-learn.org/stable/tutorial/

  2. 中文教程手册:

    http://cwiki.apachecn.org/pages/viewpage.action?pageId=10030179

  3. Scikit Learn预测葡萄酒质量——用于训练机器学习模型的分步教程

    http://elitedatascience.com/python-machine-learning-tutorial-scikit-learn


招募 志愿者

广告、商业合作

请发邮件:357062955@qq.com

喜欢,别忘关注~

帮助你在AI领域更好的发展,期待与你相遇!

登录查看更多
0

相关内容

“机器学习是近20多年兴起的一门多领域交叉学科,涉及概率论、统计学、逼近论、凸分析、算法复杂度理论等多门学科。机器学习理论主要是设计和分析一些让 可以自动“ 学习”的算法。机器学习算法是一类从数据中自动分析获得规律,并利用规律对未知数据进行预测的算法。因为学习算法中涉及了大量的统计学理论,机器学习与统计推断学联系尤为密切,也被称为统计学习理论。算法设计方面,机器学习理论关注可以实现的,行之有效的学习算法。很多 推论问题属于 无程序可循难度,所以部分的机器学习研究是开发容易处理的近似算法。” ——中文维基百科

知识荟萃

精品入门和进阶教程、论文和代码整理等

更多

查看相关VIP内容、论文、资讯等
【实用书】Python机器学习Scikit-Learn应用指南,247页pdf
专知会员服务
264+阅读 · 2020年6月10日
干净的数据:数据清洗入门与实践,204页pdf
专知会员服务
161+阅读 · 2020年5月14日
【资源】100+本免费数据科学书
专知会员服务
107+阅读 · 2020年3月17日
【干货书】机器学习Python实战教程,366页pdf
专知会员服务
338+阅读 · 2020年3月17日
【2020新书】数据科学:十大Python项目,247页pdf
专知会员服务
212+阅读 · 2020年2月21日
【新书】Pro 机器学习算法Python实现,379页pdf
专知会员服务
198+阅读 · 2020年2月11日
【推荐系统/计算广告/机器学习/CTR预估资料汇总】
专知会员服务
87+阅读 · 2019年10月21日
机器学习相关资源(框架、库、软件)大列表
专知会员服务
39+阅读 · 2019年10月9日
Python机器学习课程(代码与教程)
专知
35+阅读 · 2019年5月13日
不要担心没数据!史上最全数据集网站汇总
学会这10种机器学习算法,你才算入门(附教程)
七月在线实验室
4+阅读 · 2018年4月13日
Python机器学习教程资料/代码
机器学习研究会
8+阅读 · 2018年2月22日
Python & 机器学习之项目实践 | 赠书
人工智能头条
14+阅读 · 2017年12月26日
推荐 | Python-ML中最常用的5张速查表(高清)
机器学习算法与Python学习
4+阅读 · 2017年12月1日
机器学习必备手册
机器学习研究会
19+阅读 · 2017年10月24日
Financial Time Series Representation Learning
Arxiv
10+阅读 · 2020年3月27日
Arxiv
7+阅读 · 2019年5月31日
Arxiv
8+阅读 · 2019年3月28日
Arxiv
4+阅读 · 2018年5月21日
VIP会员
相关VIP内容
【实用书】Python机器学习Scikit-Learn应用指南,247页pdf
专知会员服务
264+阅读 · 2020年6月10日
干净的数据:数据清洗入门与实践,204页pdf
专知会员服务
161+阅读 · 2020年5月14日
【资源】100+本免费数据科学书
专知会员服务
107+阅读 · 2020年3月17日
【干货书】机器学习Python实战教程,366页pdf
专知会员服务
338+阅读 · 2020年3月17日
【2020新书】数据科学:十大Python项目,247页pdf
专知会员服务
212+阅读 · 2020年2月21日
【新书】Pro 机器学习算法Python实现,379页pdf
专知会员服务
198+阅读 · 2020年2月11日
【推荐系统/计算广告/机器学习/CTR预估资料汇总】
专知会员服务
87+阅读 · 2019年10月21日
机器学习相关资源(框架、库、软件)大列表
专知会员服务
39+阅读 · 2019年10月9日
相关资讯
Python机器学习课程(代码与教程)
专知
35+阅读 · 2019年5月13日
不要担心没数据!史上最全数据集网站汇总
学会这10种机器学习算法,你才算入门(附教程)
七月在线实验室
4+阅读 · 2018年4月13日
Python机器学习教程资料/代码
机器学习研究会
8+阅读 · 2018年2月22日
Python & 机器学习之项目实践 | 赠书
人工智能头条
14+阅读 · 2017年12月26日
推荐 | Python-ML中最常用的5张速查表(高清)
机器学习算法与Python学习
4+阅读 · 2017年12月1日
机器学习必备手册
机器学习研究会
19+阅读 · 2017年10月24日
Top
微信扫码咨询专知VIP会员