【强烈推荐】:关于系统学习数据挖掘(Data Mining)的一些建议!!

2017 年 12 月 2 日 机器学习算法与Python学习

微信公众号

关键字全网搜索最新排名

【机器学习算法】:排名第一

【机器学习】:排名第一

【Python】:排名第三

【算法】:排名第四

关于数据挖掘

提到收据挖掘(Data Mining, DM),很多想学习的同学大多数都会问我:

什么是数据挖掘?

怎么培养数据分析的能力?

如何成为一名数据科学家?

(简称数据挖掘工程师为DMer)


我认为,在学习DM之前你至少需要明白以下几点:

  1. 数据初期的准备通常占整个数据挖掘项目工作量的70%左右;

  2. 数据挖掘本身融合了统计学、数据库和机器学习等学科,并不是新的技术

  3. 数据挖掘技术更适合业务人员学习(相比技术人员学习业务来的更高效);

  4. 数据挖掘适用于传统的BI(Business Intelligence)无法支持的领域。


国内DMer的工作领域

1)数据分析师:在拥有行业数据的电商、金融、电信、咨询等行业里做业务咨询,商务智能,出分析报告。


2)数据挖掘工程师:在多媒体、电商、搜索、社交等大数据相关行业里做机器学习算法实现和分析。


3)科学研究:在高校、科研单位、企业研究院等高大上科研机构研究新算法效率改进及未来应用。


各领域DMer需要掌握的技能

数据分析师


需要的技能如下:

  1. 需要有深厚的数理统计基础,但是对程序开发能力不做过高的要求;

  2. 需要熟练使用主流的数据挖掘或统计分析工具,如Business Analytics and Business Intelligence Software(SAS)、SPSS、EXCEL等;

  3. 需要对所在行业有关的核心数据有深入的理解,并培养一定的数据敏感性;


经典图书推荐如下:

  1. 《概率论与数理统计》

  2. 《统计学》(David Freedman版)

  3. 《业务建模与数据挖掘》

  4. 《数据挖掘导论》

  5. 《SAS编程与数据挖掘商业案例》

  6. 《Clementine数据挖掘方法及应用 》

  7. 《Excel 2007 VBA参考大全》

  8. 《IBM SPSS Statistics 19 Statistical Procedures Companion》

...............



数据挖掘工程师


需要的技能如下:

  1. 需要理解主流机器学习算法的原理和应用非常重要得一点);

  2. 需要熟悉至少一门编程语言,如Python、C、C++、Java、Delphi等;

  3. 需要理解数据库原理,能够熟练操作至少一种数据库(如Mysql、SQL、DB2、Oracle等),能够明白MapReduce的原理操作以及熟练使用Hadoop系列工具更好。


经典图书推荐如下:

  1. 《数据挖掘概念与技术》

  2. 《机器学习实战》

  3. 《人工智能及其应用》

  4. 《数据库系统概论》

  5. 《算法导论》

  6. 《Web数据挖掘》

  7. 《 Python标准库》

  8. 《thinking in Java》

  9. 《Thinking in C++》

  10. 《数据结构》

...............



科学研究


需要的技能如下:

  1. 需要深入学习数据挖掘的理论基础,包括关联规则挖掘 (Apriori和FPTree)、分类算法(C4.5、KNN、Logistic Regression、SVM等) 、聚类算法 (Kmeans、Spectral Clustering)。目标可以先吃透数据挖掘10大算法各自的使用情况和优缺点;

  2. 相对SAS、SPSS来说R语言更适合科研人员,因为R软件是完全免费的,而且开放的社区环境提供多种附加工具包支持,更适合进行统计计算分析研究。虽然目前在国内流行度不高,但是强烈推荐;

  3. 可以尝试改进一些主流算法使其更加快速高效,例如实现Hadoop平台下的SVM云算法调用平台;

  4. 需要广而深的阅读世界著名会议论文跟踪热点技术。如KDD,ICML,IJCAI,Association for the Advancement of Artificial Intelligence,ICDM 等;还有数据挖掘相关领域期刊:ACM Transactions on Knowledge Discovery from Data,IEEE Transactions on Knowledge and Data Engineering,Journal of Machine Learning Research Homepage,IEEE Xplore: Pattern Analysis and Machine Intelligence, IEEE Transactions on等;

  5. 可以尝试参加数据挖掘比赛培养全方面解决实际问题的能力。如Sig KDD ,Kaggle: Go from Big Data to Big Analytics等;

  6. 有能力的话可以尝试为一些开源项目贡献自己的代码,比如Apache Mahout: Scalable machine learning and data mining ,myrrix等(具体可以在SourceForge或GitHub.上发现更多好玩的项目)。


经典图书推荐如下:

  1. 《机器学习》

  2. 《模式分类》

  3. 《统计学习理论的本质》

  4. 《统计学习方法》

  5. 《数据挖掘实用机器学习技术》

  6. 《R语言实践》

  7. 《Machine Learning: A Probabilistic Perspective》

  8. 《Scaling up Machine Learning : Parallel and Distributed Approaches》

  9. 《Data Mining Using SAS Enterprise Miner : A Case Study Approach》

  10. 《Python for Data Analysis》

...............


12月23日,DAL的三位数据科学大牛将在中关村进行一场关于实用数据与人工智能的线下分享会。

扫码即可报名

前100名免费购票

活动主题:

成为超级人类,驯服人工智能

活动时间:

12月23日 14:00~17:00

活动地点:

中关村创业大街



广告、商业合作

请发邮件:357062955@qq.com

喜欢,别忘关注~

帮助你在AI领域更好的发展,期待与你相遇!

登录查看更多
8

相关内容

数据挖掘(Data mining)一般是指从大量的数据中自动搜索隐藏于其中的有着特殊关系性的信息和知识的过程。
【2020新书】从Excel中学习数据挖掘,223页pdf
专知会员服务
90+阅读 · 2020年6月28日
商业数据分析,39页ppt
专知会员服务
160+阅读 · 2020年6月2日
Python计算导论,560页pdf,Introduction to Computing Using Python
专知会员服务
72+阅读 · 2020年5月5日
【教程推荐】中科大刘淇教授-数据挖掘基础,刘 淇
专知会员服务
80+阅读 · 2020年3月4日
【新书】Pro 机器学习算法Python实现,379页pdf
专知会员服务
198+阅读 · 2020年2月11日
【新书】Python数据科学食谱(Python Data Science Cookbook)
专知会员服务
114+阅读 · 2020年1月1日
【干货】大数据入门指南:Hadoop、Hive、Spark、 Storm等
专知会员服务
95+阅读 · 2019年12月4日
机器学习入门的经验与建议
专知会员服务
92+阅读 · 2019年10月10日
【电子书推荐】Data Science with Python and Dask
专知会员服务
43+阅读 · 2019年6月1日
最全数据科学学习资源:Python、线性代数、机器学习...
人工智能头条
11+阅读 · 2018年5月14日
五位专家跟你讲讲为啥Python更适合做AI/机器学习
全球人工智能
3+阅读 · 2018年3月18日
福利 | 当Python遇上大数据与机器学习,入门so easy!
关于Python数据分析,这里有一条高效的学习路径
算法与数据结构
5+阅读 · 2018年1月17日
各厂推荐算法!
程序猿
17+阅读 · 2018年1月13日
数据分析/数据挖掘 入门级选手建议
R语言中文社区
5+阅读 · 2017年12月20日
如何系统地学习数据挖掘?
数据库开发
10+阅读 · 2017年10月22日
关于数据挖掘,有几本书推荐给你......
图灵教育
16+阅读 · 2017年10月11日
【大数据】数据挖掘与数据分析知识流程梳理
产业智能官
12+阅读 · 2017年9月22日
Position-aware Graph Neural Networks
Arxiv
15+阅读 · 2019年6月11日
Arxiv
53+阅读 · 2018年12月11日
Arxiv
4+阅读 · 2018年3月22日
VIP会员
相关资讯
最全数据科学学习资源:Python、线性代数、机器学习...
人工智能头条
11+阅读 · 2018年5月14日
五位专家跟你讲讲为啥Python更适合做AI/机器学习
全球人工智能
3+阅读 · 2018年3月18日
福利 | 当Python遇上大数据与机器学习,入门so easy!
关于Python数据分析,这里有一条高效的学习路径
算法与数据结构
5+阅读 · 2018年1月17日
各厂推荐算法!
程序猿
17+阅读 · 2018年1月13日
数据分析/数据挖掘 入门级选手建议
R语言中文社区
5+阅读 · 2017年12月20日
如何系统地学习数据挖掘?
数据库开发
10+阅读 · 2017年10月22日
关于数据挖掘,有几本书推荐给你......
图灵教育
16+阅读 · 2017年10月11日
【大数据】数据挖掘与数据分析知识流程梳理
产业智能官
12+阅读 · 2017年9月22日
Top
微信扫码咨询专知VIP会员