数据分析/数据挖掘 入门级选手建议

2017 年 12 月 20 日 R语言中文社区 Charlotte77

作者:Charlotte77  数学系的数据挖掘民工  
博客专栏:http://www.cnblogs.com/charlotte77/ 
个人公众号:Charlotte数据挖掘(ID:CharlotteDataMining)  


精彩回顾:

数据分析/数据挖掘/机器学习---- 必读书目

1.数据分析和数据挖掘联系和区别

联系:都是搞数据的

区别:数据分析偏统计,可视化,出报表和报告,需要较强的表达能力。数据挖掘偏算法,重模型,需要很深的代码功底,要码代码,很多= =。

 

2.怎么入门

请百度“如何成为一名数据分析师”或者“如何成为一名数据挖掘工程师”。英文好上Quora,不行上知乎,看看入门资料。

 

3.选哪些书

看入门资料给你提供的书,有电子版下电子版,没电子版买纸质书,花不了多少钱。

 

4.用什么语言

数据分析:excel是必须,R是基本,python是进阶。SAS和Matlab给土豪去玩吧。

数据挖掘:python是必须,java/c/c++是基础,hadoop/mapreduce/spark先掌握一点,因为并不是所有公司都有这么大的数据量。

 

5.需要学数学吗

都需要

数据分析:统计学,概率论,

数据挖掘:高数/数学分析,数值分析,线性代数,凸优化,运筹学(这些是基本)数字信号处理,模式识别,矩阵论(进阶)

 

6.要不要读研究生

一般来说,只有应届生去找工作会比较看重学历,因为你没有其他可以展示你能力的。但是随着工作时间久了(两年+),你的能力远超于你所在的学校,学历就不重要了。如果要读,建议读计算数学/概率论/模式识别/计算机 方面的研究生,争取发论文(高质量),否则应聘的时候并没有什么影响,当然,有些公司可能会在初筛的时候根据学历筛选人,正常,真想进就多工作几年再社招进去呗,学历不好也不能怪别人对不对。

工作几年后,如果觉得到瓶颈了,可以再去读书,没什么,这个时候可能你更清楚自己需要的是什么。

             

7.选择去哪个公司

大公司核心职位优先>>中型公司核心职位>大公司边缘职位>优秀的创业小公司核心职位>中型公司边缘职位>坑人的创业小公司边缘职位

原因:

1.大公司数据量多,人才多。能接触到核心项目核心职位是最佳选择。(BAT,网易有道,微软等)

2.中型公司发展快,机会多,压力大,成长快。(美团滴滴58)

3.创业公司慎选,如果有创业公司的offer,一看他们差不差钱,而看他们项目赢不赢利,三看团队技术氛围浓不浓。不差钱+盈利但技术氛围不浓,可以去,但不适合对技术追求高的人;不差钱+技术氛围浓但暂时不盈利,可以考虑,但要搞清楚盈利模式。盈利+技术氛围浓但现在差钱,可以考虑,争取成为核心成员,一旦融资不得了。如果差钱又不盈利技术氛围还差,算了吧,耗不起。

实在不知道怎么选,就看两点:1.数据量大小 2.技术氛围。钱少可以以后赚,技术氛围浓最重要。

 

8.怎么面试

1.诚实 2.真诚 3.展现你的潜力

 

9.没有项目经验怎么办

应届生要啥项目经验,本科生就说说自己的毕业论文,数模/ACM/阿里的参赛经历或获奖经历,以及可能会有的实习经历。研究生就说实验室的项目,负责的工作,完成的成果和发表的论文。不要夸大,如实说。

 

10.要不要培训

因人而异,但不建议。如果连搜索能力和自学能力都没有,就算你入了行,也会过得很痛苦的。更何况高昂的学费和造假的简历了。

 

11.到底该选数据分析还是数据挖掘

代码能力强直接搞算法,弱就先做数据分析,慢慢来,不着急。想我毕业的时候只会Matlab,后来被领导逼着两星期学了R,一个月学了python,自己在业余学了java,hadoop和spark等,也是一步步来的,不要想一口吃成个大胖子。

 

12.前途怎么样

我从实习到现在年薪翻了5倍,你说怎样。你要是只冲着钱去呢,去做销售吧;要是喜欢纯数呢,去做研究吧;要是喜欢从数据里发现一些有趣的事情并应用上去,那就来做数据分析/数据挖掘吧。

 

13.一天的工作大概是怎样的

到公司,跑数据,看结果,调优,跑数据,看结果,看论文,改代码,调优,跑数据,看结果。。。

 

14.有没有推荐的网站

google(之前被墙了,某个晚上恢复了,马上要回归了,现在不能用的话买个vpn吧,mac本推荐shadowsocks软件)

stack overflow:改bug神器

github:开源大法好!

Quaro:资料搜集地/经验借鉴处

(以及各类招聘网站:我不想学习的时候就看这个,看和自己理想的工作还有多少差距,打鸡血。。)

 

15.有没有推荐的IDE

sublime text+secureCRE/iterm够用了(mac本,windows的话就下个notepad++和linux就可以了)

各种语言的IDE都可以下一个,调试用。没有推荐,哪个顺手用哪个。

 

16.用什么电脑

有钱直接上服务器,没钱买个配置高的,实在没钱买个能敲的就行。以后工作有钱了再整个好的。

 

17.怎么投简历

校招有网申,我没有搞过校招,不太清楚流程。如果错过校招,最好去拉勾周伯通等垂直网站投。不太推荐58/赶集/智联,这些招聘网站上的职位类型主流偏低端,碰到不靠谱的公司概率较大。

 

18.怎么看岗位要求知道我的工作内容

一个简单的方法:所有数据分析类的岗位要求里写的要求会excel,PPT等的干的都是统计员的活!所有数据分析类的岗位要求里写的要求会GA,pu,uv分析的都是运营部门的!所有数据挖掘岗位里写的要求只有hadoop,spark,ETL的干的都是数据仓库的活!其他的自己看吧,数据挖掘有好几种职位:广告ctr预估的,机器学习的,推荐系统,自然语言处理等等。自己选择吧。反正入门都可以尝试做做。

 

总之,入门容易深入难,数学不好可以学,但会制约你的发展,代码不好也可以,但也会制约你的职业生涯,所以那些说“我觉得我数学不好代码能力也不强觉得R好难英语也不好看不懂国外的网站学多了会不会掉头发会不会找不到男/女朋友blahblah”的,你开心就好,你的职业生涯掌握在自己手中。

 

最后,感谢当初把我带入门的彭爱民老师,高芹老师和李海雄老师等等,好想回去看你们啊!!!!!!!

 

以上是工作半年以来想到的所有新入行的人可能会问的问题,以及我自己踩过的坑的一些总结,不全面,也没什么调理,大家将就看吧。除了以上问题有什么的再问我吧,上班时间不要问哦~(虽然下班也没什么时间,逗玩猫看看书刷刷手机就睡觉了  =  =)。

 

不要觉得我厉害,我觉得我到现在都是入门级,周围同事搞深度学习码代码码的飞起快被虐惨了,我是渣渣 = =

 

拜拜~学弟学妹们加油~ 


公众号后台回复关键字即可学习

回复 R               R语言快速入门免费视频 
回复 统计          统计方法及其在R中的实现
回复 用户画像   民生银行客户画像搭建与应用 
回复 大数据      大数据系列免费视频教程
回复 可视化      利用R语言做数据可视化
回复 数据挖掘   数据挖掘算法原理解释与应用
回复 机器学习   R&Python机器学习入门 

登录查看更多
5

相关内容

数据挖掘(Data mining)一般是指从大量的数据中自动搜索隐藏于其中的有着特殊关系性的信息和知识的过程。
【2020新书】从Excel中学习数据挖掘,223页pdf
专知会员服务
90+阅读 · 2020年6月28日
商业数据分析,39页ppt
专知会员服务
160+阅读 · 2020年6月2日
干净的数据:数据清洗入门与实践,204页pdf
专知会员服务
161+阅读 · 2020年5月14日
简明扼要!Python教程手册,206页pdf
专知会员服务
47+阅读 · 2020年3月24日
【资源】100+本免费数据科学书
专知会员服务
107+阅读 · 2020年3月17日
算法与数据结构Python,369页pdf
专知会员服务
161+阅读 · 2020年3月4日
【2020新书】数据科学:十大Python项目,247页pdf
专知会员服务
212+阅读 · 2020年2月21日
【干货】大数据入门指南:Hadoop、Hive、Spark、 Storm等
专知会员服务
95+阅读 · 2019年12月4日
机器学习入门的经验与建议
专知会员服务
92+阅读 · 2019年10月10日
学人工智能,参加培训真的有用吗?
AINLP
6+阅读 · 2018年10月10日
“搞机器学习没前途”
CSDN
236+阅读 · 2018年9月12日
2年Java经验,真的就拿不到30万年薪吗?
程序员观察
3+阅读 · 2018年4月8日
数据挖掘与人工智能学习进阶指南
数据挖掘入门与实战
4+阅读 · 2018年1月19日
给程序员的10条建议,吐血推荐!
R语言中文社区
3+阅读 · 2017年12月21日
【入门】数据分析六部曲
36大数据
18+阅读 · 2017年12月6日
【强烈推荐】:关于系统学习数据挖掘(Data Mining)的一些建议!!
机器学习算法与Python学习
8+阅读 · 2017年12月2日
Kaggle入门手册
Datartisan数据工匠
14+阅读 · 2017年11月9日
如何系统地学习数据挖掘?
数据库开发
10+阅读 · 2017年10月22日
【大数据】数据挖掘与数据分析知识流程梳理
产业智能官
12+阅读 · 2017年9月22日
3D Deep Learning on Medical Images: A Review
Arxiv
12+阅读 · 2020年4月1日
Arxiv
35+阅读 · 2019年11月7日
Arxiv
18+阅读 · 2019年1月16日
Arxiv
53+阅读 · 2018年12月11日
Arxiv
12+阅读 · 2018年9月5日
Arxiv
3+阅读 · 2018年4月5日
VIP会员
相关VIP内容
【2020新书】从Excel中学习数据挖掘,223页pdf
专知会员服务
90+阅读 · 2020年6月28日
商业数据分析,39页ppt
专知会员服务
160+阅读 · 2020年6月2日
干净的数据:数据清洗入门与实践,204页pdf
专知会员服务
161+阅读 · 2020年5月14日
简明扼要!Python教程手册,206页pdf
专知会员服务
47+阅读 · 2020年3月24日
【资源】100+本免费数据科学书
专知会员服务
107+阅读 · 2020年3月17日
算法与数据结构Python,369页pdf
专知会员服务
161+阅读 · 2020年3月4日
【2020新书】数据科学:十大Python项目,247页pdf
专知会员服务
212+阅读 · 2020年2月21日
【干货】大数据入门指南:Hadoop、Hive、Spark、 Storm等
专知会员服务
95+阅读 · 2019年12月4日
机器学习入门的经验与建议
专知会员服务
92+阅读 · 2019年10月10日
相关资讯
学人工智能,参加培训真的有用吗?
AINLP
6+阅读 · 2018年10月10日
“搞机器学习没前途”
CSDN
236+阅读 · 2018年9月12日
2年Java经验,真的就拿不到30万年薪吗?
程序员观察
3+阅读 · 2018年4月8日
数据挖掘与人工智能学习进阶指南
数据挖掘入门与实战
4+阅读 · 2018年1月19日
给程序员的10条建议,吐血推荐!
R语言中文社区
3+阅读 · 2017年12月21日
【入门】数据分析六部曲
36大数据
18+阅读 · 2017年12月6日
【强烈推荐】:关于系统学习数据挖掘(Data Mining)的一些建议!!
机器学习算法与Python学习
8+阅读 · 2017年12月2日
Kaggle入门手册
Datartisan数据工匠
14+阅读 · 2017年11月9日
如何系统地学习数据挖掘?
数据库开发
10+阅读 · 2017年10月22日
【大数据】数据挖掘与数据分析知识流程梳理
产业智能官
12+阅读 · 2017年9月22日
Top
微信扫码咨询专知VIP会员