数据挖掘的本质出路:长三角春招数据岗不完全调研

2019 年 3 月 25 日 R语言中文社区

作者:黄天元,复旦大学博士在读,目前研究涉及文本挖掘、社交网络分析和机器学习等。希望与大家分享学习经验,推广并加深R语言在业界的应用。

邮箱:huang.tian-yuan@qq.com


今天上课之后正好在本部,因此参加了:

数据科学非常火,目前也有很多人过来灭火。但是数据挖掘的市场需求究竟是什么样的呢?我希望能够在这里找到部分答案,所以就找到所有招数据类岗位的公司,问他们需求究竟是什么。过来的公司大多是HR,老板或者做技术的能够来这里直接与学生交流的不算多。尽管如此,通过他们对岗位的描述,和能够给到薪酬的大致范围,我们就可以推测这些公司对数据人才的定位是什么。他们需不需要数据人才?有多需要?能够留住数据人才的能力有多少?

先谈谈哪里需要数据岗位吧。

教育类

需求极少,对口工作我能够发现的有:Python老师、少儿类编程课。这个方向最好的是“互联网+教育”公司,比如流利说。

可以说,只有能够挂钩互联网的公司,才需要有完备的数据团队。而这个团队总是被分为技术类,个人认为技术类与产品类应该不分家才对,鲜明的分开可能会导致脱节。



生物医药类

首先,这一类需求在小规模的调研中,需求量还是比较大的,但是——薪酬不能说特别高。也就是说有需求,但是产能不行,我能够问到的薪酬中,20k已经算是摸着天了。

不过也不全是这样子的,只要能加互联网,数据就有出路。我跟医生云的HR聊的时候,就发现,医疗大数据大有可为。人工智能自动诊断,结合专家的知识,这将给医疗界带来革命性的变化。我听了他们对数据的需求和用户群体是谁,我就知道这里在今后肯定能够创造超额利润。而且这些内容能够对数据科学哪些方面发生化学反应,是比较明晰的。应该这么说,我们很难想象以前的医务工作者居然没有这样做!互联网真好,大数据真好。



金融保险类

资金最充足、发展最成熟的领域,没有之一。他们应该是最早意识到量化威力的人,只要有能力,上不封顶的行业。没时间放图了,基本是平安、还有各种没听过名字的银行等等。对冲基金、期货、股票、债券,嗯,数据跟钱直接挂钩。



第三方服务类

即乙方,服务于甲方的公司。有的是做硬件服务的,所需要的一般是能够摆平数据库调度、开发的这一类。有的则是做报告为主,服务于政府机构、大公司等等。跟这种提供报告服务的谈话,很少能够谈到实质内容,因为他们的业务基本是跟着需求走,有点打游击的样子,有什么需求就能做什么,反正本质上都是数据分析嘛。这样有好处但是也有不利的地方,比较适合业务项目合作,但是长期工作的话还真是不好说。比较引人注目的是中间谈了一个做工业大数据的,这里的价值是丰厚的。国内很多企业可能做事情都还是处于随机调配的状态,因此需要有科学家来科学设计试验、采集数据然后做分析报告,最后指导工业生产。不过这样的分析师有时候也不叫什么数据科学家,直接叫做——科学家。

这句话说的真的很对,商业行为是有经验可循的,经验的高度抽象即是科学,科学则必须是基于数据的,也就是说业务问题必须是能够被量化的。如果量化得好,那么就能够极大推动行业的快速发展。我认为各行各业都需要数据分析,数据分析就像英语一样通用而且有用,它是科学家的必要操作工具。



无明确定义类

可以发现有些公司的数据岗就是个摆设,问他们数据做什么的时候,要么就是HR不是做这块不了解,不然就是连公司本身的定位都不是特别明确,只是存在于什么都想做的画大饼阶段。感觉用excel做做就行,厉害一点的就用SQL。我发现很多公司非常在意一个人用SQL的能力,而根据《增长黑客》书的说法,这种能力根本就是一两天就能够掌握的基础,没什么大不了的。因为对自身业务认识非常欠缺,所以就没有明确的科学问题,更谈不上量化。数据岗在这种类型的公司是毫无发展的。



结论

各行各业转数据科学的同志们,数据挖掘的本质是科学!最成熟的无疑是金融互联网,其次比较兴盛的是工业大数据和医疗大数据,其他的...有待发展。好的我其实还漏了一种没说,那就是:游戏!中间碰到一个游戏产业的,他们说他们打一次的伤害这种东西的设定是需要数据分析师来做的。嗯,游戏,有钱啊。不过也看个人是不是喜欢,别看我一天就知道学习,以前三国杀的号玩得满级没法升了,阴阳师也保持过八段的位置,哈哈(这两个游戏,其实要玩好就需要有很好的数据思维才能够高效胜利)!

同样是做数据挖掘,在不同行业的能够产生的价值是不等的,能够获得的薪酬也大相径庭。很多行业不是大数据没有用,而是产能还没有能够被完全发挥出来,这都是机会啊!不过,正如数据科学的本质是科学,妄想学几个包做个图跑个模型就进军大数据是不可能的,那些认为我已经保存了大量的数据就要创造价值的公司管理者可能也需要清晰认识一点:我们要主动针对业务问题来获得有价值的数据。就个人来看,很多问题是后验机器学习解决不了的,应该有更加丰富的动态建模决策模式。这种东西在所谓的kaggle是绝对无法测试出来的,比如我要做动态模型,对方说不行我就给一个测试集你要全部都准确。也就是有的比赛在设置的时候就有误导的前提假设,那么即使被人偶然迭代出一个精度高的算法,也无法正确指导生产或者商务活动。这里还有很多东西可以玩,只是不知道是否有数据(或者随时采集的能力)、有真实需求、有丰富场景的大厂能够用高薪请各位去探索这多彩又有趣的世界了。各位都加油!


——————————————

往期精彩:

登录查看更多
0

相关内容

数据挖掘(Data mining)一般是指从大量的数据中自动搜索隐藏于其中的有着特殊关系性的信息和知识的过程。
【硬核书】不完全信息决策理论,467页pdf
专知会员服务
348+阅读 · 2020年6月24日
最新《深度半监督学习》综述论文,43页pdf
专知会员服务
153+阅读 · 2020年6月12日
专知会员服务
112+阅读 · 2020年6月12日
2020年中国《知识图谱》行业研究报告,45页ppt
专知会员服务
238+阅读 · 2020年4月18日
【2020新书】如何认真写好的代码和软件,318页pdf
专知会员服务
63+阅读 · 2020年3月26日
生物数据挖掘中的深度学习,诺丁汉特伦特大学
专知会员服务
66+阅读 · 2020年3月5日
缺失数据统计分析,第三版,462页pdf
专知会员服务
108+阅读 · 2020年2月28日
【2020新书】数据科学:十大Python项目,247页pdf
专知会员服务
212+阅读 · 2020年2月21日
【德勤】中国人工智能产业白皮书,68页pdf
专知会员服务
299+阅读 · 2019年12月23日
2019中国家政服务行业发展剖析及行业投资机遇分析报告
战略|咨询公司在中国的困境与出路
智慧云董事会
16+阅读 · 2019年3月13日
AI应届博士年薪80万起步,BAT校招数据大披露:缺人!
炼数成金订阅号
8+阅读 · 2018年11月20日
【全职&实习- 上海】量化岗位招聘公告
量化投资与机器学习
4+阅读 · 2018年7月3日
2018年AI专业最全报考指南
网易智能菌
11+阅读 · 2018年6月10日
深度学习,给自己一个年薪50万的工作机会!
全球人工智能
3+阅读 · 2018年1月10日
Arxiv
35+阅读 · 2020年1月2日
Meta-Transfer Learning for Few-Shot Learning
Arxiv
8+阅读 · 2018年12月6日
Arxiv
4+阅读 · 2018年5月24日
VIP会员
相关VIP内容
【硬核书】不完全信息决策理论,467页pdf
专知会员服务
348+阅读 · 2020年6月24日
最新《深度半监督学习》综述论文,43页pdf
专知会员服务
153+阅读 · 2020年6月12日
专知会员服务
112+阅读 · 2020年6月12日
2020年中国《知识图谱》行业研究报告,45页ppt
专知会员服务
238+阅读 · 2020年4月18日
【2020新书】如何认真写好的代码和软件,318页pdf
专知会员服务
63+阅读 · 2020年3月26日
生物数据挖掘中的深度学习,诺丁汉特伦特大学
专知会员服务
66+阅读 · 2020年3月5日
缺失数据统计分析,第三版,462页pdf
专知会员服务
108+阅读 · 2020年2月28日
【2020新书】数据科学:十大Python项目,247页pdf
专知会员服务
212+阅读 · 2020年2月21日
【德勤】中国人工智能产业白皮书,68页pdf
专知会员服务
299+阅读 · 2019年12月23日
相关资讯
2019中国家政服务行业发展剖析及行业投资机遇分析报告
战略|咨询公司在中国的困境与出路
智慧云董事会
16+阅读 · 2019年3月13日
AI应届博士年薪80万起步,BAT校招数据大披露:缺人!
炼数成金订阅号
8+阅读 · 2018年11月20日
【全职&实习- 上海】量化岗位招聘公告
量化投资与机器学习
4+阅读 · 2018年7月3日
2018年AI专业最全报考指南
网易智能菌
11+阅读 · 2018年6月10日
深度学习,给自己一个年薪50万的工作机会!
全球人工智能
3+阅读 · 2018年1月10日
Top
微信扫码咨询专知VIP会员