机器学习很难,而培养能够进行机器学习开发的人更难。要想成为一名富有成效的数据科学家,需要经过不同阶段的专业知识训练。
对于想找到这样的数据科学家的公司来说,就像大海捞针。在 Gramener 从事了多年的数据科学家招聘工作之后,我总结了人才市场上存在的一些应聘者的技能模式。虽然面试失败的方式有数百种,但它们大致可以被分为四大类型。
成千上万的申请人中只有少数能够挤过机器学习的独木桥,因此了解大多数人的失败情况是很有帮助的。对于有抱负的数据科学家或希望提高工作水平的人来说,这些都是需要避免的陷阱。
意识到自己的弱点是解决问题的第一步。
想要成为一名真正成功的数据科学,应聘者需要掌握专业的技能。为了用轻松的方式来说明这些问题,我们将用训练狙击手的例子作为类比。
那么,可能导致应聘数据科学家职位失败的 4 种方式是什么?
与其他任何工作一样,用行业术语来装饰个人简历也许是很诱人的,而数据科学恰恰不缺乏流行语。虽然这种行为的确提高了简历获得关注的机会,但很快会带来反作用。
简历上声称的高级分析技能实际上只是熟悉基本的 Excel 数据透视表、SQL 查询或 Google Analytics,这样的情况并不罕见。这种行为不仅浪费时间,也无法让候选人通过面试,甚至会让他们感到挫败。
对于有抱负的狙击手来说,这就好比只要穿上士兵的外衣、扛起士兵的枪,不需要任何时间训练就能成为一名士兵一样。这听起来似乎很荒谬,一只披着狼皮的羊四处寻找猎物,这可不是一件开玩笑的事。
许多声称了解建模的候选人都极力解释模型函数调用和参数。确实,通过一行代码就可以让模型运行起来,但机器学习远不止这么简单。数据科学家需要了解更多,比如为什么逻辑回归比 SVM 更适合用在某些场景里,或者什么时候简单的外推法比 ARIMA 或 Holt-Winters 等预测技术更好用。
一个好的狙击手需要做的不仅仅是瞄准和射击。实际上,射击训练只占狙击学校课程的 20%。狙击手需要掌握更多的技能,比如耐心、遵守纪律和从远处估计目标距离的观察能力。
机器学习技术方面的动手能力可以成为候选人的加分项,但他们往往会在这方面做得不足。他们需要投入精力进行训练,以掌握更多基础技能,比如容易被忽略的统计和探索性数据分析。
建模仅占数据分析生命周期的一小部分。在任何成功的机器学习项目中,超过 50%的时间都是在数据准备、数据清理,而之后的 25%时间用于模型的解释和推荐。
即使候选人声称他们的项目达到了 90%的准确率,但他们却很难解释 p 值是什么。听着他们解释为什么我们需要模型的置信区间时,简直就是一场悲剧。
牢牢掌握基础知识对所有学科都是至关重要的。一名狙击手首先需要成为一名伟大的步兵。如果狙击手在战斗中无法修好出问题的枪或者是失火的话,那么再好的枪法又有什么用?
要掌握我们讨论过的所有技术显然是一项艰巨的任务。不过我们还是错过了整个链条的关键环节,而这正是大多数面试出现问题的地方。
数据科学家的最终使命是解决业务问题,而不仅仅是分析数据或建立一个伟大的模型。他们在使用工具加载数据之前,需要先知道要解决什么业务问题,并制定解决问题的步骤。
当被问及企业如何解决客户流失问题时,如果候选人开始大侃数据分析技术,或者更糟糕的是,围绕模型名称说个没完,那么面试极有可能失败。他们应该要想想为什么用户会注册、用户的期望是什么以及什么东西会影响到业务。
试想,如果一个专家狙击手无法伪装好自己或无法找到正确的射击目标,那么这样的狙击手其实是一个危险的人,他的风险比外部的敌人来得更大。
总之,在走向数据科学的路上,我们需要遵守一些原则:
找出业务问题,并通过一系列步骤来解决问题。
在统计学和探索性数据分析中应用基础知识,以获得对数据的直观感受,并不断改进分析方法。
选择恰当的数据分析技术或机器学习模型,然后把结果呈现给用户。
正确定位自己的专业知识技能,做适合这个角色做的事情。
噢,对了,在你真的想好要进入数据分析领域之前,建议你先看看数据科学家们发自内心深处的吐槽《年薪超 70 万,为什么数据科学家们还都忙着找新工作?》,如果看完之后你依然满腔热情,AI 前线祝你能够在数据分析市场中找到自己的一席之地!
原文链接
https://towardsdatascience.com/4-ways-to-fail-a-data-scientist-job-interview-d9c4c85c683
点击下方图片即可阅读
美国又给中国下套了,英伟达首当其冲
人工智能时代,如何快速且有效地入门?需要哪些数学基础?怎样掌握机器学习主要方法?
工学博士、副教授王天一在他的《人工智能基础课》里,会带你巩固人工智能基础,梳理人工智能知识框架,了解人工智能的最佳应用场景。新注册用户,立减 30 元。欢迎点击图片试读。
点「阅读原文」,免费试读或订阅