牛逼的数据科学家应该具有的8个习惯!

2017 年 12 月 3 日 物联网智库 Guest Writer

来源:IoT for all

作者:Guest Writer

物联网智库 整理发布

转载请注明来源和出处

------   【导读】   ------

我被最经常问及的问题是:“你是如何发展机器学习及数据科学职业的?我的回答是要从养成一些重要的习惯开始。以下是对我工作有帮助的,以及我所看到的卓越的数据科学家们所建立的8个习惯。



很幸运,我在自己的职业生涯早期遇到了一些数据科学和机器学习的先驱。他们的思想激发了我对这个领域的兴趣,他们的习惯影响了我的日常生活。我最常被问到的问题是,“我怎样才能开始一段机器学习或数据科学生涯?”答案是首先从形成一些重要的习惯开始。下面这些是适合我的一些方法或者是我看到的那些卓有成效的数据科学家拥有的习惯。

 

1. 专注的阅读和学习


一天只有24个小时,你要阅读的“垃圾”内容恐怕会比“干货”内容多得多,这时,列出一份可信的信息源就变得非常重要——可信的信息源应该包括博客、社交摘要、文库等能提供优质内容的渠道。不要浪费时间阅读像《福布斯》或《赫芬顿邮报》这样的网站,不要在Arxiv上遍阅每一篇深度学习论文。


 

我会长期研究Facebook、谷歌、迪斯尼等公司的研究成果,他们会在固定渠道频繁更新值得一读的内容,像斯坦福大学、麻省理工学院、康奈尔大学等大学也是高质量学习内容的来源。寻找那些你很容易理解的形式和你感兴趣的话题的博客。不同的人表现同一个主题会用写作、演讲、视频等不同的形式,你要选择适合你的沟通或表现风格。

 

2. 优化你的工作区和工具集

 

我可能比大多数数据科学家都有效率,因为我已经优化了我使用的工具。我可以更快地交付项目,因为我不会浪费任何时间与我的开发环境来作斗争。

 

我在Amazon上为我的工作区设置了默认的服务器镜像,而且每一个都是用我找到的最适合编程语言和数据库的IDE(集成开发环境) /环境变量定制的。我为大多数类型的项目都提供了数据源,并在大多数内部数据源中预制了挂钩,安全设置是镜像的一部分。

 

我尝试了很多次、失败了很多次。我使用的配置比我能计算的还要多,在尝试了多种不同的数据科学方法和开发应用程序后,我才达到如今这种程度。打造最适合你的工作区能使你变得高效,这样在毫无准备的业余爱好者面前你就会显得非常专业。


3. 倾听业务问题

 

在谷歌自动化取代你的工作之前,你需要找到新的业务问题去解决。我经常听《彭博财经》和CNBC的节目。我会关注为什么公司没有实现收入目标,这些是他们没有解决的商业问题,所以他们愿意为解决方案付费。

 

数据科学或机器学习该如何应对这些挑战?我看到很多预测性的问题;也有一些公司无法预料的突发事件,通常是供应链中断或客户偏好的改变。


 

我也看到了一些涉及数据科学或机器学习能力的问题——公司没有分析数据的能力,这也都是许多公司共同面临的问题。学习如何解决这些问题并宣传你的能力,如果你能倾听他们的业务问题并提供综合解决方案,你对公司的价值就会更高。

 

4. 建立一个专业的网站

 

声誉和影响力是新的营销手段,建立一个专业的网站就有这两个好处。首先,一个专业的网站可以让你找到你可以学习的人;第二,一个专业的网站允许你建立自己的品牌,并在数据科学或机器学习社区中增加个人影响力。

 

像Twitter和LinkedIn这样的社交网站,以及像stack一样的技术网站,都是构建专业网站的绝佳场所。在那里你先跟随观察,然后倾听,当你开始看到社区里大家都喜欢的内容类型的时候,你可以做一个内容整合者,就是简单的整合分享一些你正在读的东西,你的粉丝也可能会喜欢看到你分享的这些内容。

 

开始寻找你自己的声音。当你看到其他人并没有很好地涵盖有趣的主题时,你可以开始创建内容,进行一些有趣的经验分享,使用堆栈,回答问题等等。当你变得专业以后,就开始考虑为开源项目贡献力量或者发布你的研究成果。

 

影响力带来机会,你必须不断提升自己,而不是一味地要求新工作和升职。我通过我的专业网站获得了演讲、内部访问和接触一些客户的机会。记住,付出总是有回报的!

 

5. 增加发言的机会


抓住每一个你可以发言的机会。我被称为“影响者”的最大原因之一是我的演讲活动。我喜欢听众数量不多的小型活动,我会准备一个简短的并且大家感兴趣的讨论话题,其余的时间都花在回答问题上。

 

我们都以不同的方式提供价值。我的风格是先满足听众的好奇心,然后再将事件引导到大家关注的领域的要点上。而其他演讲者会把大部分时间花在演示环节上,这样一来,观众就不太能够提出问题,因此演讲者还不如导游更有价值,而这更适合于会议设置,而不是私人事件。

 

找到适合你自己的风格、信息和听众。分享你独特的经历、项目或愿景,你会惊讶于对你的分享感兴趣的人数。当众发言有助于发展你独特的视角。在长期的机器学习或数据科学的职业生涯中,你的观点比你在代码或算法中做出贡献都要有价值。

 

6. 多说“NO”

 

数据科学家和机器学习专家可以做很多不同的事情,这就要求我们做很多不同的事情。在大多数情况下,没有正确答案。学会说“不”,你可以更多的理解你想要从事什么工作和选择你的职业道路。我对工作、书籍交易和那些不适合我个人生活的项目都会说不。这使我更快乐,更专注于我想做的事情。

 

我想要的机会,我必须自己追逐,我应该做一个要求别人的人,而不是被人要求的人。我所知道的最有效的数据科学家都可以得到他们想要的项目、客户和角色。我自己也模仿过这种行为,对我来说效果很好。

 

7. 采用极简主义风格

 

大师们使用最少的代码,最少的数据,最简单的算法,最简单的表达。极简主义是专家数据科学家的标志。

 

8. 有目的地说话&要被理解

 

我只花大约20%的时间与数据科学和机器学习专家进行交流,其他大部分时间用来与非技术受众沟通。他们并不关心机器学习本身,他们有自己想要的结果。要想有目的地说话和清晰的表达,首先得学会倾听。提出问题以了解一个人或群体的真实想法的过程是一种艺术。我还在研究这个问题,但我已经看到大师们能够通过提出正确的问题来剖析问题的根源。


 

一个好的辩证要素是创造一个环境,在这里人们乐于诚实地回答问题,并承认他们不知道的东西,可以给他们一种感觉:花时间回答这些问题将有利于他们,并以一种他们理解的方式以某种方式把他们的答案综合在一起。

 

一旦我理解了这个问题,我就能更加肯定地回答它。我的语言风格所有人都很容易理解,同时我很尊重听众,我希望能用正确的方式引导,让他们会掌握复杂的概念。

 

我认为,以观众能理解的方式表达思想和概念是我的责任。当他们迷失或困惑时,这不是他们的错,而是我的错。这是我自己最难以接受的,这样的观点帮助我提升了很多。我也对你的习惯很感兴趣,你怎样做才能使你变成更好的数据科学家,你又在你努力效仿的人身上观察到了什么?



往期热文(点击文章标题即可直接阅读):

登录查看更多
5

相关内容

数据科学(英語:data science)是一门利用数据学习知识的学科,其目标是通过从数据中提取出有价值的部分来生产数据产品。 它结合了诸多领域中的理论和技术,包括应用数学、统计、模式识别、机器学习、数据可视化、数据仓库以及高性能计算。 数据科学通过运用各种相关的数据来帮助非专业人士理解问题。
专知会员服务
144+阅读 · 2020年6月15日
【经典书】Python数据数据分析第二版,541页pdf
专知会员服务
192+阅读 · 2020年3月12日
【书籍推荐】简洁的Python编程(Clean Python),附274页pdf
专知会员服务
179+阅读 · 2020年1月1日
【新书】Python中的经典计算机科学问题,224页pdf
专知会员服务
144+阅读 · 2019年12月28日
21个必须知道的机器学习开源工具!
AI100
13+阅读 · 2019年9月13日
2020年你应该知道的8种前端JavaScript趋势和工具
前端之巅
5+阅读 · 2019年6月9日
我是怎么走上推荐系统这条(不归)路的……
全球人工智能
11+阅读 · 2019年4月9日
Java开发者必看!机器学习开发库精选
云栖社区
5+阅读 · 2018年8月22日
Python为啥这么牛?
Python程序员
3+阅读 · 2018年3月30日
为什么你应该学 Python ?
计算机与网络安全
4+阅读 · 2018年3月24日
一招检验10大深度学习框架哪家强!
深度学习世界
3+阅读 · 2017年9月14日
这位程序员为什么要弃用Facebook?
CSDN
5+阅读 · 2017年7月14日
Arxiv
24+阅读 · 2020年3月11日
Meta-Learning with Implicit Gradients
Arxiv
13+阅读 · 2019年9月10日
Universal Transformers
Arxiv
5+阅读 · 2019年3月5日
Arxiv
19+阅读 · 2018年6月27日
Arxiv
3+阅读 · 2018年2月24日
VIP会员
相关VIP内容
专知会员服务
144+阅读 · 2020年6月15日
【经典书】Python数据数据分析第二版,541页pdf
专知会员服务
192+阅读 · 2020年3月12日
【书籍推荐】简洁的Python编程(Clean Python),附274页pdf
专知会员服务
179+阅读 · 2020年1月1日
【新书】Python中的经典计算机科学问题,224页pdf
专知会员服务
144+阅读 · 2019年12月28日
相关资讯
21个必须知道的机器学习开源工具!
AI100
13+阅读 · 2019年9月13日
2020年你应该知道的8种前端JavaScript趋势和工具
前端之巅
5+阅读 · 2019年6月9日
我是怎么走上推荐系统这条(不归)路的……
全球人工智能
11+阅读 · 2019年4月9日
Java开发者必看!机器学习开发库精选
云栖社区
5+阅读 · 2018年8月22日
Python为啥这么牛?
Python程序员
3+阅读 · 2018年3月30日
为什么你应该学 Python ?
计算机与网络安全
4+阅读 · 2018年3月24日
一招检验10大深度学习框架哪家强!
深度学习世界
3+阅读 · 2017年9月14日
这位程序员为什么要弃用Facebook?
CSDN
5+阅读 · 2017年7月14日
Top
微信扫码咨询专知VIP会员