想成为数据科学家？试试费曼技巧！

会员服务 ·

想成为数据科学家？试试费曼技巧！

2018 年 3 月 15 日 论智 Venkat Raman

作者：Venkat Raman

编译：weakish

编者按：True Influence数据科学家Venkat Raman介绍了自己进入数据科学领域、成为数据科学家的秘诀——费曼技巧。

来源：Pixabay

许多博客和文章在谈论如何成为数据科学家这一话题。通常会给出这样一个列表：

学习描述性统计、假设检验、概率
了解机器学习算法的类型——监督学习、无监督学习
学习Python、R、SAS、SQL
基于Python、R、SAS应用机器学习技术
学习数据可视化

虽然上述途径没什么问题，但仅仅如此不足成为一个高效的数据科学家。现在你可能会问为什么？在回答这一问题之前，我想先谈谈“费曼技巧”。

为什么叫“费曼技巧”？

这一技巧的命名来源于伟大的理论物理学家理查德·费曼（Richard Feynman）。他能以非凡的技巧使用朴素的外行用语解释最复杂的科学话题，因此他有一个绰号“大解释者”（The Great Explainer）。

费曼技巧

第一步： 收缩你觉得难以把握的主题。了解这一主题。

第二步： 假装你正教某人这一主题，并且使用非常简单的术语。通过这样的方式向自己解释这一主题。

如果你不能以简单的方式解释它，说明你对它的理解还不深。来源：Geminthinking

第三步： 尝试一个例子，或者演示它是如何工作的。

第四步： 评估你对这一主题的知识，如果仍有一些概念不清楚，学习更多关于这些概念的内容，并重复第2至4步。

完成这一过程之后，你会发展出对该主题比刚开始时更深的理解。这就是“费曼技巧”的魔法。

要成为数据科学大家，先成为“大解释者”

数据科学领域需要持续的学习。其中一些概念也许极难理解。费曼技巧帮助某人理解原本认为非常难的主题。

向老板、客户、投资人解释的需要

只有当关键决策者认识到其中的价值，数据分析产业才能生存。决策者是

你的老板 如果你从事的是面向企业内部的分析工作。
客户如果你从事分析咨询/服务业。
VC（投资人） 如果你正为你的“AI初创企业”寻求投资（募集资金的第一步是用AI称呼它 :P）

大多数情况下，你的老板/客户/投资人可能并不具备数据分析的背景，或者对最新数据分析主题的深刻理解。使用尽可能简单的语言向他们解释数据分析概念，使他们看到你的提议的价值，这是你的责任。

所以，底线是练习费曼技巧，免得自己像呆伯特一样，天天面对老板的折磨 :P

来源：Dilbert Comic

译文：

老板： 我们有一个巨大的数据库，里面装满了客户行为信息。（图一）
呆伯特： 棒极了。我们可以使用非线性数学和数据挖掘技术优化我们的零售渠道。（图二）
老板： 如果你说的是垃圾推广，那这个会议很成功。

来源：Dilbert Comic

译文：

老板： 我们的云中的大数据，是否为我们提供了可执行的分析（actionable analytics）？（图一）
呆伯特： 是的，数据显示一旦你学了新术语，我的生产力就下跌了。（图二）
老板： 也许内存内计算（in-memory computing）能加速你的应用。（图三）
呆伯特： 下跌，下跌，下跌。（图三）

我是如何成为数据科学家的

在我的MBA课程中，我是唯一具备统计背景的人，我总觉得，当我向朋友们解释统计概念时，我对统计概念的理解加深了。他们的赞许（很容易地学到了这个概念），鼓励了我，也让我感到自己有责任彻底地学习这些概念，以免教给他们错误的知识。

彻底学习的自信使我得以进入数据科学领域。即使现在我仍然使用费曼技巧来更好地把握那些初看起来很费解的主题。

实践费曼技巧——撰写文章

好吧，我必须承认，我之所以写本博客的第一篇文章Recommender Engine（推荐引擎）是为了更好地理解推荐系统如何工作。尽管我不能说自己是推荐系统的专家，我确信我以直观的方式学到了某些东西。

类似的，我最近的文章How to Dockerize an R shiny app- Part 1（如何将R应用纳入docker容器）尝试通过乐高积木解释docker。

费曼技巧——冒名顶替症候群的解药

费曼：首要原则是，你千万不能愚弄自己，最容易被愚弄的人是你自己。来源：Pinterest

由于数据科学领域有利可图，许多人希望进入这一领域。那些不具备统计/数学背景而成功进入这一领域的人，有时会受冒名顶替症候群的困扰。正如上图刻画的那样，“最容易被愚弄的人是你自己”。克服冒名顶替症候群的唯一方法是真正深刻地理解数据科学的众多概念。

如果你喜欢我的文章，欢迎点赞。也欢迎留言你对文章的意见。

登录查看更多

相关内容

数据科学家

关注 20

【Manning书籍】像数据科学家一样思考，331页pdf教您如何步步成为数据科学家

专知会员服务

49+阅读 · 2020年6月18日

【干货书】用Python构建聊天机器人，205页pdf，使用自然语言处理和机器学习

专知会员服务

220+阅读 · 2020年6月14日

还在修改博士论文？这份《博士论文写作技巧》为你指南

专知会员服务

165+阅读 · 2020年6月9日

《Python机器学习项目实战》，135页pdf带你小白入门机器学习

专知会员服务

174+阅读 · 2020年6月6日

【实用书】Python数据科学从零开始，330页pdf

专知会员服务

145+阅读 · 2020年5月19日

【干货书】机器学习，408页pdf，开发人员和技术专业人员的动手实践手册

专知会员服务

218+阅读 · 2020年5月7日

【干货书】用Python进行深思熟虑的机器学习, 216页pdf，Thoughtful ML with Python

专知会员服务

70+阅读 · 2020年4月4日

【2020新书】如何成为一名专业的数据科学家？352页pdf，Build a Career in Data Science

专知会员服务

95+阅读 · 2020年3月14日

【2020新书】数据科学:十大Python项目，247页pdf

专知会员服务

216+阅读 · 2020年2月21日

为机器学习应用实践Scikit-Learn，数据科学基础与Python，247页pdf

专知会员服务

144+阅读 · 2019年12月1日

一万小时贫穷定律

互联网er的早读课

5+阅读 · 2018年8月22日

【干货】数据科学与机器学习面试指南

专知

4+阅读 · 2018年5月1日

不知道如何开始机器学习？这有份初学者指南！

AI研习社

3+阅读 · 2018年4月4日

数据科学、机器学习、人工智能的区别到底是什么？

MOOC

3+阅读 · 2018年2月1日

如何用sklearn创建机器学习分类器？这里有一份上手指南

量子位

11+阅读 · 2018年1月17日

从0到1 | 0基础/转行如何用3个月学会机器学习|数据科学

数据挖掘入门与实战

5+阅读 · 2017年12月4日

牛逼的数据科学家应该具有的8个习惯！

物联网智库

5+阅读 · 2017年12月3日

机器学习实践指南

Linux中国

8+阅读 · 2017年9月28日

如何用 3 个月零基础入门机器学习？

AI研习社

6+阅读 · 2017年9月27日

如何七周成为数据分析师

R语言中文社区

4+阅读 · 2017年7月19日

A Collective Learning Framework to Boost GNN Expressiveness

Arxiv

20+阅读 · 2020年3月26日

What is Normal, What is Strange, and What is Missing in a Knowledge Graph: Unified Characterization via Inductive Summarization

Arxiv

8+阅读 · 2020年3月23日

Causality for Machine Learning

Arxiv

26+阅读 · 2019年11月24日

Meta-Learning with Implicit Gradients

Arxiv

13+阅读 · 2019年9月10日

Finding Needles in a Moving Haystack: Prioritizing Alerts with Adversarial Reinforcement Learning

Arxiv

3+阅读 · 2019年6月20日

Scale-Aware Trident Networks for Object Detection

Arxiv

4+阅读 · 2019年1月7日

Deep Anomaly Detection with Outlier Exposure

Arxiv

17+阅读 · 2018年12月21日

Quantum generative adversarial networks

Arxiv

4+阅读 · 2018年4月30日

Fictitious GAN: Training GANs with Historical Models

Arxiv

4+阅读 · 2018年3月23日

The Search Problem in Mixture Models

Arxiv

3+阅读 · 2018年2月24日

VIP会员