讨论 | 你是否遇到过你完全不能理解的机器学习概念？

2017 年 11 月 25 日 AI科技评论 岑大师

俗话说：隔行如隔山。但就算同一座山，有的时候因为“山”太大，未能爬到顶峰的人往往很难一窥整座山的全貌。

这不，AI科技评论在Reddit的机器学习版块就发现了一个很热烈的讨论，题目叫做：

机器学习专业的研究僧们进来说一说，你是否遇到过你完全不能理解的机器学习概念？

Those who are working professionally in ML and/or academics who have completed graduate-level coursework in ML: Are there any ML concepts that you don't quite fully grasp?

在问题下也有不少有意思的回答，AI科技评论整理了部分回答，与机器学习的“炼丹师”们共勉。

排在最前面的是@Leonoel讲述的一个高票故事：

“故事时间。

我喜欢和我的学生讲这个故事来激励他们，同时也希望能减轻他们的‘不懂装懂综合症’。

在NIP 2013上，当时有一位演讲者的演讲我完全听不懂。这是我博士的最后一年，这让我产生了警觉。我开始感觉很糟：作为一个新出炉的博士，我竟然没有能从NIPS的主题报告中学到任何东西！

当时坐在我旁边的两个朋友，其中一位是UC Berkeley的Michael Jordan，另一位在波士顿和Andrew McCallum一起做研究。这两位教授在机器学习界的大名如雷贯耳，所以我想当然的想，他们应该从这个报告中学到不少东西。

但最后，他们告诉我，他们同样听得一脸懵逼。

这个故事的含义是：机器学习是一个巨大的领域，如果你在你自己的领域花了足够多的时间，你很有可能难以对其他领域了如指掌。不要浪费你的时间去了解每一件事情。

还有另一个例子：我有个朋友是普林斯顿的数学家，但他从来没有理解过机器学习背后的数学，因为他主要是做数学理论研究的。”

在这个回答下，网友@iamiamwhoami做了补充说明：

“你在应用领域社区混久了就会感觉到，有的人真的是不怎么擅长解释他们的研究。”

@gionnelles也做出了类似的回答：

“如果有人声称他了解机器学习领域的所有东西，这绝壁是撒谎或者是错误的。机器学习领域太过广泛，研究进展太快，这意味着人们可以成为直接接触他们所在细分领域的专家，并聪明地讨论其他部分，但总有新的东西值得学习。”

甚至一些机器学习基础的重要理论如RNN和反向传播理论，不少人也表示有诸多理解难点，例如网友@klop2031就这么说：

“RNN的递归怎么绕，以及反向传播如何通过时间起作用，对我来说仍然一团乱麻。我仍然需要通过数学方式来理解，同样，对比分歧的原理如何我也不大清楚。”

好不容易弄懂了反向传播，却发现Hinton老爷子又有了新理论。@wdroz是这么说的：

“要想时刻跟随并理解机器学习的最新潮流很难，尤其在深度学习领域更是如此。举个栗子，我读了好些关于Capsule网络的介绍，但我还是无法理解其工作原理。”

@debau的回答让我们感到了深深的绝望：

“我希望我能理解我自己的论文...” （这就过分了吧...）

也有卖萌的，比如网友@oursland的回答：

“我曾经做到了这一点。然后我又把所有东西给忘掉了（雷锋网注：@oursland这里用的是机器学习中的“灾难性遗忘”的梗）。这当中一定有一套炒鸡糟糕的超参数，或者其他的什么东西作怪。：V ”

网友@andyspl也声称做到了这一点：

“握爪！我试图将这些东西写下来，但我的笔记本边上的空白太小啦~”

费马大定理：“我确信已发现了一种美妙的证法，可惜这里空白的地方太小，写不下......”

嗯，以上的笑点，只有做机器学习的理工男才懂......

而得票最高的是Reddit网友@stochastic_gradient富有哲理的回答：

“没有人会完全理解（机器学习的所有概念）。每一篇发表在Arxiv的论文所讲的，实际上都是作者已经理解、但之前从未有人理解过的东西。

做机器学习研究，的确100%的是一件你需要和你不能完全理解的东西打交道的事儿。任何吸引你的事情都源于你对它的不了解。矛盾的是，即便人们知道解释这些事情是他们的工作，但他们仍然会对此有很大的不安。”

这或许也正是机器学习的迷人之处吧。

对于这个问题，现在正在机器学习路上的你又有什么看法呢？如果你想了解关于该问题的更多讨论，请移步Reddit：

https://www.reddit.com/r/MachineLearning/comments/7f5pyt/d_those_who_are_working_professionally_in_ml/?st=jaeda5qz&sh=82900c00

推荐阅读

————— AI 科技评论招人啦！ —————

我们诚招学术编辑 N 枚（全职，坐标北京）、新媒体运营 N 枚（全职，坐标深圳）、学术兼职 N 枚。

详情请参见AI科技评论招人啦，新媒体运营、学术编辑、学术兼职虚位以待！

欢迎发送简历到 guoyixin@leiphone.com

————— 给爱学习的你的福利 —————

不要等到算法出现accuracy不好、loss很高、模型overfitting时，

才后悔没有掌握基础数学理论！

线性代数及矩阵论，概率论与统计，凸优化

AI慕课学院机器学习之数学基础课程即将上线！

扫码进入课程咨询群，组队享团购优惠！

详细了解点击文末阅读原文

————————————————————

登录查看更多

知识荟萃

精品入门和进阶教程、论文和代码整理等

查看相关VIP内容、论文、资讯等

【经典书】算法基础：打开算法之门，Algorithm unlocked，237页pdf

专知会员服务

147+阅读 · 2020年7月3日

【硬核课】统计学习理论，321页ppt

专知会员服务

140+阅读 · 2020年6月30日

【UC】伯克利一份简明《机器学习数学基础》丝滑入门手册，47页pdf

专知会员服务

245+阅读 · 2020年4月15日

机器学习速查手册，135页pdf

专知会员服务

343+阅读 · 2020年3月15日

【CHI2020-微软】解释可解释性:理解数据科学家使用机器学习的可解释性工具

专知会员服务

103+阅读 · 2020年3月8日

《可解释的机器学习-interpretable-ml》238页pdf

专知会员服务

208+阅读 · 2020年2月24日

【2019机器学习大总结】机器学习和机器人:我的2019年领域状态

专知会员服务

54+阅读 · 2019年12月31日

【开放书】《自动化机器学习：方法，系统与挑战》，附223页pdf下载

专知会员服务

160+阅读 · 2019年12月18日

【机器学习课程】机器学习中的常识性问题

专知会员服务

75+阅读 · 2019年12月2日

【经典】深度学习数学宝典《深度学习所需要的矩阵微积分》

专知会员服务

285+阅读 · 2019年12月2日

520 页机器学习笔记！图文并茂可能更适合你

大数据技术

19+阅读 · 2019年10月8日

机器学习平台和机器学习框架有何不同，你真的搞懂了吗？

人工智能学家

20+阅读 · 2019年4月29日

2018年机器学习/人工智能最重要的进展是什么？

专知

6+阅读 · 2018年12月24日

理解五个基本概念，让你更像机器学习专家

云栖社区

5+阅读 · 2018年11月29日

关于机器学习你要了解的 5 件事

机器学习算法与Python学习

7+阅读 · 2018年9月7日

未来人类会关注可解释性吗？

待字闺中

5+阅读 · 2018年8月9日

机器学习宗师Michael I. Jordan 撰文：不要被深度学习一叶障目不见泰山

雷锋网

4+阅读 · 2018年4月23日

机器学习不能做什么？

引力空间站

5+阅读 · 2018年3月28日

数据科学、机器学习、人工智能的区别到底是什么？

MOOC

3+阅读 · 2018年2月1日

机器学习应该准备哪些数学预备知识？

AI100

4+阅读 · 2017年11月26日

Progressive Pose Attention Transfer for Person Image Generation

Arxiv

4+阅读 · 2019年5月13日

Outlier Aware Network Embedding for Attributed Networks

Arxiv

6+阅读 · 2018年11月19日

Explainable Reasoning over Knowledge Graphs for Recommendation

Arxiv

11+阅读 · 2018年11月12日

Logic Attention Based Neighborhood Aggregation for Inductive Knowledge Graph Embedding

Arxiv

7+阅读 · 2018年11月4日

The Matrix Calculus You Need For Deep Learning

Arxiv

12+阅读 · 2018年7月2日

Deep Feature Aggregation with Heat Diffusion for Image Retrieval

Arxiv

4+阅读 · 2018年5月25日

Human-In-The-Loop Person Re-Identification

Arxiv

4+阅读 · 2018年5月4日

Logically-Constrained Reinforcement Learning

Arxiv

5+阅读 · 2018年4月22日

Global Relation Embedding for Relation Extraction

Arxiv

10+阅读 · 2018年4月19日

Recurrent Segmentation for Variable Computational Budgets

Arxiv

6+阅读 · 2018年3月15日

VIP会员