机器学习的出现，是否意味着“古典科学”的过时？

会员服务 ·

机器学习的出现，是否意味着“古典科学”的过时？

2022 年 1 月 23 日 学术头条

作者： Laura Spinney

译者：刘媛媛

原文：Are we witnessing the dawn of post-theory science?

让我们回忆一下，Isaac Newton 被一个苹果砸中头部，然后是怎么提出牛顿第二定律——万有引力的？

大概过程是这样的：大量的实验和数据分析之后，他意识到，力、质量和加速度之间存在根本的关系。然后他制定了一种理论来描述这种关系，表示为一个方程“F=ma”，并用它来预测苹果以外的物体的行为。事实证明，他的预测是正确的（这对于不要求精确度的人们来说是足够）。

现在，我们再来对比一下当今科学发展的新潮流：Facebook 的机器学习工具比任何心理学家都更能预测你的偏好；DeepMind 开发的 AlphaFold，可以根据蛋白质所含的氨基酸对蛋白质结构做出了迄今为止最准确的预测。

它们的诞生对于科学界的研究范式来说究竟意味着什么？换句话说：获取知识的最佳方式是什么？科学又从何而来？

人类的不安

Facebook 和 AlphaFold 没有提供任何理论解释。这些算法只是完成工作并且效果还不错。我们每天都在见证 Facebook 预测的社会影响。AlphaFold 的影响尚未显现，但许多人相信它将改变医学。

一时间，它们的理论基础似乎隐居二线。

2008 年，时任 Wired 杂志的主编 Chris Anderson 预言了一种理论的消亡。他认为，现在已经积累了如此多的数据，而计算机在发现数据间的关系方面比人类表现的更好。很快，古老的科学方法，即假设、预测、检验，将被扔进历史的垃圾箱。人们不再寻找事物的本质原因，而是满足于数据间的相关性。

事后看来，Anderson 所看到的情况是真实的。大量数据的复杂性无法被我们传统理解的理论所捕捉。

德国马克斯普朗克生物控制论研究所所长、计算神经科学家 Peter Dayan 说：“因为不知道它们会是什么样子的，所以我们甚至没有能力写出对描述有用的理论。”

但 Anderson 对理论终结的预测似乎为时过早。尽管 Facebook 和 AlphaFold 这样的无理论基础的预测引擎取得了成功，但理论不会消亡，此处有以下三个原因。

第一个原因是，我们已经意识到 AI，尤其是神经网络这种机器学习形式，无需接受明确的指令即可从数据中学习，它们本身是容易出错的。想想谷歌搜索引擎和亚马逊招聘工具中记录的偏见就可以明白。

第二，人类对没有理论基础的科学方法深感不安。我们就是不喜欢和黑匣子相处。

第三，可能仍然有很多传统类型的理论（即人类可以理解的）可以有效地解释很多事情，只是尚未被发现。

所以理论还没有消亡，但它正在改变——也许还会变得面目全非。普林斯顿大学心理学家 Tom Griffiths 说：“拥有大量数据时的有意义的理论，与仅拥有少量数据时有意义的理论，看起来是完全不同。”

Griffiths 一直在使用神经网络来帮助改进他所在领域的现有理论，即人类决策。一个关于人们在涉及经济风险时如何做出决策的流行理论是前景理论，它由行为经济学家 Daniel Kahneman 和 Amos Tversky 在 1970 年代提出的（后来 Kahneman 获得了诺贝尔奖）。其核心理念是：人并非总是理性的。

图2 Daniel Kahneman，人类行为前景理论的创始人之一

在 2021 年 6 月的 Science 杂志上，Griffiths 的小组描述了他们如何在一个庞大的决策数据集上，训练一个神经网络模型，该数据集包含在 10,000 个有风险的选择场景中人们做出的决策，然后比较模型预测有关前景理论的进一步决策的准确度。他们发现前景理论做得很好，但是神经网络在突出理论失败的地方（即预测失败的地方）显示出它的价值（参见“数据实战派”报道：）。

Griffiths 认为，这些反例反映的信息量更大，因为它们揭示了现实生活中存在的更多复杂性。例如，正如前景理论所描述的那样，人类不断地根据传入的信息权衡概率。但是，当大脑要计算的竞争概率太多时，他们可能会转向不同的策略。例如，受经验法则的指导，股票经纪人的经验法则，可能与青少年比特币交易员的经验法则不同，因为它来自不同的经验。

“我们基本上是在使用机器学习系统，来识别那些观察与理论不一致的情况”，Griffiths 说。

数据集越大，人工智能学习的不一致就越多。最终得到的结果，不是传统意义上的关于人们如何做出决定的精确主张的理论，而是一组受某些约束的主张。

一种描绘它的方式可能是“如果...那么...”类型规则的分支树，这很难用数学来描述，更不用说用语言描述了。

可理解和预测性之间的权衡

人类也不是第一次面临这种局面了。

1980 年代，语音识别软件先驱 Frederick Jelinek 曾说说：每解雇一名团队中的语言学家，语音识别器的性能就能获得提高。

他的意思是，对理论的执着某种程度上阻碍了实践上的进步。

以预测而蛋白质结构的例子来说明。蛋白质的功能很大程度上取决于它的结构，因此，如果你想设计一种药物来阻断或增强给定蛋白质的作用，你需要了解它的结构。

AlphaFold 使用 X 射线晶体学等技术，对实验推导的结构进行了训练，目前它对于有一些实验数据的蛋白质的预测，比那些没有实验数据的蛋白质的预测更可靠。

欧洲生物信息学研究所 (EMBL-EBI) 前主任 Janet Thornton 说：”模型的可靠性是一直在提高的。缺少理论并不会阻止药物设计师使用它，这只会增进我们对生命和治疗的理解。”

图3 由 AlphaFold 程序模拟的蛋白质结构

同时，也有一部分人显然对这种科学发展方向不太满意。

例如，批评者指出，神经网络可能会产生虚假的相关性，尤其是在训练数据集很小的情况下。

而且所有数据集都是有偏见的，毕竟科学家们收集数据的方式不是均匀或中立的，而是始终考虑某些假设，这些假设对谷歌和亚马逊的人工智能造成了破坏性影响。

正如科学哲学家 Sabina Leonelli 解释的那样：“我们使用的数据环境非常扭曲。”

虽然这些问题确实存在，但计算神经科学家Dayan并不认为它们是不可克服的。

他指出，人类也有偏见，而且与人工智能不同，人类是以非常难以审视或纠正的方式。

AI 新科学面临的一个更大的障碍，可能是人类需要解释这个世界——用因果关系来讨论。

2019 年，西雅图华盛顿大学的神经科学家 Bingni Brunton 和 Michael Beyeler 写道:“这种对可解释性的需求，可能阻碍了科学家们对大脑产生新的见解，这种见解只能从大型数据集中出现”。

但他们对此也表示同情。他们说：“如果要将这些见解转化为药物和设备等有用的东西，计算模型必须产生对临床医生、最终用户和行业可解释和信任的洞察力。”

解决如何弥合可解释性差距的——可解释人工智能，已成为热门话题。但这种差距只会越来越大，我们可能会面临权衡取舍：愿意为可解释性放弃多少可预测性？

对 AI 驱动的科学，还有最后一个反对意见是，人们对旧理论方法仍有待发现，其中可能存在有用的地方（即从离散示例中提取的概括）。而且只有人类才能做到这一点，因为它需要直觉。

换句话说，它需要一种对一般规则相关的示例属性，进行本能的归纳总结。

牛顿厉害的一点，他为了提出牛顿第二定律，必须忽略一些数据。例如，他必须想象，事物在真空中下落，不受空气阻力的干扰。

上个月 Nature 发了一篇文章，德国数学家 Christian Stump 在文中表示，人类这种直觉行为是“发明/发现过程的核心”。但他写这篇文章的原因是，DeepMind 建立了一个机器学习程序，该程序帮助人类数学家从以往的数学中获得新的见解与概括。

因此，可以预见的是，2022 年，AI 会在各种科学过程中留下足迹。

我们越将它纳入人类对知识的追求，它就越会改变这种追求。

我们必须学会忍受这一点，并向自己保证这样一件事：人类仍然在问问题，正如 Pablo Picasso 在 1960 年代所说，“计算机是无用的。他们只能给人类答案。”

关于【数据实战派】

【学术头条】与【数据实战派】是我们科学+科技内容联合体的主要成员。

【数据实战派】致力于打造一个不用感叹号的新兴 AI 内容自媒体，围绕“计算+智能（computing+intelligence）”技术，力求从种种杂音和噪声中，压缩出更纯粹且重要的知识，助力中国 AI 开发者的高速成长。

目前，【数据实战派】由一批具有 AI/CS 专业背景的作者及资深科技编辑共同运营，并已聚拢一大批有着深度阅读习惯、优质内容品位的读者。我们期待有志之士的加入，共同打造高规格的 AI 技术社区。

点这里关注我👇记得标星~

热门视频推荐

更多精彩视频，欢迎关注学术头条视频号

winter

【学术头条】持续招募中，期待有志之士的加入

强势招募兼职作者！邀你书写前沿科技内容

2021-12-21

登录查看更多

相关内容

AlphaFold

关注 0

【干货书】概率，统计与数据，513页pdf

专知会员服务

140+阅读 · 2021年11月27日

【干货书】贝叶斯推理和机器学习，610页pdf

专知会员服务

259+阅读 · 2021年10月8日

神经网络如何推理？看这份IJCAI2021《神经机器翻推理：理论与应用》教程，附245页Slides

专知会员服务

53+阅读 · 2021年8月22日

【硬核书】量子信息理论，598页pdf

专知会员服务

128+阅读 · 2021年8月4日

MIT&Facebook新书《深度学习理论的原理》，449页pdf阐述理解神经网络的有效理论方法

专知会员服务

193+阅读 · 2021年6月20日

【干货书】计算机科学，647页pdf，Computer Science

专知会员服务

46+阅读 · 2021年5月10日

【斯坦福经典书】机器学习导论，188页pdf

专知会员服务

79+阅读 · 2021年3月31日

「因果性机器学习」书册，88页pdf概述机器学习中的因果推理

专知会员服务

312+阅读 · 2021年3月21日

【经典书】概率统计导论第五版，730页pdf

专知会员服务

249+阅读 · 2020年7月28日

《可解释的机器学习-interpretable-ml》238页pdf

专知会员服务

208+阅读 · 2020年2月24日

基础物理面临冲击：费米实验室W玻色子质量实验与理论矛盾，登《科学》封面

机器之心

0+阅读 · 2022年4月8日

AI 是否拥有意识？从意识的定义说起

学术头条

0+阅读 · 2022年3月19日

这些恶人辱骂Replika聊天机器人，会遭机器人报复吗？

新智元

1+阅读 · 2022年1月21日

AI 真的能够理解人类语言吗？

CSDN

1+阅读 · 2021年12月24日

当人类与「熵」对抗时，意识出现了！那AI呢？

新智元

0+阅读 · 2021年10月2日

「因果性机器学习」书册，88页pdf概述机器学习中的因果推理

专知

20+阅读 · 2021年3月21日

机器学习必备的数学基础有哪些？

人工智能头条

12+阅读 · 2019年10月18日

一文读懂机器学习中的贝叶斯统计学

数据分析

26+阅读 · 2019年5月8日

【机器学习】深入剖析机器学习中的统计思想

产业智能官

17+阅读 · 2019年1月24日

为什么 Python 更适合做 AI/机器学习？

计算机与网络安全

12+阅读 · 2018年3月18日

P3P问题解分布的临界曲面研究

国家自然科学基金

1+阅读 · 2015年12月31日

基于认知计算的大数据分析方法

国家自然科学基金

25+阅读 · 2014年12月31日

个性化模式下在线评论有用性形成机制研究

国家自然科学基金

2+阅读 · 2013年12月31日

关于大数据处理分布式学习算法的可行性理论研究

国家自然科学基金

3+阅读 · 2013年12月31日

神经网络随机学习算法的泛化性研究

国家自然科学基金

2+阅读 · 2013年12月31日

因果学习和推理的认知神经机制和心理病理学研究

国家自然科学基金

4+阅读 · 2013年12月31日

针对云计算环境的安全性分析方法

国家自然科学基金

0+阅读 · 2012年12月31日

基于用户评价准则的排序学习算法及理论研究

国家自然科学基金

0+阅读 · 2012年12月31日

LHC上中性规范玻色子反常耦合效应的研究

国家自然科学基金

0+阅读 · 2011年12月31日

谷氨酸系统基因多态性在海洛因依赖中的作用

国家自然科学基金

0+阅读 · 2011年12月31日

Interpretable machine learning in Physics

Arxiv

1+阅读 · 2022年4月20日

A tutorial for computer scientists on finite extensive games with perfect information

Arxiv

0+阅读 · 2022年4月19日

Estimation of smooth functionals in high-dimensional models: bootstrap chains and Gaussian approximation

Arxiv

0+阅读 · 2022年4月16日

Construction of a bi-infinite power free word with a given factor and a non-recurrent letter

Arxiv

0+阅读 · 2022年4月16日

A Theory of Consciousness from a Theoretical Computer Science Perspective: Insights from the Conscious Turing Machine

Arxiv

0+阅读 · 2022年4月15日

Contextualizing Artificially Intelligent Morality: A Meta-Ethnography of Top-Down, Bottom-Up, and Hybrid Models for Theoretical and Applied Ethics in Artificial Intelligence

Arxiv

0+阅读 · 2022年4月15日

Machine Learning: Algorithms, Models, and Applications

Arxiv

23+阅读 · 2022年1月6日

A Probabilistic Representation of DNNs: Bridging Mutual Information and Generalization

Arxiv

17+阅读 · 2021年6月18日

Machine Reasoning Explainability

Arxiv

14+阅读 · 2020年9月1日

Visual Interpretability for Deep Learning: a Survey

Arxiv

16+阅读 · 2018年2月7日

VIP会员