会员服务 ·

机器学习有毒！被指让科学家更自欺欺人，给科学界带来危机

2019 年 2 月 19 日 量子位

乾明编译自 BBC
量子位报道 | 公众号 QbitAI

机器学习技术，正在占领科学界，成为核心研究方法。

但在这股浪潮背后，有成千上万的科学家，正在用它来产生误导性的结果。

这一结论，来自休斯顿莱斯大学的副教授Genevera Allen。

她说，科学家们大量使用机器学习系统，导致了一场“科学危机”。科学家们如果不改进技术，将会浪费大量的时间和金钱。

科学研究危机

最直接的问题，在于机器学习软件识别的模式，只存在于数据集中，而不是面向真实的世界。

如果没有人使用不同的数据集去复现模型，很难发现使用机器学习技术得出的结论是错误的。

随着机器学习在科学研究中应用愈加广泛，相关的研究越来越难以复现。一项分析表明，世界上85%的生物医学研究都是白费力气。

其次，机器学习系统和大数据集的使用加速了科学危机。这场危机已经持续了20年，根本原因在于，研究的实验设计不够好，无法确保科学家们不会自欺欺人。

最后，回到机器学习本身上，机器学习是专门为在数据集中发现有趣的东西而开发的。不管数据怎样，只要应用到数据中，就会发现相应的模式，具体模式怎样，也无法保证。

为了解决这个问题，她正在和研究团队开发下一代机器学习和统计技术，这种技术不仅可以分析大量数据，找出结果，还可以给出结果的不确定性以及复现的可能性。

锅该由机器学习背吗？

Allen在美国科学促进会（AAAS）年会上发表了自己的观点，BBC报道之后，在AI圈引发了广泛的讨论。

Facebook的机器学习科学家Edward Grefenstette评论称，这篇文章的确反映了机器学习存在的问题。因为对机器学习的炒作和大肆宣传，使用机器学习做研究的科学家，都只是关注研究中使用了机器学习技术，反而不太关注科学研究应有的标准了。

也有人指出，机器学习与科学研究相反，是基于数据发现模型，而不是基于模型，寻找数据去否定或验证模型，很容易理解它为什么会导致不可复现的模型出现。

这些观点虽然有不少人赞同，但隔空之间，也有不少反对之声。不少人认为，这个锅不应该由机器学习来背。

前谷歌大脑员工研究员Denny Britz说，这不是机器学习的问题，而是使用机器学习的人的问题。

另外一种说法是，科学研究难复现，这是一个长期以来一直存在的问题，机器学习不应该背锅。

对于这件事，你怎么看？欢迎在留言区与我们互动。

原文链接：
https://www.bbc.com/news/amp/science-environment-47267081

作者系网易新闻·网易号“各有态度”签约作者

— 完 —

加入社群

量子位现开放「AI+行业」社群，面向AI行业相关从业者，技术、产品等人员，根据所在行业可选择相应行业社群，在量子位公众号（QbitAI）对话界面回复关键词“行业群”，获取入群方式。行业群会有审核，敬请谅解。

此外，量子位AI社群正在招募，欢迎对AI感兴趣的同学，在量子位公众号（QbitAI）对话界面回复关键字“交流群”，获取入群方式。

诚挚招聘

量子位正在招募编辑/记者，工作地点在北京中关村。期待有才气、有热情的同学加入我们！相关细节，请在量子位公众号(QbitAI)对话界面，回复“招聘”两个字。

量子位 QbitAI · 头条号签约作者

վ'ᴗ' ի 追踪AI技术和产品新动态

喜欢就点「好看」吧 !

登录查看更多

知识荟萃

精品入门和进阶教程、论文和代码整理等

查看相关VIP内容、论文、资讯等

《为读博入坑开个好头》节省时间、减轻压力、稳步前进

专知会员服务

61+阅读 · 2020年7月1日

如何写论文？这份《科研论文撰写策略》看下

专知会员服务

147+阅读 · 2020年6月15日

【哈佛大学】机器学习的黑盒解释性，52页ppt

专知会员服务

172+阅读 · 2020年5月27日

【微众银行】联邦学习白皮书_v2.0，48页pdf，

专知会员服务

170+阅读 · 2020年4月26日

【中国人民大学】机器学习的隐私保护研究综述

专知会员服务

133+阅读 · 2020年3月25日

【干货书】深度学习生命科学：基因组学、药物发现，238页pdf

专知会员服务

200+阅读 · 2020年3月18日

纽约大学AI Now研究所发布《AI Now 2019 年度人工智能报告》, 100页pdf

专知会员服务

36+阅读 · 2019年12月18日

【KDD2019|讲座推荐】时空事件预测与前兆识别：Spatio-temporal event forecasting and precursor identification

专知会员服务

45+阅读 · 2019年12月6日

【机器学习课程】Google机器学习速成课程

专知会员服务

169+阅读 · 2019年12月2日

【MLA 2019】在微软小冰做好玩儿的研究，微软小冰首席科学家宋睿华

专知会员服务

22+阅读 · 2019年11月6日

面对无处不在的黑客威胁，如何保护智能设备免受攻击？

AI前线

21+阅读 · 2019年10月28日

干货 | 可解释的机器学习

AI科技评论

20+阅读 · 2019年7月3日

AI 最大的挑战：也许我们从根上就错了

InfoQ

5+阅读 · 2019年6月14日

薛定谔的猫终于有救了：Nature 研究首次观测到量子跃迁过程

科研圈

6+阅读 · 2019年6月11日

名校CS硕士申机器学习PhD三波“全拒得”，这么多人和他同病相怜？

量子位

8+阅读 · 2019年3月1日

人工智能能够预测地震吗？

人工智能学家

7+阅读 · 2018年12月10日

不！机器学习不是美化后的统计学

论智

4+阅读 · 2018年7月13日

小扎自己都被卖了！？Facebook国会听证会结束，危机也随风而去？

DeepTech深科技

3+阅读 · 2018年4月11日

徐小平：区块链革命到来，这是一场顺我者昌，逆我者亡的伟大技术革命

云头条

4+阅读 · 2018年1月9日

国家终于出手了！因为低俗，今日头条遭遇史上最大危机！

创业财经汇

3+阅读 · 2017年12月30日

Knowledge Graphs

Arxiv

102+阅读 · 2020年3月4日

Mining Disinformation and Fake News: Concepts, Methods, and Recent Advancements

Arxiv

16+阅读 · 2020年1月2日

Investigating the Successes and Failures of BERT for Passage Re-Ranking

Arxiv

3+阅读 · 2019年5月5日

Factor Graph Attention

Arxiv

6+阅读 · 2019年4月11日

Commonsense Reasoning for Natural Language Understanding: A Survey of Benchmarks, Resources, and Approaches

Arxiv

16+阅读 · 2019年4月2日

A Survey of Learning Causality with Data: Problems and Methods

Arxiv

19+阅读 · 2018年9月25日

A Benchmark Study on Sentiment Analysis for Software Engineering Research

Arxiv

3+阅读 · 2018年3月17日

VizWiz Grand Challenge: Answering Visual Questions from Blind People

Arxiv

9+阅读 · 2018年2月22日

Comparative Study of ECO and CFNet Trackers in Noisy Environment

Arxiv

5+阅读 · 2018年1月29日

Big Data: Understanding Big Data

Arxiv

6+阅读 · 2016年1月15日

VIP会员

机器学习有毒！被指让科学家更自欺欺人，给科学界带来危机

乾明 编译自 BBC 量子位 报道 | 公众号 QbitAI

科学研究危机

锅该由机器学习背吗？

相关内容

知识荟萃

更多

乾明编译自 BBC
量子位报道 | 公众号 QbitAI