机器学习技术,正在占领科学界,成为核心研究方法。
但在这股浪潮背后,有成千上万的科学家,正在用它来产生误导性的结果。
这一结论,来自休斯顿莱斯大学的副教授Genevera Allen。
她说,科学家们大量使用机器学习系统,导致了一场“科学危机”。科学家们如果不改进技术,将会浪费大量的时间和金钱。
最直接的问题,在于机器学习软件识别的模式,只存在于数据集中,而不是面向真实的世界。
如果没有人使用不同的数据集去复现模型,很难发现使用机器学习技术得出的结论是错误的。
随着机器学习在科学研究中应用愈加广泛,相关的研究越来越难以复现。一项分析表明,世界上85%的生物医学研究都是白费力气。
其次,机器学习系统和大数据集的使用加速了科学危机。这场危机已经持续了20年,根本原因在于,研究的实验设计不够好,无法确保科学家们不会自欺欺人。
最后,回到机器学习本身上,机器学习是专门为在数据集中发现有趣的东西而开发的。不管数据怎样,只要应用到数据中,就会发现相应的模式,具体模式怎样,也无法保证。
为了解决这个问题,她正在和研究团队开发下一代机器学习和统计技术,这种技术不仅可以分析大量数据,找出结果,还可以给出结果的不确定性以及复现的可能性。
Allen在美国科学促进会(AAAS)年会上发表了自己的观点,BBC报道之后,在AI圈引发了广泛的讨论。
Facebook的机器学习科学家Edward Grefenstette评论称,这篇文章的确反映了机器学习存在的问题。因为对机器学习的炒作和大肆宣传,使用机器学习做研究的科学家,都只是关注研究中使用了机器学习技术,反而不太关注科学研究应有的标准了。
也有人指出,机器学习与科学研究相反,是基于数据发现模型,而不是基于模型,寻找数据去否定或验证模型,很容易理解它为什么会导致不可复现的模型出现。
这些观点虽然有不少人赞同,但隔空之间,也有不少反对之声。不少人认为,这个锅不应该由机器学习来背。
前谷歌大脑员工研究员Denny Britz说,这不是机器学习的问题,而是使用机器学习的人的问题。
另外一种说法是,科学研究难复现,这是一个长期以来一直存在的问题,机器学习不应该背锅。
对于这件事,你怎么看?欢迎在留言区与我们互动。
原文链接:
https://www.bbc.com/news/amp/science-environment-47267081
作者系网易新闻·网易号“各有态度”签约作者
— 完 —
加入社群
量子位现开放「AI+行业」社群,面向AI行业相关从业者,技术、产品等人员,根据所在行业可选择相应行业社群,在量子位公众号(QbitAI)对话界面回复关键词“行业群”,获取入群方式。行业群会有审核,敬请谅解。
此外,量子位AI社群正在招募,欢迎对AI感兴趣的同学,在量子位公众号(QbitAI)对话界面回复关键字“交流群”,获取入群方式。
诚挚招聘
量子位正在招募编辑/记者,工作地点在北京中关村。期待有才气、有热情的同学加入我们!相关细节,请在量子位公众号(QbitAI)对话界面,回复“招聘”两个字。
量子位 QbitAI · 头条号签约作者
վ'ᴗ' ի 追踪AI技术和产品新动态
喜欢就点「好看」吧 !