理解五个基本概念,让你更像机器学习专家

2018 年 11 月 29 日 云栖社区

摘要:这篇文章主要讲述了机器学习的相关内容,阐述了机器学习的主要意义和形成过程。区别了机器学习与AI、深度学习、神经网络等专业词汇。



大多数人可能对机器学习有点恐惧或困惑。 脑子中会有它到底是什么,它有什么发展方向,我现在可以通过它挣钱吗等等这样的问题。


这些问题的提出都是有依据的。事实上,你可能没有意识到自己其实多年来一直在训练机器学习模型。你看过苹果手机或者是Facebook上的照片吧? 你知道它如何向你展示一组面孔并要求你识别它们吗?其实,通过标记这些照片,你正在训练面部识别模型去识别新面孔。恭喜你,现在可以说你有训练机器学习模型的经验了!但在此之前,请阅读这些机器学习基础知识,以便你可以准确回答任何后续问题。


1)机器学习可以预测


如果你只是在图片中标记朋友的面孔,那就不是在用机器学习模型。如果你上传了一张新照片系统马上告诉你每个人是谁,那你就是应用了机器学习模型。机器学习的主要意义在于根据图案模型和经过训练的其他因素来预测事物。它可以预测任何事物,如要基于地理位置和卧室数量预测房价,基于一年中的时间和天气的变化预测航班是否会延误,依据图片中的人物特点进行人像识别等等。


2)机器学习需要训练


你必须告诉机器学习模型它试图预测的是什么。想想一个孩子是如何学习的,他们第一次看到香蕉,他们不知道它是什么。然后你告诉他们这是一个香蕉。下次他们看到另一个,他们会把它识别为香蕉,机器学习就是以类似的方式工作。你可以尽可能多地展示香蕉的照片,告诉它这是香蕉,然后用未经训练的香蕉图片进行测试。但这是一个过度的简化的方法,因为整个过程遗漏了告诉它什么不是香蕉的部分,除此之外还要给它展示不同种类不同颜色、不同角度的香蕉图片等等。


3)达到80%的准确度就可以认为是成功的


我们还没有达到通过机器学习平台识别图片中的香蕉达到100%的准确率技术的地步,但也没关系,事实证明,人类去识别也不是100%准确。业界的潜规则是达到80%准确度的模型就是成功的。大家可以思考一下,在你收藏的图片中正确识别800,000张是非常有用的,虽然可能还有错误的200,000张,但这已经节省了80%的时间。毋庸置疑,这是非常有价值的。假如我可以用它使你的生产力提高如此之多,你肯定会付我很多钱。而事实证明我可以用机器学习提高你的生产力。(2018年更新:80%规则改为90%规则。)


4)机器学习不同于AI,深度学习或神经网络


人们经常随意抛出以上这些术语,听起来像专家,但其中有很大差异。


AI-人工智能是指在完成特定任务时与人类一样好(或优于人类)的计算机。它也可以指一个可以根据大量输入做出决策的机器人,与终结者或C3PO不同。它是一个非常广泛的术语,不是很有特指性。


ML-机器学习是实现AI的一种方法。就是通过解析数据集对某事做出预测。ML平台可以通过许多不同的方式运行训练集来预测事物。


NL-神经网络是实现机器学习模型预测事物的方式之一。神经网络的工作有点像人的大脑,通过大量的训练来调整自己,以了解香蕉应该是什么样子。这个过程创建了非常深的节点层。


5)在AI变得有自我意识之前,我们还有很长的路要走


https://xkcd.com/1319/%29

   

我并不担心机器学习接管地球。主要是因为如果你曾构建过一个机器学习模型,就会明白它需要依赖你来告诉它究竟该做什么。即使你给出明确的指示,它通常也会出错。你必须对这些体系非常清晰明确,让它突然变化的可能性降到最低。即使是一个显示带有单词的框的简单网页,也需要你准确地告诉它该框出现的位置,形状,颜色,如何在不同的浏览器上工作,如何在不同的设备上正确显示等等。


本文由阿里云云栖社区组织翻译。

文章原标题《Understand these 5 basic concepts to sound like a machine learning expert》

作者:Aaron Edell  译者:么凹,审校:袁虎。



end

感谢孙权、欢迎行癫,阿里云在路上!

Java开发者福音,阿里巴巴宣布连任Java全球管理组织席位!

Python数据科学“冷门”库

模块化与解耦式开发在蚂蚁金服 mPaaS 深度实践探讨

更多精彩

登录查看更多
5

相关内容

“机器学习是近20多年兴起的一门多领域交叉学科,涉及概率论、统计学、逼近论、凸分析、算法复杂度理论等多门学科。机器学习理论主要是设计和分析一些让 可以自动“ 学习”的算法。机器学习算法是一类从数据中自动分析获得规律,并利用规律对未知数据进行预测的算法。因为学习算法中涉及了大量的统计学理论,机器学习与统计推断学联系尤为密切,也被称为统计学习理论。算法设计方面,机器学习理论关注可以实现的,行之有效的学习算法。很多 推论问题属于 无程序可循难度,所以部分的机器学习研究是开发容易处理的近似算法。” ——中文维基百科

知识荟萃

精品入门和进阶教程、论文和代码整理等

更多

查看相关VIP内容、论文、资讯等
【经典书】人工智能及机器学习导论,457页pdf
专知会员服务
160+阅读 · 2020年7月5日
【干货书】机器学习Python实战教程,366页pdf
专知会员服务
340+阅读 · 2020年3月17日
机器学习速查手册,135页pdf
专知会员服务
340+阅读 · 2020年3月15日
【经典书】精通机器学习特征工程,中文版,178页pdf
专知会员服务
356+阅读 · 2020年2月15日
【新书】Pro 机器学习算法Python实现,379页pdf
专知会员服务
199+阅读 · 2020年2月11日
【机器学习课程】Google机器学习速成课程
专知会员服务
164+阅读 · 2019年12月2日
干货 | 可解释的机器学习
AI科技评论
20+阅读 · 2019年7月3日
已删除
将门创投
6+阅读 · 2019年1月2日
机器学习不能做什么?
引力空间站
5+阅读 · 2018年3月28日
机器学习:从入门到绝不放弃!
图灵教育
5+阅读 · 2018年3月19日
【机器学习】机器学习和深度学习概念入门
产业智能官
11+阅读 · 2018年1月3日
【干货】机器学习和深度学习概念入门(下)
机器学习研究会
6+阅读 · 2017年12月31日
教程 | 理解XGBoost机器学习模型的决策过程
机器之心
6+阅读 · 2017年12月20日
干货 | 从零开始入门机器学习算法实践
雷锋网
9+阅读 · 2017年11月30日
Arxiv
17+阅读 · 2019年3月28日
Arxiv
19+阅读 · 2018年6月27日
VIP会员
相关VIP内容
【经典书】人工智能及机器学习导论,457页pdf
专知会员服务
160+阅读 · 2020年7月5日
【干货书】机器学习Python实战教程,366页pdf
专知会员服务
340+阅读 · 2020年3月17日
机器学习速查手册,135页pdf
专知会员服务
340+阅读 · 2020年3月15日
【经典书】精通机器学习特征工程,中文版,178页pdf
专知会员服务
356+阅读 · 2020年2月15日
【新书】Pro 机器学习算法Python实现,379页pdf
专知会员服务
199+阅读 · 2020年2月11日
【机器学习课程】Google机器学习速成课程
专知会员服务
164+阅读 · 2019年12月2日
相关资讯
干货 | 可解释的机器学习
AI科技评论
20+阅读 · 2019年7月3日
已删除
将门创投
6+阅读 · 2019年1月2日
机器学习不能做什么?
引力空间站
5+阅读 · 2018年3月28日
机器学习:从入门到绝不放弃!
图灵教育
5+阅读 · 2018年3月19日
【机器学习】机器学习和深度学习概念入门
产业智能官
11+阅读 · 2018年1月3日
【干货】机器学习和深度学习概念入门(下)
机器学习研究会
6+阅读 · 2017年12月31日
教程 | 理解XGBoost机器学习模型的决策过程
机器之心
6+阅读 · 2017年12月20日
干货 | 从零开始入门机器学习算法实践
雷锋网
9+阅读 · 2017年11月30日
Top
微信扫码咨询专知VIP会员