干货|史上最通俗易懂的人工智能概念解释-GASA大学

2017 年 9 月 16 日 机器人大讲堂


本文来源于微信公众号:笔记侠

微信ID:Notesman



我在百度就在讲这句话:“人工智能是新电能”。100年前,电能给每个企业带来新的改变。



当人工智能技术足够成熟之后,会给很多企业带来非常大的改变。今天我主要讲人工智能的趋势以及对大家会有什么影响。


一、supervised learning(监督学习)


AI,这个词对大多数人来说有一种魔术的感觉,但是它具体能做什么?


它的技术非常复杂,有很多部分,这两三年进步最快的一部分是 supervised learning(监督学习),也就是从a的input(输入)到b的output(输出),什么意思呢?用具体案例来说明下。

 

比如,你输入足够多的电影影评,然后可以大概知道一个电影是好是坏;


输入一种图片,然后可以知道图片的内容(图片识别);


输入一段语音,会输出一个文本(语音识别);


输入一段英文,会输出一段中文(自动翻译);


输入一段文本,会输出一段音频(语音输出);


输入一笔费用,会输出很好的回报(消费金融);


输入一段传感器信息,会输出一个汽车的位置(自动驾驶)。

 

AI技术有很多不同的部分,进步最快的就是这个部分,今天有很多空间使用新技术,给企业带来价值,比如语音识别对百度就非常有价值。


很多要做人工智能工作的企业需要理解你自己的生意,才能决定如何放入人工智能来创造价值。



不过这种技术有一个缺点,需要大量的数据,需要a,也需要b。

 

经常有人问我,AI可以做什么?我跟很多团队说,如果有哪个事情想一秒钟就成功搞定,那么就可以这个部分用AI创造价值。

 

为什么AI会突然在这几年进步这么快?


如果你的横轴是你的数据量(amount of data),纵轴是效率或准确度,当企业产生大量的数据,传统企业按照过去的算法无法提供数据的计算效果,但如果训练一个巨大的神经网络,效果会非常巨大。

 

如果你要达到最好的效果,有两个必要条件:


第一,要训练一个巨大的神经网络(NN);

第二,要有大数据。


今天很多企业有海量数据,但几年之前没有办法训练足够大的神经网络来实现计算。


今天,最好的人工智能团队都可以从算法(机器学习)和超级计算机架构入手。

 

supervised learning(监督学习)是人工智能的一部分,我做人工智能项目的时候,有时候也需要到Ai技术的不同部分。


 

为什么通常讲supervised learning(监督学习)和神经网络(NN)?

 

supervised learning(监督学习)和神经网络进步非常快,其他部分的进步没有这么快,只是慢慢增加,神经网络这两年有巨大的突破。


二、神经网络


中国今天对深度学习和神经网络有这么大的兴趣,我来分享下神经网络这个词具体是什么。神经网络,对于很多人也有魔术的感觉。我用具体的案例来说明。

 

如果你想预测一件房间的价值,横轴是大小,纵轴是价钱,那么输入房间大小,输出一个价格,这是一个最简单的神经网络。

 

在知道房间大小、睡房数量以及附近居住者的收入水平的前提下,如果买房子的人想知道房间可以住多少人,可以用一个神经元测算出来;也可以通过一个神经元测算是否需要驾车;还可以通过一个神经元测算附近学校的质量。


最后把这些神经元汇合到一起,再通过另外一个神经元输出房子的价钱,这就是神经网络。


 

最后分享一个细节来了解神经网络的重要性:


如果输入房子的特征(a)和价钱(b),而且有大量的数据(a),它就可以自动学习这中间有什么概念,不用去考虑和担心这些神经元。


 △  GASA大学,地球上最酷的大学


今天很多人工智能的企业都是开源的,技术本身不能作为壁垒。


要理解另外一个公司的技术并不太难。我在百度和谷歌工作过,对技术比较了解,知道技术是怎么做的,但是如果我没有数据,我就没办法带一个团队做搜索。


三、人工智能公司的战略逻辑:数据-产品-用户(Data - product - user)


如果你可以拿到一点点数据,你就可以通过神经网络来做一个产品。


通常一个产品不用做得太好,只要用户能够接受,用户慢慢会有活跃度,用户就会为你产生数据,然后形成正循环,形成壁垒。

 

如果你有一个用户可以接受的产品,却又被巨头用另外一个产品挖走,那么你的数据就没有办法形成正循环。



人工智能获取的战略已经越来越复杂,人工智能团队要想清楚信息获取的战略。

 

1.什么是互联网公司?

 

如果你要为一个传统的购物中心做一个网站或者app,它们还不是一个互联网公司。就像沃尔玛网站,也不是一家互联网公司。

 

你要做一个互联网公司,不在于是不是有网站,最重要的是整个公司的组织是否具有有效利用互联网的能力。

 

互联网公司会做A/B测试,每天可以做一千次A/B测试,所以互联网公司的学习速度会非常快。

 

2.什么是人工智能公司?

 

在人工智能时代,一个传统的互联网公司+神经网络技术,也还不是人工智能公司。

 

一个公司要做成人工智能公司,要组织整个公司有效地使用人工智能的能力。AI现在还处于早期,人们还不能完全理解如何组织公司来使用它。

 

AI公司获取数据的战略非常复杂,有关战略,我们有时候会讨论好几天或好几星期。数据获取的过程要好几年,真的要一步一步来打。


 

最好的人工智能公司都会把数据放在一个数据库里。


如果你的数据一部分在你个人电脑上,一部分在你办公室电脑上,一部分在某一个数据库里,一部分在另外一个数据库,你的工程师要做一个新的人工智能的话,如何把这些数据放一起给人工智能使用呢?

 

但如果你把数据放进一个数据库,你的软件或者工程师就可以利用完整的数据来训练有效的人工智能。

 

很多公司有很多数据,但是没有办法放在一起,数据的使用效率就会没那么高,你的工程师的工作效率就会慢很多。

 

在人工智能公司工作的工程师,和传统互联网公司的工程师,工作描述的内容是不一样的。如果你是百度公司的产品经理,你要做一个产品,就会画一个图,然后把图给工程师,工程师再写代码,这样的方式对互联网公司是非常有效的。

 

但如果你要做一辆自动驾驶汽车,产品经理画一张汽车图,是没有用的。在人工智能时代,产品经理也需要理解怎样获取数据;也要理解怎么和工程师沟通。


四、使用AI的挑战


AI技术发展这么快,但是理解的人比较少。有效地使用AI来创造价值,就要跨行业,让企业家和专家一起结合合作。

 

因此,从CEO角度,你怎么安排有AI技能的人的工作呢?

 

很多公司的架构是由CEO和不同的事业部组成,那么你怎样通过AI改变他们的工作呢?

 

比如其中一个事业部是做礼品卡的,那么是否可以通过AI改变售卖礼品卡的工作呢?但礼品卡的leader不懂AI,所以它内部很难建成一个AI团队。



我经常对很多公司说,如果能够找到一个独立的AI团队,就把这些有AI能力的人放到不同的团队矩阵去。

 

不是每个人都要懂AI,也不是每个CEO都要懂AI,但如果可以找人来帮你建立AI团队,可以让你的团队利用AI拥有不错的机会。

 

我在谷歌带谷歌大脑团队的时候,做的第一个事情就是给几百个工程师提供人工智能课程。今天CEO的工作可以从外面选择内容课程,或者找专家和人才来教育你的团队。

 

AI的成熟速度比较慢,很多企业都有很多机会用AI去改变自己的企业。正如过去,大公司都没有看到Uber和Airbnb的机会;在中国,大公司也没有想到滴滴会做到这样子。


谢谢大家!

源:笔记侠




推荐阅读

往期回顾|001讲王田苗—国内外机器人发展热点与趋势

往期回顾|002讲新松总裁曲道奎--机器人发展的临界点

往期回顾|003讲中民国际资本执行董事刘国清-数字化工厂与人工智能

往期回顾|004讲赵胜--全球视野下的工业4.0和机器人

往期回顾|005讲甘中学——从智能工业机器人到智慧工业机器人

往期回顾|006讲长江学者王树新——微创手术机器人技术创新与产业发展

往期回顾|007讲哈工大教授杜志江——国产手术机器人的研究体会

往期回顾|008讲80后博导齐俊桐--无人机智能控制前沿技术

重磅|清华大学教授攻克机器人最后1cm防线

一堂课下潜深海7000米!揭秘罕见黑暗生物链+蛟龙号“龙脑”

投资蓝海+国防重任!上海大学精海系列无人艇突破多项关键技术填补中国空白

无人机也有"大小脑"?湖南卫视偶像级80后科学家分享多项首创突破性技术

温馨提示

意向合作,文章转载, 均可联系堂博士电话:13810423387(同微信)。

以上需求均可联系微信:35735796。




登录查看更多
3

相关内容

监督学习是指:利用一组已知类别的样本调整分类器的参数,使其达到所要求性能的过程,也称为监督训练或有教师学习。 监督学习是从标记的训练数据来推断一个功能的机器学习任务。训练数据包括一套训练示例。在监督学习中,每个实例都是由一个输入对象(通常为矢量)和一个期望的输出值(也称为监督信号)组成。监督学习算法是分析该训练数据,并产生一个推断的功能,其可以用于映射出新的实例。一个最佳的方案将允许该算法来正确地决定那些看不见的实例的类标签。这就要求学习算法是在一种“合理”的方式从一种从训练数据到看不见的情况下形成。
【2020新书】实战R语言4,323页pdf
专知会员服务
100+阅读 · 2020年7月1日
《人工智能2020:落地挑战与应对 》56页pdf
专知会员服务
195+阅读 · 2020年3月8日
【新书】傻瓜式入门深度学习,371页pdf
专知会员服务
187+阅读 · 2019年12月28日
干货 | 可解释的机器学习
AI科技评论
20+阅读 · 2019年7月3日
深入卷积神经网络背后的数学原理
人工智能学家
10+阅读 · 2019年4月26日
语音识别中的CTC算法的基本原理解释
数盟
4+阅读 · 2018年6月24日
终于有人把云计算、大数据和人工智能讲明白了
Python开发者
3+阅读 · 2018年6月13日
解读吴恩达新书的全球第一帖 (上)
平均机器
5+阅读 · 2018年4月26日
终于有人把云计算、大数据和人工智能讲明白了!
大数据技术
7+阅读 · 2018年4月2日
【干货】一文读懂什么是变分自编码器
专知
12+阅读 · 2018年2月11日
【干货】机器学习和深度学习概念入门(下)
机器学习研究会
6+阅读 · 2017年12月31日
干货|通俗易懂地解释EM算法并举例说明?
机器学习研究会
12+阅读 · 2017年11月17日
【人工智能】史上最通俗易懂的人工智能概念解释
产业智能官
3+阅读 · 2017年9月14日
Generative Adversarial Networks: A Survey and Taxonomy
Interpretable Adversarial Training for Text
Arxiv
5+阅读 · 2019年5月30日
Arxiv
10+阅读 · 2018年3月23日
Arxiv
9+阅读 · 2018年1月4日
VIP会员
相关VIP内容
相关资讯
干货 | 可解释的机器学习
AI科技评论
20+阅读 · 2019年7月3日
深入卷积神经网络背后的数学原理
人工智能学家
10+阅读 · 2019年4月26日
语音识别中的CTC算法的基本原理解释
数盟
4+阅读 · 2018年6月24日
终于有人把云计算、大数据和人工智能讲明白了
Python开发者
3+阅读 · 2018年6月13日
解读吴恩达新书的全球第一帖 (上)
平均机器
5+阅读 · 2018年4月26日
终于有人把云计算、大数据和人工智能讲明白了!
大数据技术
7+阅读 · 2018年4月2日
【干货】一文读懂什么是变分自编码器
专知
12+阅读 · 2018年2月11日
【干货】机器学习和深度学习概念入门(下)
机器学习研究会
6+阅读 · 2017年12月31日
干货|通俗易懂地解释EM算法并举例说明?
机器学习研究会
12+阅读 · 2017年11月17日
【人工智能】史上最通俗易懂的人工智能概念解释
产业智能官
3+阅读 · 2017年9月14日
Top
微信扫码咨询专知VIP会员