【人工智能】AI如何解决商业难题

2017 年 7 月 26 日 产业智能官

第四范式陈雨强:利用高维度AI解决商业难题

本文转载自雷锋网

4月21日,中国证券投资基金业协会主办的2017金融科技高峰论坛在杭州召开。“人工智能赢在维度。”第四范式联合创始人、首席研究科学家陈雨强在会议上讲到,“将来的企业运营中需要有更高的维度,维度的上升使得AI能力提升,从而帮助企业解决更为复杂的问题,提升企业效率,进而提升企业竞争力,吸引更多客户,提供更好服务。”

陈雨强曾在百度凤巢主持架构了世界上第一个商用的深度学习系统,在今日头条主持设计了中国用户量最多的新媒体人工智能推荐系统。

那么,什么是更高的维度?企业如何提升运营效率?如何用人工智能解决更复杂的问题呢?

人工智能赢在维度

亚马逊是北美最大的在线零售商,沃尔玛是世界上最大的连锁超市。最近几年,亚马逊增长良好,增长率高达50%-60%,最低也在10%左右,而沃尔玛增长一直处于停滞的状态,有时甚至是负增长。那么两者为何有这么大的差别呢?

客户端复杂度

沃尔玛是一个超市,属于人力密集型,全球大概有十多万的员工,亚马逊则偏技术密集型。亚马逊员工人均年收益是62.1万美元,而沃尔玛员工的人均年收益只有22万美元,相差了3倍,这代表两者效率的差别。在这种情况下,亚马逊增长速率会越来越快,越来越多地蚕食沃尔玛市场份额。那是否说明沃尔玛是一个菜鸟的公司或在互联网时代不堪一击呢?

其实并不是。从某种角落讲,沃尔玛是数据挖掘的先驱,早在20年前,沃尔玛就有数据挖掘方面的探索和研究,啤酒和尿布的例子就是典型代表。

那沃尔玛为什么在互联网时落后了呢?我们发现沃尔玛是基于地点推荐(Location Based)的,亚马逊则是基于用户推荐的(User Based)的,后者需要做到千人千面,每个人在亚马逊上看到的首页、搜索页、推荐页都是不同的,这种不同导致两者员工的人均年收益相差了3倍。亚马逊解决了一个更复杂的问题,所以增长率和市值都有较大提升。沃尔玛是曾经零售行业的老大,但在2014年-2015年间,亚马逊以指数性上升的速度超过了沃尔玛,成为了世界第一。

库存管理复杂度

不仅如此,亚马逊和沃尔玛的商场或者库存管理也存在着很大的问题复杂度差别。

亚马逊做了一个KIVA机器人,它可以自动运送货架到捡货员面前,捡货员把需要打包的货物挑出来打包即可。而沃尔玛则是N个配货员配一种货架。两者的问题复杂度相差也很大。

运营效率

如今,运营效率变得越来越重要。在传统行业,跑马圈地是重中之重,这对于互联网时代也是一样的。对于一些传统行业来说,移动互联网和互联网只是增加了一种新渠道,但还是以跑马圈地方式做事。以这种方式行事时,只需把产品做到60分,满足客户的基本需求即可,之后便尽最大可能获取最大的市场,获取市场和市场增长带来的红利。但随着市场愈加饱和,跑马圈地的模式逐渐失效。比如零售业的整体增长空间已经非常小了,剩下的无非就是你争我夺的过程。这时,如果谁从60分做到了80分,那就能将其它公司的客户转变成自己的客户。所以未来,运营效率代表着企业的核心竞争力。

总而言之,未来企业运营效率将会变得至关重要。我们可以通过解决更复杂的问题提升运营效率,而在解决复杂问题时,人工智能就需要粉墨登场。

人工智能如何影响企业效率

人工智能没有那么复杂,其实就是用数据解决问题。在数据方面,传统方法首先做的事情是分析数据。数据按照“二八原则”分布,大部分集中在头部。传统的分析方法会首先把尾部数据全部去掉,因为尾部的数据太多、而且杂乱,用传统的规则没有办法分析,而对于头部数据,会用十几~几十个特征或规则进行刻划。

这样的人工智能问题有什么问题呢?数据的价值并没有被完全发挥出来。

以证券公司为例,10万客户和1个亿客户的证券公司,如果只用头部的客户数据特征的话,两家公司对客户数据分析得出的结论没有区别,无非是什么年龄、什么性别、什么学历的人会喜欢什么样的产品等特征。但如果能用到更多特征、分析更细分群体的话,两者的结论将会有很大区别。1个亿客户的基金公司可能会发现一个100人的群体,他们的特征、喜好一致,那么公司就能基于此进行精准营销。而这100客户在只有10万用户的基金公司对应的可能之后1~2人,不能得到可信的结论。

只有用上所有的数据,并且分析得尽可能精细,数据量才能成为壁垒,量大的数据产生的价值才能比量少数据更大。

我曾经在今日头条、百度蜂巢工作过。当时,今日头条日活是几千万,特征总量大概有几十亿到几百亿,这意味着每个用户都有上百个标签,公司就能能精确区分一个用户在周二早上上班路上喜欢看什么新闻,或周五晚上下班后在家里夜深人静时喜欢看什么等,所以推荐效果可以做得非常精细。百度的搜索广告也是类似的,我们对一个什么样的人在什么搜索关键词下会看什么广告的组合有非常精细的刻画,每天上新的广告有上千万,日活上千万,在这样复杂的场景下用机器刻画,会有大量的特征量、规则量。

高维度对商业的影响

2012年,Facebook上市,但上市后四个月,它的股价就连续暴跌。我们当时和Facebook从市广告技术同事聊天,发现那时Facebook只用了大概2000维的特征刻画用户,但这完全不能够非常精细的、非常准确地预测一个人点击广告的概率,或在什么场景上会想要买什么东西。

2013、2014年时,一大批Google的广告、算法工程师加盟Facebook从事广告业务,他们把当时2千维系统做到2千亿维,相当于提升了1亿倍的维度。从2013年末到2014年始,Facebook的股价一路攀升,走上了传奇之路,维度对于整个Facebook收入提升至关重要。

在全国性商业银行的信用卡中心,每天有大概上百万笔的交易,这些交易过了风控之后,由银行来决定能不能让某个人交易分期。对于能交易分期的人,比如每天有一百万个,可以通过短信方式营销。但如何锁定这群人呢?

首先把分期进行目标拆解,把用户收入拆解成短信发送量×短信响应率×分期费率。通过短信发送历史,就能知道每个用户到底最终是否办理了交易分期,并基于此建立预测模型。这样在发送短信之前,就知道某个用户接收之前的概率高低,并进一步优化响应率。这种数据量并不大,但在当时银行里也算是最大的人工智能数据。当时用到2T数据,大概有4千万左右的历史发送的短信量,我们在其中抽取了很多特征,包括短信的信息、帐户的信息、持卡人、卡片、交易的信息等,共有5千万维信息,并且,最终响应率提升68%的和收入提升61%。

传统模型和AI模型的区别

传统模型和AI模型之前存在一些本质的区别。

维度是最大的区别。拿汽车分期问题为例,我们发现某个POS机进行汽车分期的概率会特别大,这个POS来源于一个小型母婴店, 这对于专家来说并不是特别复杂的问题。但问题在于这个母婴店很小,日流量是100、200规模,全国这样的母婴店有几千上万家,专家不可能逐家分析这样的母婴店,但机器可以,这正是机器的优势。只要我们能把问题变得足够复杂,机器就能分析每个维度。

另一方面是迭代自学习。传统专家规则是事先确定的,可能每隔一段时间,比如半年、一年进行一次规则调整。但改变很难,一方面成本高;另一方面,调整要求兼容原来的规则,同时加入新的规则,这是一件很艺术的事情。但对于机器学习、人工智能模型来说,在高维下加入新的特征、新的规则是非常容易的。正如AlphaGo每下一次棋,都会把棋谱拿回来复盘,使自己下棋的能力变得更高。

另外,电商推荐、智能理财、差异化定价、信贷、阅读、智能客服、个性化定制产品等都能用到人工智能。所以人工智能的价值是非常大的,想象的空间也是非常大的。将来问题的解决需要很高的维度,同时用复杂的模型,用高维的模型解决高维的问题。这个理论是有科学依据的。

Vapnik和Chervonenkis两位科学家提出了“VC”理论,来描述模型里函数复杂度的问题。函数复杂度可以类比为人脑神经元的个数,如果有更高的“VC”维,有更高函数能力,类比为有更多神经元,即为更强的智能能力。比如说人脑脑细胞数量比小白鼠脑内数量要多很多,所以说人比小白鼠聪明很多。所以说在将来复杂情况下,我们要不断的提升“VC”维,让企业运营的效率得到不断的提升。

最近深度学习在图像上的发展日新月异,从2010年到2016年,图象识别错误率在不断降低。2016年错误率已经达到了3.1%,而人做同样图片识别错误率是5%。也就是说,2016年之后,对于标准的数据库图片,计算机识别的能力比人要高。在这样的成绩背后,从2010年到2015年,图像识别维度从最开始几十万维,一直升到上亿维,更高的维度让整个效果有很大的提升。

总而言之,在将来的企业运营中需要有更高的维度,VC维的上升使得AI能力提升,从而使得企业能解决更复杂的问题,提升企业效率,进而提升企业竞争力,抢到更多的客户,提供更好服务。

人工智能赢在维度

基于此,让人工智能落地有五大要素。第一要有明确的业务定义;第二需要不断的外部反馈,比如AlphaGo需要不断与人下棋,需要外部反馈不断输入;第三需要很强的外部资源;第四需要顶尖的数据科学家;第五需要大数据,大数据加上机器学习等于人工智能。


企业构建商业AI能力须五大核心要素

【2017年5月27日,北京】本报讯,由机器之心主办的全球机器智能峰会(GMIS 2017)在北京正式启幕。第四范式创始人、首席执行官戴文渊,LSTM之父Jurgen Schmidhuber,前微软人工智能首席科学家邓力,今日头条副总裁马维英等人工智能领袖受邀出席了开幕当天的主论坛、并发表主题演讲。作为人工智能工业应用的代表,戴文渊在此次大会上针对人工智能如何在工业界应用进行了关键性说明。

戴文渊认为,尽管组织核心的竞争模式已经从流量为王的互联网模式升级到了生产、运营效率贡献模式,舆论集体投奔人工智能,但人工智能目前尚未在工业界全面落地。这是因为企业构建商用人工智能须五大核心要素,即Big data(大数据)、Response(持续的反馈)、Algorithm(算法)、Infrastructure(计算资源)和Needs(明确的需求),他将其概括为“BRAIN”。戴文渊建议企业采取“专业化分工+专注核心环节”的方式,充分借力人工智能平台,关注数据本身及业务需求,更加高效通过智能决策引擎让数据发挥价值。

Big Data——有意义的过程数据

大数据是人工智能存在的基石。多来源、多类型的大数据可以从不同角度进行逼近真实的描述,而利用算法可以挖掘数据之间的多层次关联关系。针对数据,戴文渊提出真正能够产生人工智能的是过程数据(同“用户行为数据”)。

戴文渊提到,过去的互联网红利期虽然行业中有海量数据涌入,但大量的数据没有标注和明确的定义,数据清洗及标签化难度相当高。他举例到,“统计局公布的各地区PM2.5统计数据并不能让我们产生预测PM2.5的能力,人工智能需要基于具体行为来掌握情况、学会技能。例如近期较受关注的智能投顾(Robo-Advisor),就是让机器先学习投资经理们是如何进行投顾的行为数据,才能利用机器进行智能投顾。”

立足于行业应用视角,戴文渊指出,按照当下技术发展,一个优秀的人工智能模型需要一千万以上的数据样本。因此,在数据方面,企业需加强对用户每一个行为及其结果的记录意识。以在线广告为例,用户的搜索行为、广告内容及用户是否有点击行为等,都需要加以记录,最终形成渗透至每一个场景、每一台设备和每一种服务里的数据采集机制。

Response——数字化的持续反馈

用户行为数据是机器学习的基础,如果想让机器学到最新的、即时的用户行为,戴文渊认为,能够形成持续的反馈闭环的人工智能系统是机器智能提升的前提。机器需要通过正、负反馈来不断学习、不断进步。以AlphaGo为例,AlphaGo的自我博弈就是不断收集落棋结果的反馈,然后不断地更新自己的策略,经过无数次博弈与反馈,输出一个最优的行为策略。戴文渊表示,当下越来越多的新闻聚合平台开始转型为基于人工智能技术的个性化推荐平台,这在过去数据不足的情况下是很难实现的,本质上是因为当前各新闻平台都开始记录并积累用户日志,让机器能够不断地学习如点击、阅读时长、转发、收藏、投诉等反馈数据。

此外,机器能够容易理解的反馈数据需要符合被标记标签的性质,Facebook上的“like”和“dislike”就是一种数字化的标记反馈。对此,戴文渊建议企业应该建立数字化、不间断的反馈数据闭环,将实时数据进行反馈,使模型具备自我进化能力。以第四范式“银行交易实时反欺诈解决方案”为例,新的数据、新的欺诈场景实时反馈给系统,与此同时,对数据进行“欺诈交易”或是“正常交易”的标注,再用标注过的数据继续模型的训练,让机器具备“火眼金睛”。

Algorithm——高维度的算法能力

算法是人工智能决定效率提升的关键因素。戴文渊指出,人工智能技术的优势包含超越人类想象的特征变量组合方式,能够做到“千人千面”甚至“千人万面”,大量无法统计的规则会被机器自主发现和抓取,从而充分挖掘“长尾用户”的行为规律,提高机器学习模型预测的精准度。这就需要超高维度的算法。

超高维度的算法,首先须要原始数据的绝对值很大,这对于大数据的分布式存储、处理技术具有较高要求。其次,利用万亿级的海量特征进行机器学习特征处理、模型训练以及线上服务,需要成千上万个节点进行协同工作,这对算法及系统的要求是全方位的——从异步分布式的计算模式,到高性能的网络,再到海量的内存存储等都有极高的要求。对此,戴文渊提到去年7月,第四范式发布了新一代机器学习模型——DSN(Deep Sparse Network,同“深度稀疏网络”),该算法底层是上千亿大小的宽度网络,其基本理念是随着数据量增大,模型的维度会随之升高大,从而保证“机器的智力”保持高水准。

Infrastructure——高性能的计算能力

高性能、大规模的计算资源是人工智能技术在实际应用中的必备条件。在人工智能实际的业务场景中,动辄数十亿级别的数据,会给计算框架带来严峻的考验。“企业搭建人工智能系统,首先遇到的瓶颈几乎都是数据处理能力的不足。因为对于一般的机器学习团队来说,具备处理几十万规模数据量的运算能力。如果数据规模超过十亿,那么即便运行简单的逻辑回归模型,也会变成一个非常困难的问题。” 戴文渊举例道。

以往,计算框架随着数据量的增长,运算时长也会成几何级数地增加,更新模型时间受限、根本无法应对大数据的计算要求。为了迁就不足的计算能力,企业不得不减少数据样本和特征数量,机器学习的效果也会随之下降,最终整个系统的能力就会遇到瓶颈。为此,戴文渊表示,第四范式研发了万亿级高维度机器学习框架GDBT(General Distributed Brilliant Technology),把分布式计算、流式计算、高性能计算(超算)等能力都封装于产品中,确保在大数据的场景下,计算能力随数据量增加呈线性增长,实现系统时间成本与计算成本的可控。

Needs——边界清晰的问题定义

必须引起重视的是,一切技术的应用都是为了完成企业的业务目标,目前机器还不具备主动、自发定义任务的能力,因此,清晰、明确的任务目标就是人工智能得以有效应用最为关键的先决条件。以往,企业在探讨人工智能应用时往往容易将其想象成“万能钥匙”,对此,戴文渊解释道,“人工智能解决的问题是能被客观评价的场景,需要定义为单一目标、有边界的业务问题”。以第四范式服务的某银行信用卡业务领域为例,如果业务目标是宽泛地提出发展更多新客户、不给出具体的运营策略,那么机器对此是难以理解的。如果让机器更好地理解“任务”,这个目标须进一步拆解、聚焦成:做某个卡友的营销活动,赋予机器预测给哪些存量客户的营销成功率更高,这样问题的边界就逐渐清晰了。

戴文渊指出,优化、明确业务问题需要企业业务专家的深度参与。一方面从业务出发,需要在业务专家和技术专家相互理解的阶段就让大家共同对企业资源进行评估与组织,最终将商业目标转化为机器可理解的数据挖掘目标;二是从技术出发,机器学习有较为通用的预测指标,例如流失率、点击率、停留时长等,不妨从这个角度,将公司的运营指标和人工智能适用的指标进行结合。

人工智能并不是一项单纯的技术,而是一个各方面因素有机结合的体系。在戴文渊看来,成功利用人工智能技术创造价值的公司,都具备了以上五个核心因素。同时具备“BRAIN”的门槛是很高的,高门槛成为了众多行业与企业无法应用人工智能的原因,第四范式希望努力改变这样的现实。据了解,第四范式已经将先进的算法、计算资源、反馈闭环都封装到了“第四范式·先知”平台中,解决“BRAIN”中三个门槛最高的问题。企业不再需要花重金去寻觅供不应求的AI人才、建设一套AI开发系统,只要拥有数据与明确的业务目标,就能拥有人工智能的能力。



MIT教授:AI颠覆商业的唯一阻碍是你不会用它

雷锋网 

雷锋网按:Erik Brynjolfsson是麻省理工学院斯隆学院的教授,他在哈佛商业评论的HBR IdeaCast栏目中接受了一次访谈。访谈中,Erik Brynjolfsson详细阐述了机器学习快速发展给企业带来的新机遇。他解释了机器学习技术的运作方式以及它的局限性;他还讨论了人工智能对经济的潜在影响,人类今后如何与之互动,并建议管理人员开始进行相关实验。

雷锋网对访谈内容进行了节选和编译:

Sarah Green Carmichael:欢迎来到哈佛商业评论的HBR IdeaCast节目,我是Sarah Green Carmichael。

最近有一张很忧伤的照片,一台1米高的机器人躺在华盛顿特区办公楼庭院中的一个浅水池里,工作人员围在旁边试图将其救出。

事故发生时,这台机器人才刚刚上岗几天。一个在办公室里上班的企业家写道:“我们被许诺将得到会飞行的汽车,结果却等来了自杀的机器人。”

即将到来的机器人时代,计算机可以帮我们处理各种各样的工作,汽车可以自动驾驶。对有些人来说,这很值得兴奋,但反乌托邦主义者却对此感到恐惧。特斯拉的首席执行官Elon Musk就将人工智能称作潜在的威胁。

不过我们今天的嘉宾是一位谨慎的乐观主义者。他一直在观察企业如何应用人工智能技术,机器学习的进步如何改变我们的工作方式。Erik Brynjolfsson教授在麻省理工学院斯隆学院任教,并负责运营麻省理工学院的数字经济计划。他还和Andrew McAfee合著了HBR文章《人工智能商业》。

Sarah Green CarmichaelEric,欢迎你来到HBR IdeaCast。你为什么对AI的未来持谨慎乐观态度?

Eric Brynjolfson:你开场提到的那个机器人的例子很好,因为它体现了机器人的优势和不足。机器人在某些方面是非常强大的,就像计算器在算术方面比我强得多一样。如今我们拥有人工智能,它可以胜任很多工作,比如识别不同癌症的影像,某些场景中的语音识别,但它同时也很狭隘,因为它不具备人类那样的智慧。这也解释了为什么人机协作最成功的案例往往发生在商业领域。

Sarah Green Carmichael:当你谈到图像识别时,我脑海中浮现出了一副很奇妙的画面,你在文章中称之为“小狗或松饼”。我很惊讶松饼和小狗看起来竟然这么相似,更让我惊讶的是,机器居然能够把它们区分开来。

Eric Brynjolfson:这确实挺有趣的。人类非常擅长辨别不同类别的图像。但长时间以来,机器远不如七八年前那么聪明,当时它在image net上达到了30%的识别错误率。image net是李飞飞创造的包含超过1000万张图像的大型数据库。现在机器的识别错误率大幅降低,小于5%,可以达到3-4%,这取决于它的设置。而人类的识别错误率仍保持在5%左右。

机器在过去几年中得到显著改善的原因是使用了深层神经网络技术,对于图像识别等任务来说,它非常强大。

Sarah Green Carmichael:一方面,我们喜欢愚弄机器,让它出错;另一方面机器识别准确率这么高,仔细想想也挺可怕的。

Eric Brynjolfson:机器并非完美的社会驱动力,虽然它能准确区分小狗和松饼,却无法准确地做出信用决定。因此,我们必须建立能够弥补这些缺陷的可靠系统。当然,人类在这些方面也无法做到完美,所以大多数企业家和管理者在人和机器之间做出选择的依据是:谁能更好地解决某个特定问题,以及是否可以创建一个系统,结合人类和机器的优势,让它比二者单独行动时获得更好的成效。

Sarah Green Carmichael:通过识别照片和人脸,Facebook的人脸识别软件可以区分出化妆和不化妆时的我,这既有趣又可怕。与此同时,人类在辨认人脸时却常常遇到困难,比如说你在杂货店碰到一个人,觉得在哪里见过,但是又想不起来。所以说,在认人这件事上,人类也经常犯错。

Eric Brynjolfson:没错,在这方面我可以说是世界上最糟糕的。开会的时候,我多么希望耳边能够有一个机器偷偷告诉我,这个人是谁,我们以前是怎么认识的。机器可以提供帮助,但也具有一定的风险。它可能会在某些重要事务上做出糟糕的决策,比如谁应该获得假释,谁又该获得信用。更糟糕的是,有时候它们的决策是建立在收集到的数据基础之上的。加入你以前雇佣的人存在种族和性别歧视倾向,而你又使用这些数据教机器人怎么招聘员工,那么它将学会人类的偏见,并且以我们不愿看到的方式扩大和永久化。

Sarah Green Carmichael:现在关于AI的宣传铺天盖地。当有些人提到机器学习时,立马会有人跳出来说,它不过是一种软件,我已经使用它很久了。你是如何分辨这些概念,以及它们背后的真正涵义的?

Eric Brynjolfson:现在机器工作的方式与以往你所知道的有着重大区别。McAfee和我合著了《第二机器时代》这本书,书中提到,我们如今正在让机器完成越来越多的认知任务。过去三、四十年间,我们精心编程,将希望机器完成的所有动作写进代码里。所以你知道它是否做好了处理税务工作的准备,比如将两个数相加再乘以另一个数。当然,前提是你首先必须足够了解这些任务,这样才能指定机器去完成。

但在新的机器学习理论下,机器可以自主学习人类无法描述的事物,比如说面部识别。我很难去形容我母亲的脸,说清她两眼之间的距离,以及它的耳朵是什么样子的。

我可以认出她,但是我无法写一段代码去实现这一点。机器现在的工作方式是,不用我们写代码,只需要给它们足够多的案例就行了。比如很多从不同角度拍摄我母亲的照片,或者很多关于猫和狗的照片,以及关于“yes”和“no”的对话。只要你给它足够多的例子,它就能自己定义规则。

这是一个真正的突破。它克服了我们常常提到的波兰尼悖论。 1960年代的博学家和哲学家迈克尔·波兰尼(Michael Polanyi)曾经有一句名言——“我们知道的多于我们可以描述的”。通过机器学习,我们不必向机器描述应该做些什么,只需要展示一些例子就可以了。“这种变化为机器开辟了许多新的应用场景,并允许它完成很多以前只有人类才能完成的任务”。

Sarah Green Carmichael:所以未来人类的工作就是训练机器,就像训练一个坐在那里全神贯注地盯着蓝莓松饼图片的人,人类只需要为这些图片加上松饼的标记,机器就会知道这是蓝莓松饼,而不是吉娃娃。这是否意味着训练机器将是一份底低薪无聊的工作?而人们原本有着更加有趣的工作。

Eric Brynjolfson:我并不认为这是一项主要的工作来源,不过确实存在像亚马逊的Mechanical Turk那样的地方,那里数以千计的人做着像你描述的种工作,他们标记图像并加上标签。ImageNet的数据库中数百万的图像就是这样被贴上标签的。所以,确实有人被雇佣来做这些事情,公司有时会发现通过人类标记数据来训练机器是一种行之有效的方法。

不过他们往往有办法找到已经被标记过的数据,这些数据产生于他们的企业资源计划系统或者呼叫中心。如果他们足够聪明,就能找到一种自动生成数据标签的方法。这里我必须强调,机器最大的弱点之一就是它们需要标记的数据。这是最强大的算法,我们有时候称之为监督学习,人类事先做好了标签,解释了这些数据的含义。

机器从这些例子中学习规律,并能最终将它们推广到其他案例中。与人类不同的是,它们通常需要数千甚至数百万个样本来学习一件你已经知道的事情,而两岁的小孩子只需要学习一两次就能分辨一只猫和一条狗,尽管在他们学会之前,你并没有向他们展示10000张猫的照片。

Sarah Green Carmichael:结合AI和机器学习的发展现状,您是认为机器学习被过度宣传,人们谈论了太多科幻式的场景;还是觉得对机器学习的宣传还不够,人们远远低估了机器学习在不久的将来能够达到的成就?

Eric Brynjolfson:两方面都存在。首先,我认为人们对机器拥有不切实际的期望,觉得它们拥有终结者一样的能力。而且他们认为,如果一台机器能够理解汉字,那么它理应能够理解中文演讲,可以推荐中国餐馆,甚至懂一点儿秦朝历史。但事实上,一台可以玩专家棋的机器甚至不会下跳棋和其他游戏。所以,从某种程度上来说,它们还非常狭隘和脆弱。

但另一方面,这些狭隘能力的应用却能爆发非常强大的能量,使用监督学习算法,它们可以完成很多具体的任务,我们现在才刚刚触及一些皮毛。过去十年间,它们已经取得了长足进步,但还有更多的机会还没有被探索和发现。像谷歌、微软和Facebook一样的为数不多的几个巨头在这方面取得了迅速进步,但我认为还有成千上万的细分领域,中小厂商可以开始使用机器学习。

Sarah Green Carmichael:可以列举一些企业运用人工智能技术的案例吗?

Eric Brynjolfson:我最喜欢的案例来自我的朋友Sebastian Thrun,他是在线课程Udacity的创始人——顺便提一句,在线课程是学习人工智能技术的良好途径之一——Sebastian Thrun发现,当人们访问他的网站在聊天室提问时,一些销售人员表现非常出色,可以引导用户找到正确的课程并完成销售。这产生了大量的数据。

他和他的研究生意识到,对话中的某些特定词组促成了销售,而有些则没有。当他把这些信息导入机器学习算法时,机器就会开始分析哪些模式的短语和答案带来成功的概率最高。

接下来发生的事情我觉得特别有趣,他们并没有建立一个可以回答所有问题的机器人,而是开发了一个可以向销售人员提供建议的机器人。当用户访问网站的时候,机器人看到一些特定关键词时就会向销售人员耳语,“你或许应该尝试这套话术”或者“你应该向他推荐这套课程”。

对于常见的查询类型来说机器人很管用,但在面对机器人从未见过的晦涩难懂的对话时,人类显然更能从容应对。这种人机协作关系是充分利用人工智能,以及如何将现有数据转换成让监督学习系统受益的标签数据集的绝佳案例。

Sarah Green Carmichael:这些销售人员对机器人的指导感觉如何?

Eric Brynjolfson:这有助于他们完成销售,让他们更富有成效。Sebastian Thrun表示,当他们使用机器人时,销售转化率大概是50%。所以我认为机器能够让他们学习得更加迅速。

我想这是一个很好的例子,说明机器擅长那些常规的重复性任务。而对大多数人类而言,我们更倾向于不寻常的任务。机器和人之间达成了完美平衡。

Sarah Green Carmichael:销售是一种知识型的工作,你刚刚列举了一个例子。其中最大的挑战之一在于,你无法或者说很难提高一个人的生产力,比如说你开了一家律师事务所,如果你想为更多客户服务,就必须雇佣更多的律师。不过听起来AI似乎是解决这个挑战的一种方式。

Eric Brynjolfson:的确,AI可以将生产力放大很多倍。关于律师和医生这两个职业,有很多解释他们如何行事的准则以及成功案例,机器可以从中学习并重复他们的行为,或者与从业者相结合,以指导他们或处理常见问题的方式给予帮助。

Sarah Green Carmichael:那么,AI只是为了提高生产力,还是说你看到了人机协作处理其他不同业务类型挑战的例子?

Eric Brynjolfson:在有些场景中,AI意味着提高生产力,有些场景中,则意味你能把工作做得比以前更好。现在有一些系统可以帮助阅读医学图像和诊断癌症,但最好的系统仍然是与人类相协同的,因为机器面对人体时会犯许多不同类型的错位,它经常会产生假阳性认定有癌症,但事实并没有。人类的可以更好地排除这些情况。你能判断可能有一个睫毛或者其他东西粘在了图像上。

因此,如果先用机器扫描所有图像,筛选出那些看起来有问题的,然后人工进一步核对,重点关注那些有问题的影像,就能得出更好的结果。反之,如果人工不得不查看每一张影像,就有可能忽视潜在的问题。

Sarah Green Carmichael:人们很久之前就预测,人工智能时代即将来临。听起来现在它终于到来了,真正进入了企业。为什么人工智能时代会在这个时间点降临呢?

Eric Brynjolfson:这个问题很好。AI时代来临得益于三股力量的结合。首先是我们拥有了更加强大的计算能力。依据摩尔定律,计算能力每隔一段时间就会翻番;此外还有许多专门的芯片问世,比TPU和GPU,比普通芯片快十倍乃至上百倍。因此,如果你使用20世纪90年代的电脑进行训练,可能需要花费一个世纪甚至更久,而现在只要几天就能完成。显然,这开辟了一系列的可能性。

第二股力量是数据的大爆炸。数据是AI系统的命脉,你需要用数据进行训练。我们现在拥有更多的数字图像、数字记录,以及工厂的数据和跟踪信息,这些都可以放到系统中进行训练。

最后但同样重要的是,算法取得了重大进步。其中有些基础算法是30多年前开发的,但是现在已经进行了改进和调整,借助更快的计算机和更加丰富的数据,你可以快速了解什么是有效的、什么不起重要。当更强的计算机、更多的数据、更先进的算法结合到一起时,你在某些领域将获得几百万倍的提升,比如说无人驾驶车辆可以识别穿过街道的行人。

Sarah Green Carmichael:如果说前面提到的这些因素不断推动我们向前,那么阻碍我们进步的因素都有哪些?

Eric Brynjolfson:技术不会阻碍我们进步,阻碍我们前进的是企业高管在他们的业务中使用这些新工具的想象力。每一项通用技术,无论是电力还是内燃机,其真正的力量都来源重新组织工厂的新模式、连接客户的新方式,以及新的商业模式。我之所以乐于为哈佛商业评论写文章的原因之一就是可以抵达读者,帮助他们更富创意地利用这些工具来改变他们的现有业务。这才是真正的价值所在。

Sarah Green Carmichael:关于AI的众多讨论都指向一个话题,这项技术的应用将创造还是摧毁就业机会。你是否也常常被问到这个问题,甚至已经厌烦去回答?

Eric Brynjolfson:当然,我经常被问到类似的问题,不过我并不会对此感到厌烦,因为它真的很重要。我想过去十年间我们面临的最大挑战,就是如何处理新技术对经济造成的影响。你刚刚介绍我的时候,说我是个谨慎的乐观主义者,我想这个判断是正确的。我想如果我们能够正确处理好这一挑战,AI将是人类有史以来遇到的最美好的事物。

但我不认为这一切都是自然而然的。我对此非常谨慎。不再投资教育和培训AI技术人员,不再出台新政策以促进企业形成新的商业模式显然是不可能的。但我们也必须重新考虑收入的分配问题,出台美国所得税抵免或其他国家类似的工资补贴政策。

我们需要在政策层面进行一系列改革。企业需要重新思考工作方式,个人需要承担个人责任,学习将来需要的新技能。如果将这些事情都做好,我对于未来感到很乐观。

但我并不希望人们感到自满,因为过去十年中,有很多人被迄今为止的数字革命甩在了身后。展望未来,我会说我们还一无所知。我们拥有非常强大的技术,尤其是人工智能,开创了许多新的可能。但是我们需要思考如何利用新技术造福更广大的人群,而非仅仅服务于少数人。

Sarah Green Carmichael:在你看来,有没有哪些任务是机器学习无法做或者不会做的?

Eric Brynjolfson:有很多。你必须清楚一点,大多数事情机器学习都是无法胜任的。它只能胜任一些细分领域的工作,但是可以做得相当好。就像计算器一样,它能做的事情很少,但是却做得非常出色。人类拥有更加广泛的技能,不过如今这些技能正在被侵蚀。

机器正在接管越来越多的任务,或者在任务中提供帮助,但它并不擅长广泛的创造性工作。比如说担任一名企业家、写一本小说,或者研究新的科学理论,这些创造力工作都超过今天机器的能力范围。

其次,但也许更重要的一点,是人与人之间的社交技能。人与人之间可以建立信任和关心,但这些并不会发生在及其身上。

所以,无论教练还是销售,这些需要用到谈判、照顾人和说服人的技巧的地方,都是机器的边界。我认为,个人教练和培训师等以团队为导向的活动领域,将迎来就业机会的爆炸式增长。我乐于看到更多人学习机器不擅长的技能,他们未来会获得很多工作。

Sarah Green Carmichael:但是我在文章中看到,一些AI程序能够识别人类的情绪。我对此感到惊讶。

Eric Brynjolfson:谈到这一点我必须慎之又慎,我和安迪共事学到的最重要的一点就是“绝对不要说绝对”。我们知道,有些人正在实验室研究相关项目。

所以我要表述的是相对的优势和弱点,我仍然认为在情商方面人类有绝对优势。不过在某些细分领域,机器也正在快速进步。Affectiva是波士顿的一家公司,他的AI已经非常擅长阅读人类情绪了,这对于一个教练和富有爱心的人来说是非常重要的。虽然阅读情绪并非情商的全部,但它已经能够帮助机器人胜任一些工作了。

via HBR雷锋网编译

产业智能官


子曰:“君子和而不同,小人同而不和。”  《论语·子路》


 云计算、大数据、物联网、区块链和 人工智能,像君子一般融合,一起体现科技就是生产力。


如果说上一次哥伦布地理大发现,拓展的是人类的物理空间。那么这一次地理大发现,拓展的就是人们的数字空间。


在数学空间,建立新的商业文明,从而发现新的创富模式,为人类社会带来新的财富空间。


云计算,大数据、物联网和区块链,是进入这个数字空间的船,而人工智能就是那船上的帆,哥伦布之帆!


人工智能通过三个方式激发经济增长:

  1. 创造虚拟劳动力,承担需要适应性和敏捷性的复杂任务,即“智能自动化”,以区别于传统的自动化解决方案;

  2. 对现有劳动力和实物资产进行有利的补充和提升,提高资本效率;

  3. 人工智能的普及,将推动多行业的相关创新,开辟崭新的经济增长空间。


新一代信息技术(云计算、大数据、物联网、区块链和人工智能)的商业化落地进度远不及技术其本身的革新来得迅猛,究其原因,技术供应商(乙方)不明确自己的技术可服务于谁,传统企业机构(甲方)不懂如何有效利用新一代信息技术创新商业模式和提升效率。


“产业智能官”,通过采编对甲、乙方参考价值巨大的云计算、大数据、物联网、区块链和人工智能的论文、研究报告和商业合作项目与案例,面向企业CEO、CDO、CTO和CIO,从而服务新一代信息技术输出者和新一代信息技术消费者。


助力新一代信息技术公司寻找最有价值的潜在传统客户与商业化落地路径,帮助传统企业选择与开发适合自己的新一代信息技术产品和技术方案,消除新一代信息技术公司与传统企业之间的信息不对称,推动云计算、大数据、物联网、区块链和人工智能的商业化浪潮。


给决策制定者和商业领袖的建议:

  1. 迎接新一代信息技术,迎接人工智能:无缝整合人类智慧与机器智能,重新评估未来的知识和技能类型;

  2. 制定道德规范:切实为人工智能生态系统制定道德准则,并在智能机器的开发过程中确定更加明晰的标准和最佳实践;

  3. 重视再分配效应:对人工智能可能带来的冲击做好准备,制定战略帮助面临较高失业风险的人群;

  4. 超越自动化,开启新创新模式:利用具有自主学习和自我控制能力的动态机器智能,为企业创造新商机;

  5. 开发人工智能型企业所需新能力:员工团队需要积极掌握判断、沟通及创造性思维等人类所特有的重要能力。对于中国企业来说,创造兼具包容性和多样性的文化也非常重要。






产业智能官  AI-CPS



新一代技术操作系统(AI-CPS OS:云计算+大数据+物联网+区块链+人工智能,在商业应用场景中构建状态感知-实时分析-自主决策-精准执行-学习提升认知计算机器智能实现产业转型升级、DT驱动业务、价值创新创造的产业互联生态链



长按上方二维码关注微信公众号 AI-CPS

更多信息回复:案例分析、研究报告、商业模式

云计算、大数据、物联网、区块链、人工智能




本文系“产业智能官(公众号ID:AI-CPS)收集整理,转载请注明出处!



版权声明产业智能官(公众号ID:AI-CPS推荐的文章,除非确实无法确认,我们都会注明作者和来源。部分文章推送时未能与原作者取得联系。若涉及版权问题,烦请原作者联系我们,与您共同协商解决。联系、投稿邮箱:erp_vip@hotmail.com




登录查看更多
4

相关内容

戴文渊,第四范式创始人、首席执行官,ACM大赛世界冠军(2005年),首位获得中国智能界最高奖“吴文俊人工智能科学技术奖”一等奖的企业家,入选《财富》40位40岁下商界精英、《麻省理工科技评论》35岁以下科技创新35人。戴文渊也是人工智能研究领域顶级学者,在下一代人工智能技术“迁移学习”领域,论文引用数排名世界第三(数据根据Google Scholar)。戴文渊是百度最大最成功的AI系统“凤巢”系统设计者,获百度最高奖,是最年轻的百度高级科学家,曾任华为诺亚方舟实验室主任科学家,获华为总裁奖。
专知会员服务
80+阅读 · 2020年6月20日
商业数据分析,39页ppt
专知会员服务
160+阅读 · 2020年6月2日
少标签数据学习,54页ppt
专知会员服务
198+阅读 · 2020年5月22日
2020年中国《知识图谱》行业研究报告,45页ppt
专知会员服务
239+阅读 · 2020年4月18日
Python数据分析:过去、现在和未来,52页ppt
专知会员服务
100+阅读 · 2020年3月9日
《人工智能2020:落地挑战与应对 》56页pdf
专知会员服务
196+阅读 · 2020年3月8日
【德勤】中国人工智能产业白皮书,68页pdf
专知会员服务
303+阅读 · 2019年12月23日
人工智能商业化研究报告(2019)
腾讯大讲堂
15+阅读 · 2019年7月9日
【干货】电商数据中台如何构建?
AliData
11+阅读 · 2019年4月4日
过了尬吹的年代,人工智能都落地了些什么?
互联网er的早读课
8+阅读 · 2018年11月5日
如何成为一名商业产品经理?
产品100干货速递
6+阅读 · 2018年10月18日
如何迅速提高公司估值?
计算广告
5+阅读 · 2018年5月16日
如何解决自然语言处理中 90% 的问题
AI研习社
4+阅读 · 2018年2月15日
编程和数学基础不佳如何入门人工智能?
算法与数据结构
4+阅读 · 2018年1月14日
【智能零售】零售业的未来是让零售变得无界
产业智能官
3+阅读 · 2017年10月18日
【大数据】如何用大数据构建精准用户画像?
产业智能官
12+阅读 · 2017年9月21日
如何成为一名人工智能算法高手?
算法与数学之美
4+阅读 · 2017年8月3日
Neural Speech Synthesis with Transformer Network
Arxiv
5+阅读 · 2019年1月30日
Adaptive Neural Trees
Arxiv
4+阅读 · 2018年12月10日
Arxiv
26+阅读 · 2018年9月21日
Arxiv
12+阅读 · 2018年9月5日
Arxiv
19+阅读 · 2018年6月27日
Arxiv
6+阅读 · 2018年2月28日
VIP会员
相关VIP内容
专知会员服务
80+阅读 · 2020年6月20日
商业数据分析,39页ppt
专知会员服务
160+阅读 · 2020年6月2日
少标签数据学习,54页ppt
专知会员服务
198+阅读 · 2020年5月22日
2020年中国《知识图谱》行业研究报告,45页ppt
专知会员服务
239+阅读 · 2020年4月18日
Python数据分析:过去、现在和未来,52页ppt
专知会员服务
100+阅读 · 2020年3月9日
《人工智能2020:落地挑战与应对 》56页pdf
专知会员服务
196+阅读 · 2020年3月8日
【德勤】中国人工智能产业白皮书,68页pdf
专知会员服务
303+阅读 · 2019年12月23日
相关资讯
人工智能商业化研究报告(2019)
腾讯大讲堂
15+阅读 · 2019年7月9日
【干货】电商数据中台如何构建?
AliData
11+阅读 · 2019年4月4日
过了尬吹的年代,人工智能都落地了些什么?
互联网er的早读课
8+阅读 · 2018年11月5日
如何成为一名商业产品经理?
产品100干货速递
6+阅读 · 2018年10月18日
如何迅速提高公司估值?
计算广告
5+阅读 · 2018年5月16日
如何解决自然语言处理中 90% 的问题
AI研习社
4+阅读 · 2018年2月15日
编程和数学基础不佳如何入门人工智能?
算法与数据结构
4+阅读 · 2018年1月14日
【智能零售】零售业的未来是让零售变得无界
产业智能官
3+阅读 · 2017年10月18日
【大数据】如何用大数据构建精准用户画像?
产业智能官
12+阅读 · 2017年9月21日
如何成为一名人工智能算法高手?
算法与数学之美
4+阅读 · 2017年8月3日
相关论文
Neural Speech Synthesis with Transformer Network
Arxiv
5+阅读 · 2019年1月30日
Adaptive Neural Trees
Arxiv
4+阅读 · 2018年12月10日
Arxiv
26+阅读 · 2018年9月21日
Arxiv
12+阅读 · 2018年9月5日
Arxiv
19+阅读 · 2018年6月27日
Arxiv
6+阅读 · 2018年2月28日
Top
微信扫码咨询专知VIP会员