胡郁:美国找不到科大讯飞,我们更像IBM和谷歌公司的组合体(36PPT)

2017 年 11 月 11 日 新智元 AI WORLD 2017

 

中国人工智能资讯智库社交主平台新智元主办的 AI WORLD 2017 世界人工智能大会11月8日在北京国家会议中心举行,大会以“AI 新万象,中国智能+”为主题,上百位AI领袖作了覆盖技术、学术和产业最前沿的报告和讨论,2000多名业内人士参会。新智元创始人兼CEO杨静在会上发布全球首个AI专家互动资讯平台“新智元V享圈”。


全程回顾新智元AI World 2017世界人工智能大会盛况:


新华网图文回顾:http://www.xinhuanet.com/money/jrzb20171108/index.htm

爱奇艺(上):http://www.iqiyi.com/v_19rrdp002w.html

爱奇艺(下):http://www.iqiyi.com/v_19rrdozo4c.html

阿里云云栖社区: https://yq.aliyun.com/webinar/play/316?spm=5176.8067841.wnnow.14.ZrBcrm


  新智元 · AI WORLD 2017  

演讲嘉宾:胡郁


【新智元导读】从研究到商业,人工智能当下都有哪些新万象?科大讯飞执行总裁胡郁11月8日在 新智元AI WORLD2017 世界人工智能大会上发表题主题演讲。他在演讲中介绍了讯飞的最新技术和商业进展,还有他个人对人工智能发展中的研究与工程以及商业多个角度的思考。不同层次的人在讲人工智能的时候是有很大的差异:做研究的会更关心多种算法,而工程人员眼下比较聚焦于深度神经网络。围绕哪些公司会在人工智能时代胜出,他提出了一套自己的生态系统理论,一起来看。



新智元 AI World2017世界人工智能大会开场视频




胡郁:今天很高兴来到新智元的世界人工智能大会现场。很高兴杨静给我们人工智能生态圈这样一个机会,让包括学术研究的、企业、工业、投资圈的人都能够在这里汇聚一堂,我觉得这也是我们人工智能领域的一个盛会。我今天的演讲题目是《人工智能新纪元,共创商业新生态》。



真正做研究的态度:从周志华老师对深度森林的探索说起



大家知道人类发展的历史,为什么恐龙在地球上存在了3万年,但没有像人类一样成为地球的主宰?恐龙灭绝有很多种假说,其中一种是彗星撞击地球。这让我有一个非常有意思的联想。我们这几年经常讲人工智能是几起几伏的,那是不是可以推想智能也是几起几伏的呢?为什么恐龙在地球上存在的时间比我们人类还要长,为什么没有进化出跟人类一样的智慧呢?这就跟人工智能一样,人工智能虽然有三波浪潮,每一波的时候大家都认为有突破了,但是还没有到火候。我想恐龙的大脑也是没有到火候,只有到了人类的时代,我们的大脑才演变出智能,才促使人类最终能够统治世界。如果我们现在回头去看,人工智能是一个独立存在的现象吗?我相信不是。为什么这么说呢?在这之前人类也做了大量的准备,从蒸汽时代开始,也就是能源革命,到电气时代,到信息时代,我们发明了数字化的计算机,进入了一个数字宇宙,我们开创了虚拟的世界。经过这一轮一轮周期性的往复和不断地爬升,人工智能才到了今天的发展境地。


说到人工智能,我经常提到人工智能跟机器人之间的关系。越来越多人发现人工智能和机器人之间是一种非常耦合的,互相定义的关系。为什么这么说呢?因为人工智能和机器人的定义都是用人所设计的方法来实现让一个装置或者一个系统进行感知、认知、推理和决策、执行。



1946年ENIAC的发明,标志着数字宇宙诞生。相对自然宇宙,人们提出一个新的概念,叫做数字宇宙和虚拟世界。在这个世界里有很多的创始人,包括图灵、冯·诺依曼,等等,他们做出了卓越的努力。在人工智能的链条当中,其实有不同层面的人,我现在讲的这些人是真正从科学的角度来研究机器人是不是存在人工的智能,是不是有可能演化出生命和智能。他们通常是从这个层面来考虑问题的。而数学家和做研究的人考虑什么呢?



前段时间我跟周志华教授探讨,我问他你为什么不研究现在最流行的深度神经网络。周志华教授告诉我做研究的人、做设计的人关注的是从数学角度来讲,哪些方法能够更好地推动人工智能的发展,他恰恰是要在大家都热衷于一个单一的技术的时候去研究和拓展其他技术颠覆的可能性,这样才能将研究不断地往前推进。就像在过去的十几年当中,Geoffery Hinton,Yann Lecun,Bengio这些人在大家都还不看好的情况下,持之以恒地推动深度神经网络的进展。这才是真正做研究的态度。做研究的人是希望关注到几百种不同的算法,就像周志华教授研究的深度森林,也许现在大家都不太看好,也许现在的计算能力还计算不了,但是做研究的人应该在这个层面思考问题。


讲到最新的人工智能技术,做工程的人关注的是什么呢?做工程的人关注的是深度神经网络,因为深度神经网络+大数据有最好的效能。他们关心用什么样的算法在什么情况下能够在真实的环境下得到最优的算法,而且这个算法最好能够突破实用的门槛。所以不同层次的人在讲人工智能的时候是有很大的差异的。


人工智能三次浪潮:下一步的突破就必须是感知智能和认知智能组合的突破



人工智能有三次革命,第一次革命中国造了一台叫508的计算机,在第二个时代,863计划为中国的人工智能奠定了科学、技术、人才和成果方面的基础。科大讯飞当时参加了863计划中语音合成的项目,这个项目也促进了在1999年人工智能第二次浪潮结束以后,在人工智能最艰苦的时候科大讯飞正式成立。所以说我们是在黑暗中摸索了很多年,从1999年到现在,正好18年,我们从来没有放弃,一直在做。到第三次浪潮,不管是深度神经网络还是其他的算法,只要有一群做研究的人在坚持,他们就一定能够找到这条道路。在2006年到2010年之间,Geoffery Hinton和邓力他们做了成功的技术,谷歌和科大讯飞最早地把它们应用在产品里面,并且取得了非常显著的成功。



说到人工智能发展的阶段,在过去的四到五年,科大讯飞在业界也跟大家一起提出了关于人工智能现在发展阶段的表述,从机器所擅长的到人类所独有的,运算智能、感知智能、运动智能、认知智能,这个已经慢慢地被大家认可。自然语言处理、语言的理解、知识的表达、复杂逻辑的推理和最终的决策都是靠人类独有的认知智能,这就是为什么人类跟恐龙不一样,人类的大脑能够发达到这一步的主要原因。我们看到AlphaGo Zero这样的运算智能的集大成者取得了突破,我们下一步的突破就必须是感知智能和认知智能组合的突破。


人工智能三大实现路径:深度神经网络不是唯一的方法



人工智能如何取得突破?现在工程师关注的是深度神经网络、大数据,因为深度神经网络具备把大数据的威力充分发挥出来的优势。但深度神经网络是不是唯一的方法呢?



这几年的脑计划包括美国的“大脑活动图谱计划”,欧洲的“人类大脑项目”,还有中国由裴刚院士正在推行的“中国脑计划”已经取得越来越多的进展。我们已经越来越能够把老鼠、鱼,甚至现在正在做猴子的,把它们脑神经的所有单元完全重构出来,用超级计算机模拟的方法得到一个模拟脑。这种全脑模拟的方式在欧洲的脑计划中尤为明显。但是是不是把人类的860亿神经元全部模拟以后就能够得到最好的效果?现在谁也不知道。但至少这种全脑模拟为我们提供了一种想象的空间。




这中间有没有更好的方式呢?其实我们可以看到还有第三种路径,也是我们科大讯飞正在推动的路径,我们称为“智能动力学”。因为我们人类在学习飞行的时候也是一样,我们把鸟的每个飞行动作都模仿得惟妙惟肖,这样就像鸟一样可以飞行了。但是这样是不行的。冯·卡门,也就是钱学森的老师,他发明了一门很有意思的学科,叫Aerodynamics(空气动力学)。通过空气动力学我们了解到鸟能够飞翔的奥秘,为什么一个物体在向前前进的时候能够产生向上的升力?找到这点以后我们人类能够造出比鸟更好的东西。这点启发我们,当我们研究出大脑的工作原理,我们是不是也能找到其中的 Intelligence dynamic?我们把脑的拓扑结构的奥妙、把学习规律的奥妙,把迁移学习、小样本学习,各种各样的学习的奥妙都掌握了,我们是不是可以造出超过人的大脑的智能?人的大脑在自然宇宙中受到非常多的限制,而电子大脑在虚拟宇宙、数字宇宙中没有那么多的限制。同时也带来一个非常有意思的问题,就是我们有没有可能将一个生命的智能部分和它的意识部分分开?这也是我们现在讨论问题的一个焦点:人工智能会不会毁灭人类?如果人工智能没有意识,只有智能,就像尤瓦尔•赫拉利在他的《未来简史》中说到的,我们完全有可能发明出来只有智能而没有意识的机器,它可以帮助我们完成各种各样的事情。


我们在可见的未来能够不断地取得进步的是什么呢?还是深度神经网络+大数据+涟漪效应。涟漪效应是互联网思维的一种方法,我们把不成熟的人工智能算法先免费地推向用户。现在在语音识别、图象识别、自然语言处理方面已经涌现出越来越多的应用,这样的应用最后能我们什么好处呢?当人工智能在向每个人提供服务的同时吸收到每个人的用户数据和经验,它自己不断地快速成长。在它还没有触达整个用户群时,它的性能成长到让所有人都大吃一惊。我们已经越来越多地看到这方面的例子。



我们回答了人工智能的发展目标、发展阶段,发展方法,以及人工智能现在用什么样的方法在功能上是可以实现的,所以科大讯飞在2014年提出了讯飞超脑计划。超脑并不是一个简单的名词,也不是一个噱头,而是有非常丰富的内涵和外延的。在这过程中我们取得了哪些成绩呢?我们在深度神经网络方面作出了一系列的尝试,同时我们构造了讯飞超脑的整个逻辑架构,这个逻辑架构跟大脑的工作原理是一样的。



我们人类的大脑皮层分为感知区域和认知区域,而讯飞超脑也是由感知部分和认知部分组成,包括viewing machine,reading machine,listening machine,以及thinking machine,thinking machine 对应的是认知智能部分。去年我们在美国的CHiME Challenge英文识别大赛上,在三个比赛中全部取得了第一名。这标志中国的智能语音技术取得世界最高水平。




在今年的国际语音合成大赛上,科大讯飞再次获得第一名。在TAC Knowledge Base Population知识推理大赛中我们也取得了第一名的好成绩。这些都说明我们不仅在感知智能,而且在认知智能方面完全可以跟全世界最优秀的团队进行拼比。去年的Winograd测试是测试人类常识的,相当于人类八到九岁小孩的常识问题,我们也取得了第一名。



今年我们取得哪些最新的成果呢?在美国的SQuAD挑战赛,是一个阅读理解问答的挑战,我们也取得了第一名的成绩。



今年8月,在国际医学影像领域的权威评测LUNA上我们获得平均召回率92.3%的检测效果,获得该项评测的第一名并刷新世界纪录。



我是国家863高考机器人的首席专家,现在863高考机器人经过3年的研发,第一期目标已经基本上达到。 



前天我们刚刚发布一个公告,中国也是世界上第一个参加临床职业医师综合笔试测评的机器人已经正式诞生了,而且考出的分数大概是450多分,总分是600分,360分及格。这个分数在安徽处于前一百名,这也是非常好的成绩。这些都证明我们在认知智能方面取得了非常好的成果。国家卫计委对这个结果非常的高兴,因为这样的结果能够帮助中国在很多地区消除贫富差距,帮助我们为偏远地区的医生建立一个辅助诊疗的系统。


人工智能怎样改变世界:自然交互是第二次人工智能浪潮



人工智能将怎样改变世界?很多人都问科大讯飞是一家什么样的公司,在美国能不能找到相对应的公司,非常抱歉地告诉大家,其实在美国也找不到类似科大讯飞的公司。我们更像IBM和谷歌公司的组合体。大家知道IBM的认知计算是世界上最早提出来在认知智能方面进行努力的,IBM的很多认知计算可以帮助到教育、医疗、智慧城市等各个方面。谷歌发布了它的智能云开放平台,谷歌也开发了像Google Home、Google Glass等一系列智能产品。人工智能可以从两个角度改变世界,第一个角度是通过智能学习的能力改变行业,它能够吸收行业里最具宝贵经验的专家系统的支持,而另外一个角度是人工智能系统通过改变我们的产品,就像手机、电视、智能机器人、智能玩具、智能家居等一系列改变人和它们之间交互的方式来改变我们的世界。



为什么说人工智能将能改变我们身边的所有产品呢?自然交互是第二次人工智能浪潮,日本的第五代计算机的设计目标之一,就是能够自然地和人类交互。什么叫自然?用我们人类所天生独有的方式,比如说语音、手势、肢体语言、眼睛。在过去的几年中,我们不断地将键盘、鼠标、触摸一步一步发展下来,但是在新一代人机交互得将是什么方式?人类之间最主要的方式是什么呢?人类接受输入信息80%来自于眼睛,所以很多人依此类推认为机器人的视觉很重要。但是还有一个数字可能大家没有研究过,我们在这里第一次提出来,就是人类输出信息最自然的方式是来自于哪一个单一的器官呢?人类输出信息90%都来自于嘴。



对计算机来说,计算机输出信息最便捷的方式是什么?是屏幕,所有的计算机都有屏幕,所以说计算机输出信息最自然的方式是视觉。但是计算机接收信息最主要的方式,除了键盘、鼠标、触摸还有什么?现在有两种方式正在成为人和计算机交互的主要方式,一个就像我们打电话一样,我把它叫做“弱视觉呈现的语音交互”,我们看不到对方,也看不到操作的内容,只能通过语音来进行。另一种叫“强视觉呈现的语音交互”,计算机显示图像,人类的眼睛去理解,人类讲出自己的意图,计算机通过耳朵去理解。这样才能构成在接下来5到10年人机交互的主要类型。



针对这个目标,在两年前我们就推出了一个概念叫AIUI,用AI的方式来做User Interface,这是我们第一次在世界上提出全中文的交互方案。我们可以自由地跟机器进行交互,明天下午我们的发布会会提到AIUI 2.0,会给大家带来非常多的惊喜。



在这个过程中我们让它改变了手机、车载、家庭、翻译,这方面的技术都很多。



在过去一年当中,我们的开放平台和我们的合作伙伴也取得非常多的进展。大家可以看到在过去的一年里,我们的开发者从原来的23万变成了46万,累计连接的终端数从9亿变为15亿,日均交互次数从29亿变成40亿。这个数字是非常惊人的。虽然现在我们每天的交互次数只有40亿,但是我相信在五年以后将会达到1000亿。


    

语音技术一方面改变了消费者产品,另外一方面讯飞超脑利用智能学习的方法结合行业大数据,我们可以改变很多行业,比如医疗、教育、政务、金融、安全等。



这些行业都有痛点,他们的痛点在于专家经验。比如在教育行业,每个老师每天都要花时间去改卷、辅导、布置作业。中国是世界上第一个能够将你的普通话的水平测试出来并且告诉你的国家,中国也是世界上唯一一个把英语口语考试放到中考和高考进行大规模考试的国家,因为英语口语考试靠人听是没办法听得过来的。中国也是第一个能够对纸面作文、数学、物理、化学进行自动化批改的国家。 



在医疗大数据里,人工智能通过临床职业医师综合笔试测评之后可以帮助我们做辅助治疗,语音记录可以帮助医生记录手术中所有的操作过程和详解的东西,刚才讲的LUNA测试库也可以帮助医生。



人工智能将改变人类的世界,但是人工智能是不是会抢走所有的工作,有一些工作是人工智能还做不到的,就是Information Free的,有创造性、有创意、灵感的,从无到有的事情必须人类来做。还有一些事情是Information Completed的,像AlphaGO做的事情,那是人工智能可以做到的。


混合正交商业生态体系:人工智能时代哪些公司会取得成功



在新时代的人工智能生态将会发展什么变化?我们经历过不同的生态,我们经历过市场为王的生态,也经历过渠道为王的生态,也经历过互联网超级马太效应赢者通吃的时代,在将来的物联网时代、大数据时代和人工智能时代还会这样吗?我们在经过仔细地研究以后,我们发现有可能将来是一个混合正交的生态系统,在这个生态里面每个领域、每个行业,甚至每个企业都会有自己的人工智能,它们会关注解决自己链条上的方面。那么他们如何进行紧密的连接呢?比如说华为是做手机的,它的人工智能是用在手机从销售到最后运用的整个方面,而科大讯飞是做人机交互的,我们会把手机上的语音交互做到极致。在新的生态下知识、经验、数据、利益的分享会变得更加重要,通过混合的方式建立新生态下的共赢是非常重要的。

   


很多人问我,你觉得在人工智能时代哪些公司会取得成功?这里我借用一下世界上最著名的创新家之一杰弗里·摩尔的话,他的书有《龙卷风暴》《跨越鸿沟》、《断层地带》、《公司进化论》等。大家可以看这页PPT,这个图最左边是颠覆式创新、早期市场、应用创新、产品创新和平台创新,这是一个成长型的市场,在这个过程中很多人想用人工智能方法来进行颠覆性的创造。


但是不是人工智能只能用在颠覆性创新这一个地方呢?大家看在成熟市场还有用于客户亲近或者卓越运营,在客户亲近里我们可以做产品线延伸创新、增强型创新、营销创新、体验式创新,卓越运营可以做价值工程创新、集成创新、流程创新、价值转移创新,这些需要行业专家来做。如果这些专家被人工智能替代,我们可以在这个过程中借助人工智能做延续性创新,而延续性创新是传统企业非常有优势的地方。即使对于正在衰退性的市场也可以做有机创新和并购创新,这个过程甚至都可以用到人工智能



如果体会到这一点,比较中美两国,我觉得美国很显然在原始创新有绝对的优势,但中国的优势在刚才讲的工程、产业、落地方面。这也是为什么我现在去日本、韩国、新加坡都感到不方便,因为电子支付没那么发达,将来有一天我相信人工智能也会一样。


    

再次感谢新智元给我们这样的机会共聚一堂,相信大家都能够树立一个信心,在中国我们可以用人工智能改变整个世界,我们的征途是星辰大海!谢谢大家!




登录查看更多
1

相关内容

1999年成立,主要技术包括:语音合成和语音识别。
【硬核课】统计学习理论,321页ppt
专知会员服务
138+阅读 · 2020年6月30日
商业数据分析,39页ppt
专知会员服务
160+阅读 · 2020年6月2日
少标签数据学习,54页ppt
专知会员服务
198+阅读 · 2020年5月22日
【Facebook AI】低资源机器翻译,74页ppt
专知会员服务
29+阅读 · 2020年4月8日
Python数据分析:过去、现在和未来,52页ppt
专知会员服务
99+阅读 · 2020年3月9日
电力人工智能发展报告,33页ppt
专知会员服务
128+阅读 · 2019年12月25日
【知识图谱】AI基石知识图谱与百度AI布局
产业智能官
28+阅读 · 2017年11月20日
王海峰首谈百度AI战略布局(PPT)
新智元
3+阅读 · 2017年9月15日
Equalization Loss for Long-Tailed Object Recognition
Arxiv
5+阅读 · 2020年4月14日
Talking-Heads Attention
Arxiv
15+阅读 · 2020年3月5日
Arxiv
3+阅读 · 2019年9月5日
Arxiv
5+阅读 · 2018年10月23日
Arxiv
7+阅读 · 2018年1月24日
VIP会员
相关VIP内容
【硬核课】统计学习理论,321页ppt
专知会员服务
138+阅读 · 2020年6月30日
商业数据分析,39页ppt
专知会员服务
160+阅读 · 2020年6月2日
少标签数据学习,54页ppt
专知会员服务
198+阅读 · 2020年5月22日
【Facebook AI】低资源机器翻译,74页ppt
专知会员服务
29+阅读 · 2020年4月8日
Python数据分析:过去、现在和未来,52页ppt
专知会员服务
99+阅读 · 2020年3月9日
电力人工智能发展报告,33页ppt
专知会员服务
128+阅读 · 2019年12月25日
相关论文
Equalization Loss for Long-Tailed Object Recognition
Arxiv
5+阅读 · 2020年4月14日
Talking-Heads Attention
Arxiv
15+阅读 · 2020年3月5日
Arxiv
3+阅读 · 2019年9月5日
Arxiv
5+阅读 · 2018年10月23日
Arxiv
7+阅读 · 2018年1月24日
Top
微信扫码咨询专知VIP会员