一年十几亿台,智能音箱算什么!语音技术最大风口在这

2018 年 4 月 12 日 智东西 寓扬

看点:语音助手抢占数十亿手机入口,这三股力量暗收红利!

智能手机的全球销量每年可达十几亿台,已成为AI硬件最大的入口。而语音助手作为AI落地的关键形态之一,正在加紧涌入手机入口。

一方面是互联网巨头极力推动语音扩散,抢占最大的智能硬件入口;另一方面是手机厂商将AI能力作为手机迭代创新、增强用户体验的关键点,语音助手在两股力量的推动下, 正在成为手机的标配。

通过手机语音助手市场的观察以及行业一干人等的采访我们发现,在数十亿的手机语音助手市场,背后竟然是这三股力量在主导,他们构成构成了手机语音助手的核心力量! 

三大类语音助手齐聚手机

2017年全球前十的智能手机厂商占据了全球近70%的市场份额,而前十的手机厂商不论自研或者与第三方合作都在手机中搭载了语音助手,如苹果的siri,三星的Bixby,华为的小E等。

市场调研机构IDG报告显示,2017年全球年全球智能手机出货量共计达到 14.62 亿台。以此数据来看,全球前十的手机厂商出货量就超过了10亿台,这也意味着仅2017年手机语音助手就有10亿的体量。

其他一些小众手机品牌,如魅族、360、夏普等也都推出了语音助手,锤子手机创始人罗永浩近期也大力宣传将推出新一代的语音交互系统。语音助手一时间已经落地各大手机品牌,成为手机的标配。

目前手机中的语音助手大体可以分为三类,一类是系统层的语音助手,它是手机厂商直接布局在系统中的,如苹果的Siri,除了日常生活资讯的获取,还能够实现与常用APP的打通联动,功能性最强。

第二类是第三方语音助手APP(非系统层),如度秘助手和灵犀语音助手,一般需要用户手动安装,可以通过语音获取生活服务、百科问答、新闻资讯等信息。

第三类是功能性语音助手,往往内置在其他流量较大的APP中,如淘宝、京东、手机百度中都有内置语音助手,用来辅助用户便捷的获取服务或者信息。另外像微软小冰也出现在微信以及微博中,主打的功能就是闲聊。

随着语音技术的普及,以及语音交互的盛行,手机语音助手在手机中的地位也将越来越重,将逐步由手机厂商来主导,从系统全局来布局语音入口。非系统层的第三方语音助手APP则很可能向第一类或者第三类语音助手转变,单纯第三方的语音助手无论是从唤醒层面、还是手机不同APP之间的调度都略显乏力。而功能性的语音助手则会继续存在更多的APP中,为用户提供更加便捷多元的交互方式,提供APP的用户体验。

在这三类手机语音助手中,本文重点关注由手机厂商主导的处在系统层的语音助手,这将会是手机助手的主流形式。而手机语音助手大体来说可以拆解为三部分:语音技术、内容服务、系统优化。语音技术,包括拾音、语音识别、语义理解、语音合成等技术,这块手机厂商大多通过技术公司来实现;一块是内容与服务,比如像百科搜索、天气、资讯等,大多由内容服务商提供;另外一块是系统层的优化,通过语音入口实现与更多APP之间的打通与联动,多由手机厂商来完成。

尽管各大手机厂商都推出了自家的语音助手,名字也五花八门,小E、小爱、小溪、小欧······但是他们背后的语音技术确是来自另一拨人。

手机语音助手背后的玩家

通过观察2017年手机出货量全球前十的公司以及国内的一些手机厂商,我们发现手机助手背后的语音技术这块,只有少数的互联网巨头做的手机会自研语音技术,更多的手机厂商会采取合作的模式,使用第三方的语音技术来布局手机语音助手。

智东西不完全整理

目前各大手机厂商背后的语音技术主要由三类厂商提供,一类是谷歌、亚马逊、百度等互联网巨头,其往往会在手机中落地整套语音交互技术以及内容服务。比如在国外亚马逊和谷歌围绕语音入口的争夺异常激烈,其中手机入口也是一个重要的争夺之地,目前亚马逊的Fire Phone 、MOTO、酷派、华为等都有接入Alexa,而谷歌也毫不示弱,如自家的Pixel、LG等手机有有接入Google Assistant。

而在国内手机语音入口的布局上,百度的DuerOS可谓布局最快,目前百度公布过的合作伙伴有HTC、vivo、华为、小米等。据vivo的一名负责人透露,他们正跟百度DuerOS合作来打造车载场景下的语音交互。

第二类是一些成熟的语音技术厂商,比如像Nuance、科大讯飞、搜狗知音等。在早期,苹果、三星等都使用Nuance的语音识别技术,但是随着深度学习技术的成熟,以及各家对语音技术的重视都走上了自研的道路。

在国内,目前语音技术最大的两个提供商就是科大讯飞和百度了,而科大讯飞在语音技术上起步更早,早在2010年前后BAT的语音技术都是讯飞提供的。科大讯飞内部的一位负责人告诉智东西,目前国产手机80%左右的语音技术都由科大讯飞提供,主要客户包括华为、vivo、OPPO、魅族、金立等。而合作形式主要是主要是技术授权,手机厂商的产品主要是语音助手,以及相机中的语音拍照功能。

第三类则是围绕语音交互的创业公司,随着语音交互的盛行,以及手机厂商对语音助手的重视,这些公司也开始围绕自身核心技术暗暗发力,这类公司有猎户星空、思必驰、三角兽等。比如在刚刚发布的小米Mix 2s中搭载的“小爱同学”就使用了猎户星空的语音合成技术,猎户星空的一位技术负责人告诉智东西,目前他们也在和其他一些手机厂商洽谈,但还不便透露。

通过这三类手机语音助手背后真正的技术提供方,我们可以看到,在语音交互盛行,庞大的手机入口下,互联网巨头加快落地整套语音交互能力,抢占服务入口;老牌的语音技术提供商也凭借自身在语音识别、语音合成等方面的优势,布局技术入口;而创业公司在手机这个庞大的语音交互入口下,也企图凭借自身在语音识别、语义理解或者的语音合成等方面的优势在巨大的市场中分一杯羹。

手机语音助手新的春天

其实自2011年苹果推出手机助手Siri后,各大手机厂商也都陆续推出了语音助手,可以在系统层面设置特定的按键唤醒或者通过语音助手APP打开,但是使用率较低。这一方面是因为之前的手机助手智能化程度较低,更像是语音识别与搜索功能的简单叠加,交互能力,用户体验较差;另一方面语音助手的功能单一,比如当你想听音乐,顶多是帮你打开音乐APP,还不如触屏交互一步到位来得快,功能也较为鸡肋。

近两年随着语音交互能力相对成熟以及智能音箱的火热,语音交互开始为行业所看好,并被作为下一代人机交互入口来布局。随着亚马逊、谷歌等互联网巨头围绕语音交互掀起了入口大战,手机便是其中一个重要的入口争夺地。目前亚马逊Alexa已经落地了Fire Phone、MOTO、华为、酷派等手机,谷歌也将Google Assistant落地Pixel、LG等手机,并向安卓5.0以上的手机开放了使用权限。

另一方面在手机市场相对饱和,市场略显疲软,产品创新不足的情况下,AI成为了产品创新迭代、用户体验升级的关键点。一方面手机厂商将AI视觉落地手机,推出物体识别、智能美颜等;另一方面便是打造更加智能的语音助手,将语音交互引入手机。

在这两股力量的共同推动下,近期不少手机厂商都在打造全新的手机语音助手。如三星在去年推出了全新的Bixby,包含语音、视觉、提醒等功能。

今年3月底小米发布的小米Mix 2S也搭载了小爱同学语音助手。vivo那位负责人也向智东西透露,目前也在研发新一代的的语音助手,并跟DuerOS开发车载场景的语音交互,预计近期也会推出。此外,锤子手机也将在今年五月份发布语音交互系统,为此罗永浩已经做了大半年的宣传。

可以看出,手机厂商都在热情的拥抱语音交互,语音助手迎来了又一个春天。在智东西看来,新的手机语音助手相比前几年有几个比较大的变化:

其一是语音入口的地位进一步强化。语音不再是手机操作界面中的一个应用,而是逐渐演变成和和操作界面一样的入口级的存在,用户可以通过这个入口更便捷的完成一些服务,比如找到美食后一键打车。

其二更加智能化。在语音方面,可以直接进行语音唤醒,语音交互的维度更加深入,如三星Bixby能够语音发送微信以及朋友圈,尽管体验也被网友吐槽不断;而在视觉方面,大都支持智能识别、智能翻译等。

其三是内容服务更加丰富。语音助手的核心是为用户更便捷的提供服务,而非过去语音助手重复简单的APP打开操作。目前的语音助手都覆盖了像滴滴打车、支付宝、微信、微博、淘宝、QQ等高频应用,能够更加便捷的通过语音实现跨场景联动。

其四场景的深度优化与定制。比如在开车环境中通过按键交互使用手机是一件很危险的事情。vivo X21在驾驶模式下,导航时来电和通话以悬浮窗形式呈现,如果进一步加入语音交互,针对车载环境进行深度优化,体验将会更好。

结语:语音交互正在全面占领手机

智能音箱的涌现将语音交互技术打磨至相对成熟,在智能音箱在全球攻城略地的同时,语音助手也在不断落地到家电、车载、照明等各个场景。目前语音助手也在全面进入数十亿手机入口,语音厂商迎来时代最好的机会!无论是互联网巨头,还是语音技术厂商都在热情拥抱手机入口,抢占发展机遇。

另一方面,作为AI技术的重要代表,语音助手的马太效应也愈发明显。可以看到在各大手机厂商打造语音助手的背后,到处都是亚马逊、谷歌、百度等几大互联网巨头的身影,语音助手已成为巨头的较量之地。



智东西联合NVIDIA推出「NVIDIA实战营」,共计4期,6位讲师参与。明晚8点,NVIDIA实战营第三期将开讲,主题为《智能监控场景下的大规模并行视频分析方法》,为你讲解基于Tesla P100与CUDA+NCCL+TensorFlow的视频分析加速平台,长按二维码报名,免费入群听课。

登录查看更多
4

相关内容

【复旦大学-SP2020】NLP语言模型隐私泄漏风险
专知会员服务
24+阅读 · 2020年4月20日
中科大-人工智能方向专业课程2020《脑与认知科学导论》
电力人工智能发展报告,33页ppt
专知会员服务
128+阅读 · 2019年12月25日
【德勤】中国人工智能产业白皮书,68页pdf
专知会员服务
303+阅读 · 2019年12月23日
【阿里技术干货】知识结构化在阿里小蜜中的应用
专知会员服务
97+阅读 · 2019年12月14日
2019中国硬科技发展白皮书 193页
专知会员服务
82+阅读 · 2019年12月13日
微软小冰:全双工语音对话详解
AI100
7+阅读 · 2019年2月10日
过了尬吹的年代,人工智能都落地了些什么?
互联网er的早读课
8+阅读 · 2018年11月5日
人工智能少女的四年蛰伏
乌镇智库
3+阅读 · 2018年8月27日
讯飞来了,一大批人将面临失业!
创业财经汇
5+阅读 · 2018年4月25日
搜狗推出唇语识别技术 提升远场语音交互
智东西
3+阅读 · 2017年12月14日
"AI+教育"是虚火还是风口?
数据玩家
3+阅读 · 2017年12月14日
Large-Scale Study of Curiosity-Driven Learning
Arxiv
8+阅读 · 2018年8月13日
Arxiv
5+阅读 · 2018年5月22日
Arxiv
5+阅读 · 2018年4月13日
VIP会员
相关资讯
微软小冰:全双工语音对话详解
AI100
7+阅读 · 2019年2月10日
过了尬吹的年代,人工智能都落地了些什么?
互联网er的早读课
8+阅读 · 2018年11月5日
人工智能少女的四年蛰伏
乌镇智库
3+阅读 · 2018年8月27日
讯飞来了,一大批人将面临失业!
创业财经汇
5+阅读 · 2018年4月25日
搜狗推出唇语识别技术 提升远场语音交互
智东西
3+阅读 · 2017年12月14日
"AI+教育"是虚火还是风口?
数据玩家
3+阅读 · 2017年12月14日
Top
微信扫码咨询专知VIP会员