别怪我往智能音箱的这片虚火上“泼冷水”!

2017 年 7 月 6 日 物联网智库


物联网智库  原创

转载请注明来源和出处

------   【导读】   ------

智能音箱的这把燎原之火,到底是“真火”还是“虚火”?



就像贝索斯自己都没预见经历Fire Phone惨败后的亚马逊Echo竟会如此大获成功,智能家居领域可能同样也没想过智能音箱这款并不新鲜的玩意儿竟然会是那匹杀出重围的黑马。


继海外四大科技公司同时入局之后,智能音箱的这把邪火从海外一直烧到了海内,BAT三家也纷纷“下海”。


  • 2014年11月,亚马逊发布了智能音箱Amazon Echo,搭载语音服务助手Alexa

  • 2016年5月,谷歌带来Google Home智能家居设备,搭载语音助手Google Assistant

  • 2016年底,微软和哈曼卡顿合作推出智能音箱Invoke,基于Cortana语音助手

  • 2017年6月,苹果发布智能语音音箱HomePod,支持用户通过Siri控制音箱


  • 2017年1月,百度联合小鱼在家发布搭载了 DuerOS 的视频对讲机器人

  • 2017年6月,腾讯联合数字家圆发布搭载了小微的“亲见 H2”,另表示其智能音箱产品“耳朵”将于8月前后发布

  • 2017年7月(昨天),阿里推出搭载了 AliGenie 的智能语音终端设备“天猫精灵 X1”


图:“天猫精灵 X1”


当然,除了“四大天王”和BAT,还有京东联合科大讯飞发布的“叮咚”,喜马拉雅发布的“小雅”,联想、酷狗等公司一家不落,一大智能家居初创企业亦蜂拥而至。随着越来越多的团队开始打造智能音箱,并将之作为智能家居“控制中枢”,人们貌似陷入了一个怪圈:想入局智能家居,就得做音箱。


在鸟山明的画笔下,集齐七颗龙珠就能召唤神龙,现在市场上智能音箱的龙珠可远不止七颗,可智能家居的神龙又在哪里呢?


为何偏偏是智能音箱?


对于最近大火的智能音箱,不少人可能会感到疑惑——偌大的智能硬件市场,为何偏偏是智能音箱独得恩宠?


有的人说音箱价格相对便宜,占地空间小,和电视等大物件相比,用音箱做智能家居控制中心比较容易入局;还有的人从需求来谈,说听歌娱乐已经成为人们茶余饭后必须的休闲活动,而音箱的接受度及普及率相对较高。


当然,最关键的一点的还是交互方式的变革——从DOS到Windows,从命令代码到图形化操作是用户体验的一次飞跃;从按键到触屏,向人类自然操作方式更近了一步;现在,语音正在成为一种更加顺应人性的自然交互方式。



但说到这儿,问题还没得以解答,毕竟很多设备都能搭载语音交互功能,为何偏偏是音箱呢?


别怪笔者对音箱的偏见,既然要抢占智能家居的入口,抢占智能家居的控制中心,至少要选一件大多数人都离不开的家居吧,可是音箱却实在算不上一个家庭的刚需设备。


以前,音箱多是作为电视、电脑的配件存在的,但是随着技术的提升,现在的电视已经拥有了环绕立体声响系统,电脑也开始讲究便捷和便携,音箱也就渐渐成了“鸡肋”;另外,随着手机、平板电脑的出现,在听音乐上,人们有了更多的选择,鉴于音箱的体积、音乐共放对周边造成的困扰,人们更愿意插上耳机享受自己的音乐世界;况且,国内多数人对于音质是没有太高要求的,因此音箱的存在也就可有可无,对于这些人而言,一部手机、平板电脑完全可以取代音箱。


再直白些讲,智能音箱的本质就是一个音箱,而让它能够从众多音箱中鹤立鸡群的就是其中所加载的语音识别、云服务等人工智能技术,以及与第三方服务商的无缝连接,而这些,只要厂商愿意,几乎每个智能硬件都可以做的跟智能音箱一样出色,甚至可以更好。如果以彩电作为中心,也可以执行控制智能家电、订餐、询问天气、叫外卖等指令,除了语音交互,它还兼具视觉交互呢!同样,家庭智能网关也可以作为交互的中心,因为家里所有硬件的互联都需要通过网关。


“真火”还是“虚火”?


鉴于音箱如此的不必要,以智能音箱作为智能家居入口可能本身就是一个伪命题。


这时候可能就会有人出来拿数据打笔者的脸了,怎么就是虚火怎么就是伪命题了?你看人家亚马逊的Echo!


图:亚马逊Echo


根据CIR的报告,自2014年11月发布到2017年1月,亚马逊Echo系列(包括Echo、EchoDot和Tap)用户已达到820万,公司2017年的销量目标是1000万台。


好吧,1000万台的销量绝对不是一个小数字,可是用户的实际使用频率如何呢?据某研究机构调查数据显示,在美国,大约有3600万用户每月会用到一次语音操控的音箱,这就相当惨淡了。


而且,亚马逊Echo的成功是因为它选对了音箱作为入口吗,绝对不是的。Echo的大获成功连亚马逊自己都感到惊讶,这款革命性产品是由亚马逊数百技术人员历时三年才打磨完成,经过了相当长的时间积累。


亚马逊高管Dave Limp曾经说过:我很难计算出为了开发这款产品,我们到底花费了多少人力和物力。


比如说为了把虚拟语音助手Alexa对用户需求做出的回复时延从原来的2.5s-3s降到更低,开发团队做了数千次内部测试,并且每周都要与科学家们合作进行数据分析。最终,团队把延时控制在了1.5秒以内,而这一数字已经远远领衔当时的其他竞争对手。


再比如说,为了让Echo和它内置的虚拟语音助手Alexa能够在用户提出需求后迅速做出拟人化的回答,研发小组提出了“绿野仙踪”测试(the Wizard of Oz experiment)。具体的测试方法是:让一名人类“魔法师”坐在一个房间里,对另一名实验对象所向Echo发出的任何命令做出即时回应。比如,如果实验对象询问Echo“今天纽约的天气怎么样?”时,另一个房间里的“魔法师”就要将回复迅速打出来,并通过Echo的语音将答案发送出去。实验结束后,实验对象需要填写一份满意度问卷,并写出他们喜欢怎样的回复。


“这应该能算做是某种心理学测试了,目的就在于发现人们到底会对何种回应感到满意。我们发狂般的专注于探寻不同回应的满意度,并进行了一系列持续的科学实验。”

——某早期小组成员


相比之下,国内很多智能家居小厂商由于体量问题,往往接不到功能较为强大的软硬件资源;也有某些厂商为了赶上这个风口,在几个月时间内,通过跟一些第三方语音方案和硬件公司的合作,迅速把产品从图纸设计转为实物上市,虽然看起来能用,但整个交互以及体验欠佳,缺乏对使用场景的了解和对用户行为和心理习惯的研究。


另外,国内和国外的“行情”也不尽相同,国内80%以上音频产品200块以内,超过500块月销量超过1万台难度很大。而且中文口音、方言复杂,语音识别、语义理解难度都高于英文更大,要打磨出好的产品体验,能”听“会”说“还会”思考“,需要更长时间。


如果仅仅是因为智能音箱“热”就认为它“对”,继而盲目跟风,最后不过是为媒体再添一份死亡名单罢了。


智能音箱是虚,语音交互是真


总之,智能音箱只是语音的载体之一,笔者相信,若是亚马逊当时用同样的精力做了一款另外的产品,凭借相同的用户体验,也会成功。毕竟,Echo身为音箱,其它功能都挺好,唯有音质却实在不敢恭维。


人与世界的交互,无非是通过用手摸、用眼睛看、用耳朵听。如今,我们与数字产品的交互正处于用手摸(触控技术)和用眼睛看(屏幕)的阶段,下一阶段语音交互或将成为主流。


目前的智能家居多是通过APP进行操控,需要打开手机再打开APP这样多余的过程,其实是为用户增加了困挠,根本就是“”伪智能,《钢铁侠》里托尼•史塔克只需唤一声“给我一杯咖啡”,智能系统就会自动制作一杯美味的咖啡送到面前,这样智能、便捷的家居生活,才是一直以来人们追求的梦想。


互联网女皇”玛丽·米克尔在《2017年度互联网趋势报告》中同样指出,语音是最有效的计算输入形式,将成为人机交互的新范式。相比打字,语音交互的优势明显:人每分钟平均可以说150个单词,打字只能打40个。同时语音交互既简单又方便,一个麦克风即可解决,尤其适合物联网的场景。语音即计算界面,其应用的三大场景是家里、车里、随手,更快更方便就是用户价值所在。


图:互联网女皇报告


总之,语音交互可以以各种设备作为载体,如果还有新来的企业想入局智能家居,暂且放过可怜音箱吧!



往期热文(点击文章标题即可直接阅读):

登录查看更多
0

相关内容

智能音箱,是一个音箱升级的产物,是家庭消费者用语音进行上网的一个工具,比如点播歌曲、上网购物,或是了解天气预报,它也可以对智能家居设备进行控制,比如打开窗帘、设置冰箱温度、提前让热水器升温等。
CVPR 2020 最佳论文与最佳学生论文!
专知会员服务
35+阅读 · 2020年6月17日
【CAAI 2019】自然语言与理解,苏州大学| 周国栋教授
专知会员服务
62+阅读 · 2019年12月1日
微软小冰:全双工语音对话详解
AI100
7+阅读 · 2019年2月10日
人工智能少女的四年蛰伏
乌镇智库
3+阅读 · 2018年8月27日
小冰,请接电话!
微软丹棱街5号
5+阅读 · 2018年4月18日
搜狗推出唇语识别技术 提升远场语音交互
智东西
3+阅读 · 2017年12月14日
深度解读 | 为何众科技巨头都在抢滩语音识别技术?
Arxiv
6+阅读 · 2018年11月1日
Arxiv
5+阅读 · 2018年4月13日
Arxiv
4+阅读 · 2017年11月14日
VIP会员
相关VIP内容
CVPR 2020 最佳论文与最佳学生论文!
专知会员服务
35+阅读 · 2020年6月17日
【CAAI 2019】自然语言与理解,苏州大学| 周国栋教授
专知会员服务
62+阅读 · 2019年12月1日
相关资讯
微软小冰:全双工语音对话详解
AI100
7+阅读 · 2019年2月10日
人工智能少女的四年蛰伏
乌镇智库
3+阅读 · 2018年8月27日
小冰,请接电话!
微软丹棱街5号
5+阅读 · 2018年4月18日
搜狗推出唇语识别技术 提升远场语音交互
智东西
3+阅读 · 2017年12月14日
深度解读 | 为何众科技巨头都在抢滩语音识别技术?
Top
微信扫码咨询专知VIP会员