天猫精灵 X1 体验:是智能音箱,也是人人都能用的 AI 助手

2017 年 7 月 6 日 极客公园 极客之选的小伙伴


摘要:这款来自天猫的智能音箱,究竟有何特别之处?


2017 年才刚刚过去了一半,各种智能音箱新品便已经让我们有些「应接不暇」了。亚马逊推出了带有屏幕的 Echo Show,微软在 Build 大会上展示了搭载 Cortana 语音助手的智能音箱,苹果则在 WWDC 上发布了 HomePod;国内的联想、喜马拉雅等大大小小的互联网科技公司也都投入到智能音箱领域,相继推出了自己的产品。

7 月 5 号,「犹抱琵笆半遮面」的阿里智能音箱——天猫精灵 X1 终于正式跟大家见面了,作为阿里人工智能实验室首款落地的硬件产品,它在发布前后吸引了业界和科技爱好者的广泛关注。随着阿里这样的「大玩家」加入, 国内智能音箱领域的竞争将会进入更加白热化的阶段。

极客公园也在第一时间拿到了天猫精灵 X1,让我们一起来看看它跟市面上的产品究竟有何不同。


体积小巧,6 麦克风阵列

天猫精灵 X1 采用了圆柱形的设计,它的体积非常小巧,比我们之前评测过的 Google Home 还要小上一圈。它的外壳采部分采用了「二段式」的设计,上半部分是涂有亲肤材质的塑料,下半部分则包裹着纹路细腻的网布。天猫精灵 X1 整体的设计规整、简单,好处是放在家里的任何位置都不显得很突兀。

左为 Google Home,右为天猫精灵 X1

天猫精灵 X1 的顶部有一个物理按键和两个触控按键。物理按键负责关闭/打开麦克风和喇叭,可以实现「一键静音」的功能;触控按键则负责音量的增减,操作时音箱底部会以灯光强弱变化进行反馈。

开启静音后底部会显示红光

在天猫精灵 X1 的顶部还能看到 6 个开口,这便是它的环形麦克风(MIC)阵列。目前智能音箱大体有两种麦克风方案,一种是像 Google Home 那样的双麦克风方案,一种则是像亚马逊 Echo、天猫精灵 X1 这样的麦克风阵列。

双麦克风对于算法的要求较高,但是成本更加低廉;麦克风阵列在降噪和远场语音效果上更具优势,能够确定使用者的位置(指向性),当然成本也更高一些。根据官方的介绍,家庭环境中天猫精灵 X1 可以实现 5 米内的自由对话。从我们的实际体验来看,在环境相对安静的情况下这个距离还可以更远。

底部的灯光会指向使用者的位置

其他硬件配置方面,天猫精灵 X1 使用了 MT8516 芯片,这是 MTK 一款面向智能音频设备的全新芯片,具有低功耗、音频优化等特点。天猫精灵配备了一颗 5W 的全频扬声器,音质表现和配置相同的 Google Home 不相上下,声音「填满」整个客厅是没有任何问题的。

对于缺少屏幕交互的智能音箱来说,通过灯光带来呈现一些信息就变得非常有必要了。天猫精灵 X1 配备了由 12 颗 RGB 灯珠(1600 万色)组成的灯光带,它们利用音箱底部的物理反射进行显示,晚上不会有刺眼的感觉,不过目前似乎还不能自定义灯光的颜色。

天猫精灵 X1 没有内置电池,在它的底部能够看到电源接口和 RESET 按钮,除此之外还能看到一个二维码,通过扫描就能直接跳转到 app 的下载界面,可以说这是一个非常贴心的小设计。


娱乐内容丰富,支持小游戏

在聊到天猫精灵 X1 的具体功能前,首先要夸奖一下它的配网速度,在 app 的指引下很快就能完成设置,几乎没有什么卡壳的地方。我们在测试时,天猫精灵 X1 的设备版本号为 1.1.0-S-20170627.1948

在语音交互层面,天猫精灵 X1 能够实现的功能大致上可以分成三类:查询类、娱乐类、购物类和工具类。在基本的查询方面,天猫精灵能够实现的功能和主流产品基本相同(天气、百科等),这里就不再赘述了,下面主要说说后面几种体验。

天猫精灵的唤醒词语就是「天猫精灵」,识别后底部的灯光会指向你,但是不会在语音上进行反馈,而是直接进入待命状态。值得一提的是,在使用时你可以一口气说出「天猫精灵+控制指令」而不用停顿等待机器的反馈,这样使用时的连贯性更强。

在音频内容上,天猫精灵接入了虾米音乐和喜马拉雅 FM,除此之外还有像「乐只」、「闹闹女巫店」这些服务商提供的个性化内容。如果你不知道要听什么,在天猫精灵 X1 的 app 内会有一个指引,告诉你它都能播放哪些内容。对于之前没有接触过智能音箱的用户来说,这样的引导工作是有一定价值的。

在播放音乐时,可以随时通过唤醒词进行打断,而且天猫精灵 X1 能够识别「暂停」、「下一首」等关键词,也就是说不用通过「天猫精灵」唤醒它就能完成基本的控制操作,这在实际体验中还是非常实用的。通过语音也可以快速调节天猫精灵 X1 的音量。值得一提的是,天猫精灵还支持断点播放,例如你可以直接让它接着播放上次没有听完的相声。

实际的测试情况可以查看下面的视频:


除了常规的收听内容,你还可以和天猫精灵 X1 玩音频游戏。在天猫精灵 X1 的 app 内可以看到,目前它支持「打开声音猜动物」、「我说鸡蛋你说要」、「猜数字」等小游戏,虽然它们都不复杂,但是大家一起玩起来还是很有趣的。我们在办公室测试时,瞬间就吸引了很多人参与其中,相信这些功能小朋友也会非常喜欢。

根据介绍,天猫精灵 X1 的语音交互方案是阿里人工智能实验室自主研发的,其中 NLP (自然语言处理)中文对话引擎的核心技术正在申请技术专利。以我们的体验来看,天猫精灵 X1 的语音交互部分起点还是很高的,不论是唤醒词+语句的连贯使用,还是音乐播放时的打断功能,整体的识别率和反馈速度都有着较好的表现,基本上没有什么恼人的环节。


通过音箱也可以「买买买」了

极客公园的小伙伴对于新产品的接受程度还是非常高的,在亚马逊 Echo、Google Home 等产品推出后也都在第一时间购买了进行体验。但是不得不说,由于国内使用环境的特殊性,我们只能体验到一些基础控制类功能,很难触及到更为核心的服务类功能。

目前在天猫精灵 X1 上,我们体验到了以下跟购物相关的功能:

  • 产品的购买

  • 产品价格查询

  • 物流信息查询

  • 话费充值

当你说出「我想购买 XXX」的指令时,天猫精灵 X1 便会从后台筛选出曾经购买过的产品或热销的产品进行语音播报,对于包邮的产品,通过语音确后可以直接购买(发货到默认地址);而对于不包邮的产品,可以选择加入到购物车中。

需要注意的是,目前通过天猫精灵 X1 仅能购买天猫超市的商品。这么做的原因在于,当下大众对于语音购物的操作流程还不熟悉,天猫商城的商品标准化程度更高,而且生活用品的品牌复购率较高,所以当下在购物的范围上进行一些限制,对于提升音箱的购物体验是有所帮助的。

产品价格查询功能就不再局限于天猫超市的商品,例如当你询问「iPhone 7 」多少钱时,天猫精灵 X1 会告诉你它在天猫 Apple Store 官方旗舰店的价格。当你的淘宝帐号中有正在运输途中的商品,通过「物流信息查询」还可以快速播报它们的物流信息。

实际的测试情况可以查看下面的视频:


话费充值是我们在测试天猫精灵 X1 时最喜欢的一个功能,通常情况下你需要在 app 内经过好几个步骤才能完成充值工作,现在只要告诉天猫精灵 X1 你要充值的手机号和金额,确认后就可以快速完成充值了。通过绑定手机号,还可以省略播报手机号的过程,直接说「给我的手机号充值」就可以了。

涉及到购物环节,想必大家就会关心它的安全问题,这方面天猫精灵 X1 也有所考虑。天猫精灵 X1 支持「个人声纹管理」,当你录入自己的声纹并开启「声纹购」功能后,只有通过口播随机码确认是你的声音后才会购买商品,这样就避免了他人(熊孩子?)误购的行为。天猫精灵官方表示,他们已经经过上万次高保真音响回放攻击的试验,保证了声纹购的安全性。

接下来说说天猫精灵 X1 在工具类功能上的亮点。

天猫精灵 X1 有一个非常实用的功能就是找寻手机。不过和大多数智能硬件通过蓝牙来找寻不同,天猫精灵 X1 通过拨打电话的方式来帮你找到角落里的手机——告诉天猫精灵 X1 你的手机找不到了,然后报出手机号,便能收到它的来电了。需要注意的是,或许是因为后台的通信服务存在运维成本,所以目前每天仅能找 5 次手机(不会有人每天要找 5 次手机吧)。

实际的测试情况可以查看下面的视频:


除此之外,天猫精灵 X1 也支持和智能家居的联动。当你在天猫智能 app 内添加智能硬件后,在天猫精灵的 app 内便能找到已经配对的产品,通过语音便能方便地完成一些开关/设置的操作。当然,控制自家的天猫魔盒也没有什么问题。不过由于此项功能还在测试中,我们添加的两款开关类产品都提示暂不支持,未来有新进展时我们再进行更新。

实际上,天猫精灵 X1 还有一个「隐藏功能」就是蓝牙配对功能。之所以说是「隐藏功能」,是因为它只能通过语音来设置,当你对天猫精灵说出「蓝牙设置」并成功配对后,就可以把它当做一个普通的蓝牙音箱使用了。

除了上面提到的这些,天猫精灵 X1 还有很多实用的功能,例如加减乘除算数、语音备忘等,你甚至可以让它掷一枚硬币,帮助纠结的你做决定。坦率地讲,虽然天猫精灵 X1 到达极客公园的编辑部后我们便一直在测试不同功能,但是直到现在依然有很多我们没有挖掘出来的功能,而且它们还在不断地更新中。

在天猫精灵 X1 的发布会上,阿里还发布了智能语音平台 AliGenie,它可以帮助内容开发者、应用开发者、智能家居开发商和硬件生产商更快速地开发适合语音交互的产品,相信未来在天猫精灵 X1 上还能看到更多的技能出现。


一款「后劲十足」的智能音箱

实际上,阿里对于天猫精灵 X1 的定位是更加广泛的「AI 助手」,只不过智能音箱的概念大家的接受程度更高一些。我们在实际的使用中也能感觉到它不一样的地方——天猫精灵 X1 更像是一个适合一家老少使用的生活中小助手,每个人都能找到自己需要的功能,而不只是一个束之高阁的「极客玩物」。

天猫精灵的售价是 499 元,这个价格带来的「试错成本」还是比较低的。需要说明的是,目前天猫精灵 X1 还处于公测阶段(今年 8 月 8 日正式发布),未来的正式版本或许还会带来一些改进。

作为阿里人工智能实验室的首款 C 端产品,当前天猫精灵 X1 的完成度已经超出了我们的想象,而且依靠阿里在数据、资源和渠道上的优势,都让我们对它的未来充满了期待。如果你正在寻找一款能够用起来的智能音箱,不妨多多关注一下这款产品。

编辑:谁是大英雄

本文由极客公园原创

转载联系 wangxue@geekpark.net



登录查看更多
3

相关内容

阿里巴巴集团旗下B2C平台。天猫由淘宝网打造,整合数千家品牌商、生产商,为商家和消费者之间提供一站式解决方案。 天猫 tmall.com
【ACL2020-Google】逆向工程配置的神经文本生成模型
专知会员服务
16+阅读 · 2020年4月20日
深度神经网络实时物联网图像处理,241页pdf
专知会员服务
76+阅读 · 2020年3月15日
【阿里巴巴】 AI编译器,AI Compiler @ Alibaba,21页ppt
专知会员服务
44+阅读 · 2019年12月22日
2019,再不做私域流量就晚了?
互联网er的早读课
16+阅读 · 2019年4月10日
微软小冰:全双工语音对话详解
AI100
7+阅读 · 2019年2月10日
对话式交互技术原理及流程揭秘
AI前线
5+阅读 · 2018年5月24日
讯飞来了,一大批人将面临失业!
创业财经汇
5+阅读 · 2018年4月25日
搜狗推出唇语识别技术 提升远场语音交互
智东西
3+阅读 · 2017年12月14日
你见过马化腾17年前写的代码吗?
互联网it观察
5+阅读 · 2017年7月3日
Arxiv
14+阅读 · 2020年1月27日
Neural Response Generation with Meta-Words
Arxiv
6+阅读 · 2019年6月14日
Arxiv
3+阅读 · 2018年8月17日
Arxiv
7+阅读 · 2018年1月31日
VIP会员
相关资讯
2019,再不做私域流量就晚了?
互联网er的早读课
16+阅读 · 2019年4月10日
微软小冰:全双工语音对话详解
AI100
7+阅读 · 2019年2月10日
对话式交互技术原理及流程揭秘
AI前线
5+阅读 · 2018年5月24日
讯飞来了,一大批人将面临失业!
创业财经汇
5+阅读 · 2018年4月25日
搜狗推出唇语识别技术 提升远场语音交互
智东西
3+阅读 · 2017年12月14日
你见过马化腾17年前写的代码吗?
互联网it观察
5+阅读 · 2017年7月3日
Top
微信扫码咨询专知VIP会员