搜狗地图AI突围:激进冒险的策略背后,是与百度高德换道竞争

2017 年 7 月 20 日 量子位 专注报道AI
李根 发自 一路向南G71 
量子位报道 | 公众号 QbitAI

AI代表的新技术可能不光开拓新领域,也在冲击固有市场格局。

新技术+旧产品,这样的趋势变革正在发生。

语音交互+地图=?

2016年年底,网易北京搬离清华科技园启迪科技大厦,隔壁的搜狗随即租下两层,安排搜狗地图和搜狗语音团队入驻。半年后,这两支协同工作的团队推出完全语音驱动的语音地图产品,取名“智能副驾”。

这是一款语音驱动的手机导航地图产品,完全基于手机,完全语音交互。之所以取名“智能副驾”,是因为搜狗希望它在车内充当起“副驾”的作用,有问有答。这算不上是全新的产品,本质还是手机地图导航。

在这个领域,百度和高德占据了大部分市场份额,在移动互联网时代厮杀了整整7年,并且在产品细节和体验上费尽心思,连导航的语音包都花样百出,希望覆盖到所有目标群体。

更主要的是,语音为核心交互的地图导航,在手机之外的终端硬件上早已试水,特别是此前竞争激烈的车机和当前愈加火热的后视镜上,通过语音驱动拿下车载场景,有巨头玩家,也有初创厂商,有前装合作方,也有后装搅局者。

但搜狗智能副驾又确实在创造一种不同的形态。之前没有完全基于手机终端的语音交互地图,也未见百度高德等市场大份额玩家将此提上公开议程——即便这是一个显而易见的大方向。

量子位试用了一下搜狗地图这个支持多轮语音交互的新功能。

你可以用语音说出想去的目的地,如果是去一个公园,还能继续用语音确定抵达哪个门,路线确定后,还能继续用语音进一步规划:比方要求不走二环或者中途加油等。这的确与百度、高德地图的基本语音交互不同。

当然这个功能算不上100%成熟。多轮交互失败的情况并不罕见,如果要增加一个途经点,有可能会打乱之前的行程规划。方言识别肯定是不行,即便是普通话也做不到100%。

另有数据称车载情况下,语音识别准确率只有90%左右。

这是一个有点冒险的尝试。

“趟过不少坑”

显然,对于市场份额更大的厂商来说,冒险的成本更大。

一是基于手机的多轮语音交互,识别准确率是个大问题,从硬件方面的麦克风阵列,到手机运算资源消耗的考量,技术挑战不小。

二是用户体验要求高,一旦上线多轮语音交互,内在要求必定是又快又准,一旦识别有误,或交互“弱智”,用户体验就会大打折扣,除了让人骂娘,可能还会客观上助攻竞争对手。

所以把多轮语音交互带入手机地图,多少算是“激进”之举。但对搜狗地图来说,包袱要小得多,转身和尝试可以快得多,即便技术上的坑不少。

搜狗地图总经理孔祥来也承认,在产品立项的半年内,“在技术上趟过不少坑”。

首先是语音识别问题。车载环境,手机终端,应用环境接近远场识别,需要面临降噪、回声、纠错等语音识别方面的技术挑战,而且导航地图需求中,只要一个字、一个词识别不准,都会造成意图错误,用户体验差。

其次是语义理解。车载环境需要尽可能降低眼和手的使用,全靠人机语音对话理解意图,而多轮交互还会对对话模型和引导模型提出高要求。

最后是数据重构,文字输入客观上要求极尽准确,但语音交互却可能语焉不详,单如“首都机场”,就可能面临“航站楼T1、T2、T3”和“出发/到达”等数据的结构关系构建,换而言之是要让机器模型建立起“知识体系”。

而这次新产品的发布,就是搜狗对上述技术挑战交出的答卷。孔祥来告诉量子位,主要有三方面:

一围绕语音识别,针对性做了4000小时车载语音训练,并专门针对POI(兴趣点,包括商家商铺和标志性建筑物等)数据的优化提升语音识别准确率,还要建立语音、语义、地图概率模型,在多个识别结果中做反向挑选,以此作为准确率辅助手段。

二是在最后产品中准备了10万个对话路径,用启发式对话模型,不断细分搜索结果类型,通过对话引导,让机器理解人类的真正意图。

最后则是POI数据的重构,按照现实世界的隶属关系,组成父子、容器、区域从属关系,为语音对话提供相应精准的领域知识,保障播报和上下文理解能力。

孔祥来还说,在三步语音交互方案实现后,目前的搜狗地图,可能在AI新能力的基础上,拥有了新的产品形态,产生新模式。

但就此会改变手机地图竞争格局吗?

难。

换道竞争

在孔祥来看来,之所以此时上马“智驾副手”,重点并不在重新抢夺手机地图市场份额——意义已非常有限。

“现在市场份额抢夺、用户增长,可能不是最主要的目的。我们现在赋能地图,希望通过这样的尝试去获得车厂的认可。其实语音交互大方向已经被认可了,但之前车厂尝试过语音方案后,认为效果一般,所以现在我们相当于通过手机去进行验证,再进一步获得车厂认可,比我拿着PPT去车厂硬讲,要靠谱很多。”

此外,孔祥来也认为:新的竞争已经不再围绕旧形态展开,即不再围绕“手机地图”展开。

“语音交互引入地图、车内场景后,手机地图可能要被重新定义了,将不再是传统的工具软件。”这位搜狗地图总经理说。

语音交互+地图,会构建一种全新的形态和模式。用户可以在导航中可以用语音说任何事情,不光是导航,可以提供更多服务:问答的能力、搜索水平。这个能力、习惯形成,那远比在地图里做O2O靠谱。

“更加直白地说,相当于得到了一个车内语音交互的入口,就不再是一个地图软件+语音,而是在车内的语音助手,只不过拥有了导航的能力而已,用户在车内的语音助手,提供车内的任何服务,这跟地图导航不再是一个维度的事情。”

听起来像是利用新一代技术,换到了更高的维度参与竞争,然后高维打低维,在新场景新模式中完成“弯道超车”。

但事情也并没有那么简单,百度和高德也在利用新技术加码布局,方向不尽一致而已。

百度的大方向是车,无论是车联网、智能驾驶还是无人车,地图的核心功能是不断精确的路网数据和搜索能力,把AI、AR等一系列新技术叠加到产品中。

而多轮语音交互方面,实际百度已经在车机产品CarLife、后视镜CoDriver中引入,何时迁移应用到手机地图中,可能只是时间问题。

高德的方向是“数据中心”。在最新阐述的AI应用中,高德的方向是“活地图”,利用机器模型搭建交通大脑,在实时数据计算的基础上,把实时路况、动态预测和用户偏好作为体验改善的大方向。

目前,语音交互在高德地图中,被当做了辅助性的搜索手段,技术由科大讯飞提供,这也意味着如果高德在地图导航中上马语音交互,多半会与讯飞进一步合作,产品的磨合或许挑战相对更大。

当然,阿里集团CTO王坚也曾公开表示,利用阿里云的计算力和大数据模型,阿里自主研发的语音交互也迅速取得了突破,但是否会直接赋能高德,目前难以获悉。

不过可以确定的是,原本以为竞合格局已定的领域,现在又因为AI浪潮的到来,展现出新的可能,新一轮比拼再度开启,固有优势带来的机会,有可能稍纵即逝。

这可能会是很长一段时间内的趋势。

关于市场格局

最后,量子位补充一点背景资料。

根据搜狗地图2015年5月公布的数据,在手机地图市场,激活用户共计1.5亿,排名第三。百度地图去年6月公布的数据为5亿用户。高德地图去年10月公布的数据为7亿用户。这些数据,听听就好。

实际上,虽然搜狗地图的知名度,远不能跟输入法、搜索和浏览器相比,但始终是搜狗内部业务中不可或缺的一环,否则很难解释这样一个“买来的”业务,已经让很多用户忘记了“来路”。

老一辈互联网从业者和用户或许有所了解,搜狗地图也并非完全来自搜狗内部的创造孵化。

它的前身是现任搜狗地图总经理孔祥来创立的电子地图服务平台go2map,可追溯至1999年,其后2005年4月,Go2map被搜狐全资收购,成为现在的搜狗地图,孔祥来也进入搜狗,成为地图业务的负责人。

在此前的地图导航竞赛中,搜狗地图一度有机会。在2008年,它是北京奥运的官方合作伙伴,在2011年,它已面向移动端推出了路况导航产品,直至2015年5月,官方披露的数据中,手机客户端的激活用户还有1.5亿,总量排名第三。

但后来的故事我们都知道了,随着阿里收购高德,百度加码O2O,手机地图的竞争逐渐成为B和A的竞技场,二者抢占了更多的市场份额,在整个移动互联网时代,百度和高德为谁是第一,打了整整一个时代。

至今,双方围绕市场份额和排名,依旧口水仗不断,难解难分。

【完】

交流沟通

量子位读者6群开启,对人工智能感兴趣的朋友,欢迎加量子位小助手的微信qbitbot2,申请入群,一起探讨AI。

想要更深一步的交流?

量子位还有自动驾驶NLPCV机器学习等专业讨论群,仅接纳相应领域的一线工程师、研究人员等

同样需要添加qbitbot2为微信好友,提交相应说明,符合条件后将被邀请入群。(审核较严,敬请谅解)

诚挚招聘

量子位正在招募编辑/记者等岗位,工作地点在北京中关村。期待有才气、有热情的同学加入我们!相关细节,请在量子位公众号(QbitAI)对话界面,回复“招聘”两个字。

 扫码强行关注『量子位』

追踪人工智能领域最劲内容


登录查看更多
3

相关内容

【IJCAI2020-华为诺亚】面向深度强化学习的策略迁移框架
专知会员服务
27+阅读 · 2020年5月25日
华为发布《自动驾驶网络解决方案白皮书》
专知会员服务
125+阅读 · 2020年5月22日
阿里巴巴达摩院发布「2020十大科技趋势」
专知会员服务
106+阅读 · 2020年1月2日
【德勤】中国人工智能产业白皮书,68页pdf
专知会员服务
303+阅读 · 2019年12月23日
2019中国硬科技发展白皮书 193页
专知会员服务
82+阅读 · 2019年12月13日
为什么AI公司都在一边融资,一边投资?
腾讯创业
6+阅读 · 2018年9月25日
讯飞来了,一大批人将面临失业!
创业财经汇
5+阅读 · 2018年4月25日
如何看待目前国内AI公司的估值?
雷锋网
4+阅读 · 2017年12月25日
搜狗推出唇语识别技术 提升远场语音交互
智东西
3+阅读 · 2017年12月14日
智能语音成“AI四大项目” 千亿市场待开发
IT时报
3+阅读 · 2017年11月26日
“看脸”的时代,AI到底有多智能?
微软丹棱街5号
3+阅读 · 2017年11月9日
Accelerated Methods for Deep Reinforcement Learning
Arxiv
6+阅读 · 2019年1月10日
Arxiv
4+阅读 · 2018年12月20日
Arxiv
5+阅读 · 2018年12月18日
Arxiv
6+阅读 · 2018年7月9日
Arxiv
11+阅读 · 2018年4月25日
Arxiv
3+阅读 · 2018年3月2日
VIP会员
相关VIP内容
【IJCAI2020-华为诺亚】面向深度强化学习的策略迁移框架
专知会员服务
27+阅读 · 2020年5月25日
华为发布《自动驾驶网络解决方案白皮书》
专知会员服务
125+阅读 · 2020年5月22日
阿里巴巴达摩院发布「2020十大科技趋势」
专知会员服务
106+阅读 · 2020年1月2日
【德勤】中国人工智能产业白皮书,68页pdf
专知会员服务
303+阅读 · 2019年12月23日
2019中国硬科技发展白皮书 193页
专知会员服务
82+阅读 · 2019年12月13日
相关资讯
为什么AI公司都在一边融资,一边投资?
腾讯创业
6+阅读 · 2018年9月25日
讯飞来了,一大批人将面临失业!
创业财经汇
5+阅读 · 2018年4月25日
如何看待目前国内AI公司的估值?
雷锋网
4+阅读 · 2017年12月25日
搜狗推出唇语识别技术 提升远场语音交互
智东西
3+阅读 · 2017年12月14日
智能语音成“AI四大项目” 千亿市场待开发
IT时报
3+阅读 · 2017年11月26日
“看脸”的时代,AI到底有多智能?
微软丹棱街5号
3+阅读 · 2017年11月9日
相关论文
Accelerated Methods for Deep Reinforcement Learning
Arxiv
6+阅读 · 2019年1月10日
Arxiv
4+阅读 · 2018年12月20日
Arxiv
5+阅读 · 2018年12月18日
Arxiv
6+阅读 · 2018年7月9日
Arxiv
11+阅读 · 2018年4月25日
Arxiv
3+阅读 · 2018年3月2日
Top
微信扫码咨询专知VIP会员