以语音交互为核心技术,出门问问经历了软硬件结合的坎坷之路。可穿戴、汽车、家居三大场景中,出门问问可能扮演什么样的角色?
/
文|《中国企业家》记者 杨倩 编辑|马吉英
“AI(人工智能)可以打败世界上最聪明的一类人如围棋手,却学不会连五岁小孩都会的自然语言对话,为什么呢?”在朋友圈抛出了这个AI之迷思,李志飞却并没有给出答案。
作为出门问问(Mobvoi)的创始人、CEO,李志飞是国内最早进入人工智能语音交互行业的创业者之一。在他看来,人工智能技术层面最大的瓶颈仍然是自然语言理解,即便是谷歌也没有解决。
凭借着技术积累,出门问问已经在人工智能爆发的前夜趟出了一条路。2017年4月6日,出门问问宣布获得来自德国大众汽车集团的D轮融资,共1.8亿美元。2015年10月20日,谷歌成为出门问问的C轮投资者,金额为数千万美元。这些都是李志飞不曾想到过的。
2017年5月18日,在谷歌开发者大会上,出门问问成为Google Assistant的首批11家官方合作伙伴之一。借力谷歌的生态系统,Tichome海外版智能音箱将为出门问问继续打开海外市场的大门。值得一提的是,当天,由于主演讲拖堂,出门问问与Sony、Panasonic、LG等Google Assistant合作伙伴的LOGO放在一起的PPT演示文档,仅仅显示了三秒,这让李志飞有点遗憾,但更多的是兴奋。
2012年10月,李志飞从美国谷歌总部离职后创立了出门问问。离开谷歌之后,李志飞做了谷歌在中国想做而不能做的事情。
向谷歌致敬
出门问问具有浓厚的谷歌烙印,无论是扁平化管理、“开放创新”的工程师文化,还是LOGO配色,都在向谷歌致敬。从早期对标Google Now语音助手,再到类似Google Assistant的虚拟个人助理“问问”,李志飞所受谷歌的影响显而易见。
李志飞在谷歌工作了三年,担任谷歌总部科学家,从事机器翻译的研究和开发工作,主要开发了谷歌的手机离线翻译系统。更早的2004年,他在约翰霍普金斯大学攻读博士学位,研究的是机器学习与机器翻译,期间开发了开源机器翻译软件Joshua。目前Joshua是世界学术界两大主流机器翻译软件之一。
在谷歌,李志飞看到了下一代人机交互的潜力,他认为,未来语音交互会成为手机触屏、键盘之外重要的交互方式。但在谷歌,他很难推动语音交互成为最主要的交互方式。移动互联网出现后,语料库、语音使用场景大大增加。与李志飞做博士论文的时候相比,人工智能算法改进速度更快了。2012年4月,Siri刚刚发布,语音助手被大众所认识,但Siri没有推出中文服务。李志飞看到了机会,产生了回国创业的冲动。
当时,李志飞既没有团队也没有产品,只用一个简单的demo就打动了红杉资本和真格基金,拿到了数百万元天使轮融资。凭借“谷歌研究院第一个回国创业的科学家”这一身份,李志飞自带光环,在一众创业者中脱颖而出。
为了将人工智能技术落地于日常生活,李志飞带领团队通过近一年的研发,从0到1,构筑起语音识别、语义分析、垂直搜索等核心技术基础。出门问问首先将语音搜索技术应用于微信平台,推出了“出门问问”微信服务号。此后,出门问问还先后在手机APP、谷歌眼镜、智能手表等平台进行尝试。
2013年,时任红杉资本副总裁的曹毅已经投资出门问问,他把后者推荐给了海纳亚洲创投基金(SIG)合伙人王琼。王琼和李志飞只见了两次,就敲定了投资。
第一次见面,李志飞一个人风风火火从上海飞到北京,没有PPT,没有产品,聊了2个多小时,给王琼演示了一下嵌入大众点评、58同城里的语音识别小插件如何收集消费场景的数据、充实语音语料库,帮助公司提高算法精度。比如,当你在大众点评上做测试,说“我家附近的川菜”这样简单的话,它并不认识,只能说“川菜”或者“渝乡人家”,出门问问的插件就是帮助这些O2O场景的公司把语义变成结构化的查询(query),反馈更精确的结果。
李志飞说,创业公司CEO必须强势,有很强的使命感和自己的 agenda(摄影/邓攀)
不到一个星期之后,王琼去上海再次见到了李志飞。那时候出门问问在上海浦东区一所民宅里,租了商住两用的小办公楼,楼下就是大商超,团队一共20多人,大部分是上海四大名校的应届生。李志飞花了1个多小时,给王琼科普了一遍自然语言处理的现状和难点。
王琼在这一整天里,见了出门问问的核心团队,仔细看了公司的研发后台,并且参加了公司周五例行的TGIF(Thanks God It’s Friday)分享。这是沿用谷歌团队庆祝周末的活动,在享用炸鸡啤酒的轻松氛围里分享、提问。当天的分享是研究一款APP为什么成功,王琼感受到了这家公司浓厚的学习氛围。
让王琼下定决心要投的不仅是李志飞对语音交互改变人们生活方式的远见,还有他的工程师能力。李志飞和团队开发了很多提高算法的精度工具,让工程师出身的王琼看到了算法通过工程转化成产品的潜力。
从第一次跟李志飞见面到最后完成打款,SIG一共只用了40多天。“对我来说,这是非常快的一个投资。”王琼说。
别无选择
创业之初,李志飞并没有想做硬件。走上这条软硬结合的道路,对李志飞来说,别无选择。语音交互本身需要一个入口级的产品,依托第三方或者跟别人合作很难。如果只做一个APP,效果并不好。李志飞希望把语音交互集成到硬件操作系统中,像Siri那样按一下就能调出来。
2014年10月,差不多创业两年以后,出门问问进行了一次全新的重要尝试,从纯算法公司开始做软硬件结合。李志飞带领团队研发了全球首款中文智能手表操作系统Ticwear,发布仅仅半年多的时间,就有数万用户通过“刷表”的方式成为Ticwear用户。2015年,出门问问独立研发了“软硬结合”的智能手表Ticwatch。
Ticwear帮助出门问问积累了一批忠实粉丝。出门问问产品副总裁林宜立告诉本刊,2014年下半年,摩托罗拉在海外发了第一款搭载谷歌Android Wear的智能表Moto 360,全球广受好评,但其软件服务在中国却无法使用,出门问问迅速开发出了适配这款手表的Ticwear系统,同时还做了一款“刷表神器”,得到了一大批智能硬件发烧友的喜爱。
“当我们告诉这批用户要出Ticwatch一代,他们已经知道Ticwear迭代好几十版了,系统不错,挺好用的,肯定比Android Wear的本地化、稳定性要好,早期用户就是这么来的。后来我们手表的二代、车载产品,都是通过这批核心粉丝来扩展的。”林宜立说。
但是,从软件跨行到做硬件,李志飞完全不懂行。团队里连一个硬件工程师也没有,他下决心做硬件,却不知道怎么做,非常焦虑。巧合的是,2014年6月,诺基亚中国区开始大范围裁员,李志飞赶紧去亦庄诺基亚研发中心找到了七八位硬件工程师,后来Ticwatch的设计都是由他们操刀。
在林宜立眼中,李志飞非常有冒险精神。“出门问问原来是一个算法公司,自己做软件。后来做硬件的时候,很多人都说你们疯了,硬件是个无底洞,各种坑。”大家都质疑,“一个做算法的AI公司,为什么跑去做智能硬件?”而且做的品类不是最酷炫的智能眼镜或者机器人。早期员工也因为业务转型,流失了一部分。
“第一次量产比较艰难。”李志飞清楚记得,2015年6月3日,Ticwatch第一代手表做了发布会,做了众筹,原定8月发货,但是发不出货。他在山东潍坊的代工厂里天天盯着,错过了SIG的年会。众筹用户在论坛天天逼着他们发货,骂他是骗子、拿钱不下单、囤货,各种声音都有。为了安抚用户,李志飞干脆把内部运行系统透明化,公布每一天的生产进度和物流信息。一个月后,产品终于上市。
SIG后来买了不少京东众筹的第一代问问手表作为年会奖品,人们用完后都吐槽产品太烂了,王琼自己用着也很难受,“蓝牙一会儿就断,功能也很少”。但对于其中的bug,工程师出身的她并不觉得意外。“一开始做出一个特别棒的产品固然更好,却不太真实。创业公司早年的时候,经历越坎坷越好,团队将来能够长得更坚实,基础打得更好。”
王琼发现,通过做手表,李志飞变得更成熟了,更接地气了,对自己不知道的领域会心存敬畏。
度过了这次量产危机,林宜立和团队后来总结了经验教训。现在出门问问的供应链有很多合作伙伴,关键零部件通常有两家供应商,能更好地对冲风险。在李志飞看来,出门问问也因此建立了软硬件、供应链、市场、销售一体的团队,这也是其最大的壁垒所在。
2015年10月,Google投资出门问问的C轮融资完成,后者估值为3亿美元,出门问问至此累计融资7500万美金。
据王琼观察,谷歌对出门问问的投资,“考察时间并不是很短,有合作也有了解,很审慎”。
谷歌与出门问问早有业务合作。2015年9月,Android Wear智能手表操作系统登陆中国,出门问问成为Android Wear在华官方合作伙伴之一,Android Wear里的语音搜索、应用商店都是出门问问在运营。
但新的问题也接踵而来。手表推出后,出门问问发现语音交互频次并没有想象的那么高。人们更多是把手表当做手机屏幕的延伸,看步数、心率,或者看微信短信。
为了寻找更多使用场景,从2016年开始,出门问问开始关注车,并推出第二个硬件产品问问魔镜,“认识到了汽车内生态巨大的重要性”。
联手巨头
问问魔镜吸引到了德国大众汽车集团的注意,因为这家巨头不仅想要维护传统汽车制造领域的霸主地位,还想通过投资、并购、合作的方式布局未来跟汽车服务相关的产业。
大众汽车集团(中国)首席营销官胡波告诉《中国企业家》,随着车联网渗透率越来越高,汽车成了一台超级手机或者移动电脑,而大众汽车集团不能再仅仅满足于传统制造商的定位,更要在车内生态系统的重构上发力。胡波认为,未来人机交互界面会发生很大变化,“下一个人机交互的界面一定是语音,语音是更自然的人机交流形式,是驾驶中更加安全的方式”。
大众汽车集团(中国)首席营销官胡波称,大众汽车集团要在车内生态系统的重构上发力。(摄影/史小兵)
2016年10月,大众集团开始了前期考察和调研,发现出门问问优势很明显:第一,在NLP(自然语言处理)方面有一技之长,包括语音识别准确性、速度,以及语义判断。第二,出门问问已经能把一些服务跟语音识别结合起来。比如,订一张北京到上海的国航机票,人工智能能听懂,但最后能否订上票,需要跟服务供应商衔接起来。出门问问已经搭建了一定规模的供应商平台,能够快速切入服务。第三,出门问问不仅在汽车行业做了很有益的探索,还包括家居环境、可穿戴设备等跨平台愿景。
对于大众集团提出的手表跟汽车交互的想法,出门问问花了一两个星期就做出了样品,这在汽车行业是不可想象的,因为汽车产品周期都是五年以上,这给大众集团带来了不小的冲击。
2017年4月6日,出门问问宣布获得来自大众汽车集团的1.8亿美元D轮融资,双方将共同成立一家合资企业,在汽车领域展开合作。双方各持合资企业50%的股份,致力于研发并应用车载人工智能技术。
“作为不同行业、不同规模的企业,出门问问更像快艇,我们像航母,快艇跟航母如何组成舰队,至少在中国汽车行业没有先例。”胡波表示。
这轮时长半年左右的融资是李志飞印象中最深刻的一轮,“十分艰辛”。
“因为这个案子特别复杂,还涉及到老股东谷歌,有时候我们还为了协调一个开会时间,(涉及到全球)四五个时区,谷歌产品、技术在硅谷山景城,谷歌的律师在纽约,德国大众做投资并购的(团队)在伦敦,我们在北京,为了协调一个会特别复杂。我们当时做了联合国做的事情。”
双方前面有三个月时间接触谈业务、谈产品本身,到了年末才开始启动投资的过程。
2017年春节前,双方在望京一家五星级酒店开了整整三天的闭门会议,双方各有十几个人,出门问问团队介绍产品、技术、未来计划、商业、团队、竞争优势,大众集团介绍大的战略、公司目标、中国市场表现,讨论了“合作+投资”的框架。“那次会议算是一个突破点,在那个点之后进入紧锣密鼓的批准流程,各自向各自的董事会汇报,进入审批。”胡波说。
大众集团之所以选择建立合资公司的方式,是因为整个车联网的构架需要动到产品、研发,包括软硬件,生命周期更长,牵涉到背后的部门更复杂,这样的投资意味着主机厂要有很大决心。“这次投资有一定象征意义,代表一个汽车公司拥抱互联网、拥抱新科技,而且是一个中国本土科技创业公司,把它的技术融入车辆研发和生产中去。”胡波说。
王琼指出,D轮投资是出门问问的转折点,这让李志飞开始思考整个公司的布局。
挑战仍存
2017年4月份,出门问问首款智能音箱Tichome公开亮相,切入智能家居领域。
可穿戴、汽车、家居三大场景中,出门问问可能扮演什么样的角色?跟谁合作?怎样对接最后的消费场景?在王琼看来,这些问题出门问问在去年下半年已经想得很清楚了。
林宜立负责出门问问可穿戴、智能音箱、车载产品、虚拟个人助理各个产品线的统筹协调。他透露,出门问问的愿景是,打造全场景的个人虚拟助理,落地到所有硬件上,比如说问问手表、音箱、车载,用户可以进行自然的人性化交互,获取信息和服务。
针对海外市场,李志飞认为,出门问问在消费产品链条上做了非常多的探索,但是从商业化角度来说还不是很成功。接下来要把过去积累的技术、产品、团队的能力变成商业价值释放出来。出门问问的智能手表去年9月已经在海外售卖,智能音箱今年10月份也会在美国上市,希望利用谷歌软件生态系统,与Amazon的Echo、苹果的HomePod等直接展开竞争。
出门问问现在还做投融资,希望找到一些有业务、没有技术的AI公司,通过出门问问把AI技术整合进去,比如,AI加上金融、汽车、保险、智能硬件等。
即便有巨头认可,李志飞坦言,他每天都很焦虑。每个阶段不知道怎么确立大目标的时候,他会焦虑;谷歌投资完了,下一阶段该怎么做,他也焦虑,对他来说,克服焦虑最好的方法是独处,或者睡一觉。
和投资人定期交流也是必须的。李志飞和王琼保持着每一两个月交流一次的频率。在后者看来,每一年李志飞都在进步,“作为创始人,每把公司带到一个新高度,他自己需要成长三个高度”。
王琼认为,出门问问有了大众这个合作伙伴,从长远来看用户使用量不会有问题。不过,合资公司刚刚运行3个月左右,车载魔镜卖了几千台,盈利尚远。而智能音箱场景很快会成为红海,“硬碰硬打大仗”难以避免。出门问问能最终胜出吗?
(杨倩 yangqian@iceo.com.cn)