声智科技:语音赛道竞争的「惨烈与终局」| AI TALK

2018 年 6 月 7 日 机器之能

5 月 25 - 27 日,在杭州,上千名志愿者、出品人完成了一场为年青人举办的大会。按照发起人阿里巴巴技术委员会主席王坚的说法,2050 是一个年份,不太近,充满想象,也不太远,我们都能活着看到。

在第一次听到「让世界离年青人更近,让年青人离世界更近」这样的办会理念时,我们想起机器之心用前沿科技内容聚合的全球 AI 青年,从在象牙塔里研究技术到毕业后面临创业、择业的选项,他们不仅应该关心技术走向,也需要了解因为这些技术的创新促成了产业正在发生的商业变革。


而那些被我们报道过的 AI 创业公司,大多恰好处于成长周期的少年或是青年阶段,如何生存和发展也同样是他们心头大事。


在 2050 大会上,机器之心发起了一场以《AI 技术公司的活法和前景是什么》为主题的论坛,云从科技、体素科技、深瞐科技、声智科技、一知智能和 Udacity 分别谈了谈 AI 技术如何才能「落地为安」。以下为第四支演讲视频——声智科技创始人陈孝良《语音创业公司的生存与未来思考》:




要点速览:


  1. 任何行业兴起的时候,特别是趋势非常清晰、在一个赛道里面,项目赚钱或者落地的时候,质疑和竞争是最大的。


  2. 巨头在这个赛道里面已经把价格压的最低,而且所有的巨头都在补贴。不管创业公司有什么优势,在实力面前都是无用的。巨头有一个杀手锏:我就是有钱!你怎么做你的产品?


  3. 如果大家做平台的话,可以想想平台是离钱最远的,没有形成规模之前,平台是不可变现的。芯片是硬投入的事情,芯片的核心不在于设计,而在于工艺和生态。而工艺和生态,恰恰又不是创业公司擅长的,因为创业公司一开始不能做的太重。


  4. 不管互联网还是移动互联网,都没有改变商业的本质,只是改变了花钱的手段。也就是说,不管做产品、技术还是服务还是平台,你能不能满足从消费者那拿钱的基本要素。


  5. 从公司角度看,我们所提供的产品也好,服务也好,首先要解决先免费还是先收费?想清楚了自己的商业模式,创业公司会面对一个非常严重的挑战:前面几年,你都是在亏损。


  6. 未来 AI 时代与传统互联网时代非常大的不同是:语音里面天然带着数据,数据里面天然包含丰富的信息,而且这个信息蕴含着人们的思想,这在未来是一个超过万亿的庞大市场。


  7. 很多时候创新之源率先枯竭,创新真正的落地的时候,有所发挥的反而是很多创业公司,我们要清醒地认识到,创业公司自身的核心能力以及它的边界。


陈孝良:


一、语音赛道的竞争为什么如此惨烈?


在座的各位将来都要走上创业这条路。但大多数时候,我们都只看到了创业的表象,真实的创业过程并不像大家想象的那么光鲜亮丽。


我更想讲一下创业过程中的痛苦和煎熬。


我认为最重要的是,在创业之前,要有一个比较清醒的认识,创业最考验我们的思想和韧性。


首先必须得学着做一件事:不要鄙视我们不懂的东西,也不要迷恋我们很擅长的东西。在这个过程中,你可能会渐渐明白如何在新兴市场的竞争中突围。


本次讲坛中,涉及语音技术的公司只有我们一家。我简单讲一下声智科技和科大讯飞的区别。


说一个非常简单的绕口令,看看能翻译到什么程度:


「刘奶奶给牛奶奶拿牛奶」。


翻译效果确实不错,可见科大讯达的语音识别技术做的还是很出色的。我也相信,很多人也已经开始使用智能音箱。我们声智科技要解决的问题,就是与之相关的远场语音识别,也就是把话筒拿掉。


AI 应用,要解决复杂的场景问题。但是,很多时候探讨 AI,都在探讨计算机学科的问题,往往忽略了物理层面的问题。


事实上,人生活在物理空间中。


如果不依赖麦克风以及旁边的喇叭(例如,拿掉麦克风或者在小会场里探讨的时候),如何才能保证在更远处的人能听到我们的声音,而且不会造成大家的误解呢?几个字的识别问题就导致语句的意思完全不一样。这也是今后在技术层面上需要解决的重要问题。


在我看来,语音赛道的创业公司十分煎熬。即便是科大讯飞这样的公司,很多媒体的批评声也大于赞扬声。


为什么会这样?


任何行业兴起的时候,特别是趋势非常清晰、在一个赛道里面,项目赚钱或者落地的时候,质疑和竞争是最大的。


让我们从根本上考虑语音面临更大质疑和竞争的深层次原因。


回顾一下过去三十年,从 PC 兴起到互联网,到移动互联网的发展历程。


我相信一些 80 后的朋友可能会有清晰的记忆。当时,学计算机教材还很厚。我当年读大学的时候要花很多时间考所谓的微软专家、思科专家,那个时候还是以此引以为自豪。现在,有多少需要考这种计算机的专家呢?


这就是非常大的改变。现在任何消费类产品的说明书越来越薄,甚至没有说明书。这说明机器越来越强大,使用方法也更加简单。


然而,即便到这个程度,还是必须花很多时间去学习:学习编程、PS 技巧、驾驶,等等。


但是,这些为所谓的人类发展,创造了多大的贡献呢?这些工作其实是重复性的,没有意义。


但是,我们又不得不学习,因为这是整个行业的导向。如果不会计算机和驾车,收入不能大幅度提升,它占据了我们很多本来应该用来创造的时间,约束了我们的创造力。


除了为了增加收入,人类为什么要不断学习去适应机器呢?我们在年复一年日复一日的工作中带来了多少创新,给大家带来了多少快乐?


实际上,很多 IT 人员的重复劳动是没有用的,没有体现出我们应该体现的价值。


有人就说,为什么机器不能换个角度,来学习我们人类呢?这就意味,人工智能兴起,可能要从以机器为中心转向以人类为中心。


原来花很多时间学习机器,适应机器,到了真正人工智能时代,机器要学习、适应人类的规则。


这就有一个必须突破的点:人类离不开社交和交流,如果机器学习我们,也必须学习人类与机器交互的方式。


有专家提到,大部分交互信息 70% 到 80% 来自视觉,但实际上,在人类的交流和知识传播中,差不多 70% 的信息是来自于语音。这就像我不能通过各种动作给大家讲解现在需要讨论的内容。


最终交互行为的落地,还是需要靠语音。未来,语音是一个很重要的交互方式。


马云总提到机器智能时代这个概念,机器智能时代是非常重要的交互方式的变革,它解决了人和机器互相交互的问题,这是最根本的变化,因为这并不是像从键鼠到控制到触摸屏控制这种简单的功能性变化。


未来 AI 时代与传统互联网时代非常大的不同是:语音里面天然带着数据,数据里面天然包含丰富的信息,而且这个信息蕴含着人们的思想,这在未来是一个超过万亿的庞大市场。


现在,语音已经覆盖了智能家居、手机、平板、汽车、机器人,等等。所有可以看到的消费类电子设备都会加上语音,因为机器要想智能,首先要听的懂你的话。


现在,它已经覆盖了我们所有的内容、控制、办公、游戏、服务等场景,正是因为市场太大了,所以这里面竞争的非常激烈。


语音产业落地中,大家最熟悉的就是智能音箱。现在,一起看看智能音箱领域的相关统计数据:


从语音技术走向落地以后,智能音箱会快速的在全球普及。美国差不多 16% 的家庭拥有了智能音箱,大概 65% 使用过智能音箱的人已经无法再回到没有智能音箱的时代,人类的习惯已经慢慢改变了。


在中国,超过 50% 的人有意愿购买智能音箱。


未来可能发生很多让我们听起来就很兴奋的事情,但是,最靠谱、能落地的还是和智能家居相关的产业,我们还是希望身边的设备首先能智能化。这跟我们平时感觉还是比较一致的。


在中国,未来的年轻化趋势很明显,结婚率生育率也在不断下降。虽然年轻人多了,但整个社会走向老龄化,而且,年轻一代和上一代人的期望是不一样的,很多年轻人对机器智能的期待会更大。


未来这是一个巨大的市场,就因为市场太大了,所以也引发了极为惨烈的全球竞争。


就智能音箱而言,全球市值排在前列的公司都在做,包括亚马逊、谷歌、苹果、微软、三星。


国内更不用说。腾讯、百度、小米、阿里、华为,五大巨头都是我们声智科技的客户,这是很有意思的现象。


所有有钱的公司都在做同一件很小的产品,更可怕的是,这些巨头有钱。刚开始做,价格就被压到了极低的水平。


国外花 29 刀,在国内花 79 元人民币就可以买一款远场语音交互为主的人工智能设备。以前,这个价钱买蓝牙音箱都很困难,但事实就是如此。


这就是为什么说,在真正行业兴起的时候竞争会非常惨烈。


互联网巨头尤其是不擅长硬件产品,而他们都做了。更可怕的是,他们把平台也做了。我们看一下国内,百度的 Dure OS、阿里的 Ali Genies、腾讯还有两套叮当和小微、思必驰有 DUI、小米有小爱开放平台、讯飞有一个开放平台。


国外,亚马逊的 Alexa、微软的 Cortana、谷歌的 Assistant、苹果的 Siri、三星的 Bixby。


也就是说,巨头都开始在这个领域布局,关键是做的很便宜。而平台要么是 OPEN 的,要么是 FREE 的,平台不可能开源,但是技术可以开源,这就是现状。


二、先要选一个方向


所以大家想想,创业要选一个方向。


但是,选定一个方向之后会发现,在这个赛道上没有所谓你比别人更聪明的说法。


以前很多人把创业比喻成马拉松,如果事实如此就太好了,因为马拉松有起点和终点还有赛道,创业却没有明确的起点和终点。


哪有方向?哪有赛道?这都是需要摸索出来的,也就是最煎熬、痛苦的地方。


如果你跑错了方向,你的努力会产生相反的结果,实际上你距离真正的成功会越来越远,生存下来很难。


这就导致很多创业公司的一些改变。


在语音赛道里面,很多公司转向做产品,有不少的创业公司推出智能音箱或者智能的语音交互设备。


但是,巨头在这个赛道里面已经把价格压的最低,而且所有的巨头都在补贴。不管创业公司有什么优势,在实力面前都是无用的。巨头有一个杀手锏:我就是有钱!你怎么做你的产品?


你说我的产品和巨头的有差异,你很智能,但巨头说:「我就是有钱!我卖的这么便宜。」


你说你音质很好,巨头说:「我就是有钱,我做的和你一样,还是卖的便宜」。


这就没有办法了。我们创业公司再能融钱(也不行),(何况)钱还是巨头拿来的,这是非常残酷的现实。


做产品的时候怎么突围、和巨头做出差异,特别是在这种主赛道中?如果谁能够做到这一点,未来当然会是一个非常伟大的公司。


我们也要相信,机会是可以等出来。


还有另外一个主赛道:平台。


如果大家做平台的话,可以想想平台是离钱最远的,没有形成规模之前,平台是不可变现的。


两个典型的例子:一个是滴滴,一个是美团。这是非常典型的移动互联网时代的两个平台公司,当它谋求赚钱的时候就引起了大家很多的质疑。


如果我们也是一个平台公司的话,你跟机器说一句话,我们就要收钱,我相信大家就不会再觉得我们这些创业公司多么伟大,我们做的技术要更好,因为有很多人会以更挑剔的眼光看。


所有的巨头在平台方面也都没有很好的商业模式,优酷、爱奇艺也没有赚钱,反而直播赚了一些钱,那是另外一个层面的说法。很多时候,不一定能找到像快手、抖音更好地在某一个领域里面落地,或者有更好的方式切入。


现在,让我们聊聊芯片和服务。


很多创业公司转型做芯片,毕竟,中兴事件以后芯片成为国家关注的焦点,做芯片至少会得到国家关注。


但是,芯片是硬投入的事情,芯片的核心不在于设计,而在于工艺和生态。而工艺和生态,恰恰又不是创业公司擅长的,因为创业公司一开始不能做的太重。


如果给你十个亿,你半年时间烧九个亿,你觉得投资人会怎么想?


九个亿得到的结果是一堆厂房和线路,你还说这是第一批,先试一试,后面还有五代线,他会怎么想?如果全依赖国家投资就不一样了,那是另外一个结果。比如,京东方,前面六七代线都是国家投了巨资的,但是,他是国企啊。公司属性不一样,决定了方式不一样。


还有一个点就是服务,现在主要是做方案,这也是我们声智科技主要定位的方向。


也就是说,我们只能做一下拆分,既然巨头有钱,就选择为巨头服务,这是比较简单的方法。


未来这种服务能不能进行扩展呢?如果未来你们要创业,或者有机会加入我们声智科技,大家可以共同去想这个问题。


三、想清楚商业模式:先免费还是先收费?


我们刚才说的比较沉重,但是,还要相信未来,语音市场这么巨大,肯定未来能够孕育更多的巨头企业。


现在的一个大问题是:到底谁能成为巨头?很多投资人也问我,为什么说未来你们会更有机会?


先从消费者角度来看,钱怎么花出去的。


到现在为止,我们的钱还是花在两个方面:第一个是买东西,另外一个就是买服务。


不管互联网还是移动互联网,都没有改变商业的本质,只是改变了花钱的手段。也就是说,不管做产品、技术还是服务还是平台,你能不能满足从消费者那里拿钱的基本要素。


最终达到的目的是一样的,手段可以有所创新。


比如支付,可以用微信,可以用支付宝,其实核心还是说你的账户里面一定要有钱。这是一个根本的点。


也就是说,技术事实上没有改变很多本质的事情,只是提升了效率,改变了很多手段和习惯,但是,核心诉求没有改变。


既然明白消费者的钱怎么花出去的,很多时候从公司角度看,我们所提供的产品也好,服务也好,首先要解决先免费还是先收费?


这很重要。


我们不妨想一下,互联网发展早期,无论是社交、电商、搜索包括邮箱之类的业务,全是免费的。


但在今天来看,大家想想这些还免费吗?有句话叫「羊毛出在猪身上,狗买单」,但是现在很多业务都是直接收费的。


未来很多 AI 技术和服务是不是要收费?按照国内目前的情况还看不出问题的答案。


我们不妨先看一下国外的情况,特别是语音赛道里面还是很清晰的:还是要想办法把钱从消费者那里收回来。


典型的服务,我们可以看一下讯飞,不断地提供识别、翻译的服务,然后不断收钱,这种售价方式很简单。比如,按照你的时长,讲了快 20 分钟,就收这 20 分钟的钱。


还有一个简单的方法是按调用,是一种比较取巧的方式,因为调用次数是很高的。


但是,这种调用的方法在国内是不可行的,因为我们需要把所有的技术打包在一起才能收费。国外的公司目前还处于探索阶段,不过国内未来肯定是这样的趋势。


通常来说,我们国内会比国外差半年到一年的周期,但是,我相信这种收费会更远,我们想一下邮箱收费的时候差不多差了十年的间隔。


大家未来创业的时候,要想清楚一件事:如果刚开始要免费,那么,你至少要对投资人有一个说法,如果刚开始收费,收费如何界定?怎么收费要有一个参考。


有一点很重要。大家不要认为创业公司是创新的源泉,其实不是。创业公司只是把创新最终落地,很多创新工作其实是来源于巨头公司和科研机构。这也就是为什么我们这一代创业人大部分有科研背景,因为创业公司大多没有钱做前瞻研究,因为我们需要做很多商业落地工作,把原先积累的东西释放出来。


举个简单的例子,智能手机不是出现在小米、苹果,而是诺基亚。


有意思的是,经常做创新的公司被颠覆了。语音行业里面有一个伟大的实验室是贝尔实验室,前几年已经解散了。


很多时候创新之源率先枯竭,创新真正的落地的时候,有所发挥的反而是很多创业公司,我们要清醒地认识到,创业公司的自身的核心能力以及它的边界。


四、另一个严重挑战:连续亏损


即便你未来下了决心要创业,也想清楚了自己的商业模式:「先免费后收费」,「还是先收费、拼价格,最后有的方面再免费」这些策略性问题,创业公司会面对一个非常严重的挑战:基本上前面几年你都是在亏损。


如果能三年做到盈亏持平,你们就是一家非常伟大的公司了。但是,很多时候你还不能做到盈利,因为竞争非常残酷。


如果把心思放在财务指标上就会带来非常严重的后果:在整个竞争链条当中可能会投入不足。因为决定公司上限的不是公司的核心技术,而是公司的短板。


我们声智科技发展到一百人左右时,公司管理就是最大的挑战和考验。如果突破不了这个障碍,在公司长期发展中,就无法形成更有效的竞争力。人数越多公司的效率可能会下降。


当创业公司效率下降时就会出现一些很致命的问题:


本来所有的优势都是效率极高,人均产出极高,而不是你想的比巨头周到,巨头有很强大的战略团队,不可能你想到它们想不到的东西。在执行过程中,由于组织结构限制,巨头会遇到一些问题,那么,创业公司是否也会遇到这样的问题呢?


这是一个值得我们深思的地方,举个简单的例子:


十多年前,很多内存、电子元器件厂商都在亏损。在它们亏损的时候,国内的厂商没有坚决地投入,反而造成了现在我们的内存只有韩国、日本、和美国供应。


这几年内存价格在几倍的往上增长,也就是说,尽管它们前面十年都处于亏损状态,但在最近的两三年就一次性收回了成本,这是非常重要的策略。


还有两家比较典型的公司的例子。


在人工智能领域,大家都认为谷歌是领头羊,最近谷歌修改了自己的员工守则,把「不作恶」的守则删掉了,你想想压力是多么的大。


当我们提到 AI 的时候,亏损了近 20 年的亚马逊实际上是最领先的。你可以看看他们的股票曲线。


再如英伟达,十多年前有多少人会关注英伟达呢?大家可以看一下它们的股票曲线。


一个公司的股票曲线反应了很多问题,从趋势上看这是一条非常完美的曲线,但是,它们前面十多年是亏损的,它们经历过怎样的煎熬。


当你们创业的时候,面对股东会会体验到这种痛苦,因为没有任何一个股东喜欢听到你说我们今年亏损了,我们不能向股东分红。


你们能不能挺过去,这是非常关键的。


归根到底,创业公司的方向也好,未来也好,策略也好,包括执行也好,核心观念是说你在竞争大潮中是不是能够活下来。


每年都可以看到很多新兴的公司,也会看到很多倒下的公司,甚至是一些有规模的巨头公司倒下。如果我们要去创业的时候,你得想清楚:


你能不能熬下来,能不能面对质疑和责难,坚守下来!你的信仰永远是不能改变的。当你改变的时候或者稍微犹豫的时候,可能会带动整个链条,正如蝴蝶效应。


很多时候,创业人的松懈会导致这个公司面临链条式的坍塌危险,这个是我们需要考虑的问题。


五、看准后,敢做才最重要


当然了,我们不能总是说这么沉重的话题,下面我会给大家一个更实际具象的未来表述。


首先,语音市场很大。大家在用很多智能设备的时候,你会发现语音即搜索。


不妨和人类类比一下。


你们和身旁的牛人交流和学习的时候,最好的方法不是看书,而是找一个更懂的、更资深的人直接去请教。未来的人工智能化的搜索是更精准的、更权威的搜索,而不是在搜索框中输入问题。


搜索曾经是互联网时代非常成功的入口,已经成功的打造了谷歌和百度。而移动互联网时代,APP 实际上把搜索折叠了,从手机 APP 中可以获知我们感兴趣的信息。


AI 时代,很多的时候,说一句话就可以搜索了,没有必要打开 APP,这也是我们将音箱成为「黑盒子」的原因。


最有想象力的一点就是,语音即服务。


一些女孩子,在购买化妆品衣服的时候,很多决策很容易受你们闺蜜圈的影响。男孩子也是这样的,买消费类电子产品的时候会关注一下周边的圈子,不管炫耀也好,还是实用也好,我们周围的建议通常会改变我们的决策。


稍微想象一下这一点,你就会觉得不得了。


如果未来的机器一直在影响你的决策,这是一个多么巨大同时也可怕的市场。


举例而言,如果洗衣机告诉你,洗衣液不够了,直接按上次的购物单下一个单,是否可以?它不会告诉你比上次买的多一毛钱。


如果冰箱告诉你鸡蛋不够了,买了十个,可不可以,你肯定说可以。你不会关心京东送的还是阿里送的。


你只会关心什么时候能送到,鸡蛋质量好不好。甚至你也不会在意,不同派送公司之间的差价,因为未来生活物质是极大丰富的。


对未来市场来说,意味着什么呢?单价只差几分钱,量足够大了,这是多大一笔财富!


语音遭受的质疑和挑战很大,就是因为它未来市场太过庞大,全球的巨头都会加入进来,也会进行惨烈地竞争,未来,这种竞争也意味着巨大的机遇。


未来,整个平台形成和整个产品铺满的时候,也会有很多新的、模式类的创业机会。机会总是存在的,创业不会是一波一波的,是什么时候都会有的,创意随时随地都能被发现。


关键只在于你是不是真正去琢磨它、花时间去思考了、看准后是否敢投入、敢做,这非常重要。


推荐阅读


云从科技:人脸识别技术照进产业场景的距离有多远 | AI TALK

登录查看更多
0

相关内容

智能音箱,是一个音箱升级的产物,是家庭消费者用语音进行上网的一个工具,比如点播歌曲、上网购物,或是了解天气预报,它也可以对智能家居设备进行控制,比如打开窗帘、设置冰箱温度、提前让热水器升温等。
商业数据分析,39页ppt
专知会员服务
159+阅读 · 2020年6月2日
德勤:2020技术趋势报告,120页pdf
专知会员服务
190+阅读 · 2020年3月31日
Python数据分析:过去、现在和未来,52页ppt
专知会员服务
99+阅读 · 2020年3月9日
阿里巴巴达摩院发布「2020十大科技趋势」
专知会员服务
106+阅读 · 2020年1月2日
2019中国硬科技发展白皮书 193页
专知会员服务
81+阅读 · 2019年12月13日
DARPA | 世界上最大的“5G+AI+仿真”探索项目
走向智能论坛
30+阅读 · 2019年7月29日
中央再批人工智能伪创新,90%以上AI都不靠谱
THU数据派
7+阅读 · 2017年12月6日
【智能零售】零售业的未来是让零售变得无界
产业智能官
3+阅读 · 2017年10月18日
Neural Speech Synthesis with Transformer Network
Arxiv
5+阅读 · 2019年1月30日
Arxiv
8+阅读 · 2018年11月27日
Arxiv
5+阅读 · 2018年10月4日
VIP会员
Top
微信扫码咨询专知VIP会员