在《麻省理工科技评论》今年十大突破性技术中,有一项就是以 AI 技术进行实时翻译的巴别鱼耳塞,不过实现实时翻译的硬件不只是耳塞,特别是在国内,翻译机的市场似乎更大,比如科大讯飞的“晓译”翻译机、搜狗旅行翻译宝等,在微软今年的 Build 开发者大会上,微软 CEO Satya Nadella 在主题演讲拿出了一个中国初创团队的翻译机,这个符合微软策略——把 AI 从 Cloud 云端延伸到 Edge 边缘装置的产品,就是小米旗下生态链企业香蕉出行所推出的魔芋 AI 翻译机。
老将的新战场
小米预计于 7 月中旬在香港 IPO 挂牌,市场推估将筹募 61 亿美元的资金,成为近几年来科技行业最受瞩目的 IPO 案,根据招股书内容,小米 IPO 募得的资金将用到四个方面,其中一个就是投资物联网、人工智能生态链。
而香蕉出行就是获得小米投资的生态链公司之一,其魔芋 AI 翻译机以小米硬件惯有的价格破坏者的特性杀入市场,只卖 249 元,是目前市面上翻译机三分之一、甚至是四分之一的价钱,5 月初在小米的有品网上架,首卖不到 10 分钟就卖出破万台,让外界好奇这个在行业中掀起一阵腥风血雨的新公司是什么来头。
香蕉出行合伙人钟雨飞,小米第 21 号员工。2011 年新浪微博崛起时,小米内部相当看好新媒体的发展潜力,当时便在内部正式成立新媒体组,由钟雨飞负责团队的组建及发展。当时小米的讯息传播、新闻发布都是靠微博,每天微博私信高达万条之多,光是维护微博渠道的团队就达 40 多人,做客服、做热点创意,一句“米粉在哪里、我们就在哪里”的主张,让小米通过微博、微信、百度贴吧、知乎等新媒体带来了巨大的传播声量,之后就是大家都知道的“小米模式”、“米粉经济学”等传奇故事。
香蕉出行 CEO 于世璿,在硬件圈摸爬滚打数十载,曾是富士康集团董事长郭台铭的特助,后来随着在富士康时期的老板一起创业,成立万魔声学(1More)耳机,以金属机壳、医疗级硅胶打造的耳塞却只卖 99 元,在市场上一战成名,而 1More 耳机就是小米的第一家生态链公司。后续他创立锁定车载出行的小贝汽车。由于过去他在小米合作项目上与钟雨飞合作多年,建立了深厚情谊,加上有志一同看好出行领域的创新应用,因此将两间公司业务合并,香蕉出行负责运营平台,合并后的小贝汽车则负责供应链、产品与销售。
图|香蕉出行三位合伙人:CTO 于亮(左)、合伙人钟雨飞(中)、CEO 于世璿(右)。(图片来源:DeepTech)
注入 AI 活水,老产品也有新玩法
不论是实时翻译耳塞还是强调 AI 特色的翻译机,都离不开三项核心:自动语音识别(Automatic Speech Recognition)、机器翻译(Machine Translation)、语音合成(Speech Synthesis、或称 Text to Speech)。当麦克风听到对方讲话的内容,先辨识出这是什么语言如英文、西班牙文等,并且把语音转成文字,第二步通过机器翻译引擎进行文字对文字的翻译,把原始语言翻成目标语言,最后把翻译后的内容进行语音合成,播放出来。近年来因深度学习神经网络的兴起,这三项技术在品质上均获得很大的提升,翻译机这一项老产品也在人工智能相关技术的注入下重获新生。
目前在多语言机器翻译领域,被业界视为技术领先的有三家公司:谷歌、微软、Facebook,他们的优势在于掌握互联网上庞大的数据以及用户反馈,能够快速且持续地优化其机器学习模型及翻译引擎。
其中微软 3 月在官方博客公布新研发的 AI 机器翻译,将中文的新闻翻译成英文已经达到人类专业水准,引起了大量的关注,到了 5 月又挑战机器翻译的难题——口语用法和方言,通过迁移学习和半监督式学习方法,解决方言中对应语句训练资料不足的问题,向外界证实其在机器翻译领域的能力丝毫不逊于对手谷歌。
图|微软在自动语音识别、机器翻译、语音合成的实力在全球名列前茅(图片来源:微软)
在国内推出 AI 翻译机的公司多是强调拥有相关核心技术,像是科大讯飞的强项在于语音识别,搜狗则是机器翻译,不过,香蕉出行的策略很务实,他们清楚自己的强项在硬件和社交,而非自然语言处理及机器翻译,因此他们选择站在巨头的肩膀上,通过与微软的深度合作,以微软的语音识别及机器翻译做为魔芋翻译机的 AI 技术核心。
另外,微软的云计算数据中心和服务器分布在全球范围,也是香蕉出行选择微软的重要因素之一,当翻译机的用户到海外旅行,后端系统会选择当地或邻近的服务器执行翻译任务,香蕉出行 CTO 于亮解释,市场上很多翻译机强调支持离线翻译,离线就必须把模型弄小,准确性往往不如在线模式,因此他们的作法是通过 WiFi 串连云计算,以确保翻译准确性有好的质量,目前魔芋 AI 翻译机可支持 14 种语言,开卖短短一个月,截至目前用户已经带着魔芋翻译机到超过 40 个国家旅游。
翻译机变撩妹神器?社交属性才是未来关键
翻译一直是人类想要解决的沟通痛点,然而对此,一派从软件出发,例如智能手机里的翻译 APP,或谷歌在相机加入实时翻译,把摄像头对准想要翻译的菜单、图像、标示等,就会立刻在手机屏幕上呈现翻译结果;另外一派则做成硬件,不论是耳塞、翻译机、还是 WiFi 分享器等,什么样的方式使用起来最便利、最不突兀尴尬,众人各有不同的看法。
香蕉出行 CEO 于世璿接受 DT 君专访时表示,耳机场景我们考虑过,但是耳塞很难做到真正的人际交互。耳塞要配合手机使用,而且翻译的内容只有戴耳塞的人才听得见,有些 AI 翻译耳塞为了解决这个问题,采取分享耳塞的做法,对话者一人各戴一个耳塞,但多人就不适用,而且可能受限于卫生方面的考量,难以让多数人接受。
但是,只单纯做一个翻译硬件,并不是这家创业公司所想的事,于世璿指出:“纯硬件的产品就像是殭尸,没有灵魂,不过,在我们看来,翻译机不只是翻译,更是一个社交化产品,AI 社交网络才是香蕉出行着眼的方向,”他很明确的说。
当然,让讲着不同语言的人能够互动,本质上就是一种社交,但对香蕉出行来说,翻译只是落地场景之一,所以他们先把小米的智能语音助理小爱放进了魔芋 AI 翻译机中,满足用户快速查找知名景点、天气、播放音乐等需求,翻译机立刻变成一个迷你版、随身版的智能音箱,未来还会接入更多以 AI 优化且围绕社交的云端服务,这就是他所说的 AI 社交网络平台。
对于未来产品的方向或功能,于世璿表示基于商业考量还不便对外说太多,但他仍透露一些方向,例如,他们已经通过算法挖掘使用数据,进一步分析出用户的应用情境,他们发现除了出行问路之外,其实许多人是用来结交朋友。
在今年的台北国际电脑展(Computex)上,微软的摊位就展示了魔芋 AI 翻译机,由于 Computex 有来自世界各地的参展商和买家,香蕉出行的同仁就拿着产品在现场做测试、推广,当对方听到翻译机说出自己国家的语言时,往往会感到非常开心,是一个让初次见面、陌生的人们很好“破冰”的工具。
因此,他们已经规划了一项新功能:在产品中加入发送语音讯息的功能,而且是已经翻译好的讯息,例如用户说一段话,选择要翻译的语言,当对方接收到这条语音讯息时,就会听到是说英文、西班牙文或日文。另外,后续还会进入语言学习及商务翻译两大市场。
于世璿指出,全球翻译产业规模将达 530 亿美元,还有很大的发展空间,“小米的生态链产品都有一个特点,就是做小众市场的大众产品”,就像小米先前推出耳机、手环,都是用一个很有杀伤力的价格,快速攻城掠地。因此魔芋 AI 翻译机采用同样的策略,直接以 249 元杀入市场。
除了耕耘国内市场外,他们也与日本业者洽谈合作,除了提供一般游客翻译机之外,还会在出租车中配置一个专属翻译硬件,除了日本是旅游大国,每年吸引众多游客造访,另一个重点就是 2020 年东京奥运,势必涌入大量的游客、商务客,因此香蕉出行积极出海,希望让魔芋 AI 翻译机打进日本。
249 元背后的秘密
目前国内市场上的翻译机大多超过 1000 元,便宜一点的也接近 700 元,魔芋 AI 翻译机只卖 249 元,而且还用了 CNC 加工技术定制音腔,外观则是采取类似苹果 Macbook 的一体成形金属机身设计。但为什么能卖这么便宜?或许不少人心中都有这个疑问。
于世璿回答得很诚实,也很理性,第一个关键就是渠道及供应链优势,小米生态链有众多的公司,许多零部件可以通过集体采购得到较好的价格,另外他们是通过小米有品售卖,能省下一般渠道 25~30%的抽佣费。再加上于世璿从富士康到 1More 耳机的数十年资历,对于深圳硬件供应链的掌握包括供应商来源、制造控管,对他来说早已是家常便饭,这也是魔芋 AI 翻译机价格能如此犀利的原因之一。
第二个原因在于“只解决一个痛点”,“市面上有很多翻译机反而像智能手机”,有些可以拍照、有些则带屏幕,加了摄像头、面板价格就不可能低,“但是做产品不应该是叠加,只应做一个痛点,”他说,省略其他看似有用、但不实用的功能,就能把产品价格控制在一定水准。
最后一个原因倒是有点像对雷军的致敬,承袭小米的商业理念。雷军先前在小米 6X 手机发布会丢下一句话:“小米硬件综合净利润率永远不会超过 5%,如有超出的部分将全部返还给用户”。这番话尽管遭到行业人士揶揄,但不可否认,小米生态圈的产品像是耳机、扫地机器人、空气净化机等给人的印象往往就是“价格厚道”。而希望让大多数的消费者能够没有负担地享受科技带来的乐趣,这就是香蕉出行的策略:只要让翻译机的价格落在合适的区间,就能从小众市场变成一个大众产品。
香蕉出行三位合伙人于世璿、钟雨飞、于亮过去在互联网社交、声学硬件领域写下成功,走上了自己的创业路,香蕉出行的香蕉二字就是取自让人类能够“相”互“交”流的意思,现在的他们要在出行领域创造一个新的社交模式。
-End-
校审:戴青