深度:讯飞翻译机升级之路!

2018 年 12 月 10 日 智东西

看点:从AI翻译技术到国民翻译机,讯飞是如何做到行业极致的?

讯飞翻译机的诞生,可以说是科大讯飞多年语音产业耕耘和探索中无心插柳却又厚积薄发的一个成果。

早在2015年,科大讯飞就开始关注如何利用既有语音能力来解决国内外实际场景当中的沟通问题。于是,讯飞做了一个大胆的尝试,打造一款软硬件一体化的AI翻译设备,它不仅可以支持普通话和特定少数民族语言的翻译,也支持中文和不同国家语言之间的翻译,并引领翻译机这一市场。

随着讯飞翻译机走红,近两年不少玩家也相继融入这一赛道,甚至还有一些产品打出249元的低价企图搅动这一市场,但讯飞翻译机仍然保持着绝对的领先地位。从今年双11期间的数据来看,讯飞翻译机销售额在同类产品中占比超70%,是其他翻译机销售总额的2倍以上。

▲讯飞翻译机负责人翟吉博

科大讯飞是如何把翻译机做到行业极致的,如今在行业不少玩家涌入、价格战涌现的当下,讯飞又如何在技术、产品、市场等方面继续稳坐行业老大的?近期我们也与讯飞翻译机负责人翟吉博就这些问题进行了深入沟通。

就在刚刚过去的12月7日,讯飞翻译机又进行一次升级,除了新增17个语种翻译外,还重点推出行业AI翻译,以及普通话与粤语之间的互译,继续深耕这一领域。

从AI翻译技术到讯飞翻译机2.0

早在2009年科大讯飞就开始从事汉维、汉藏语言之间的翻译。随后,科大讯飞几乎和谷歌同时将深度神经网络应用到AI与机器翻译中,开始投入机器翻译技术的前期研发。相继拿下2014年IWSLT国际口语机器翻译评测和2015年NIST openMT翻译评测等国际顶级机器翻译大赛冠军后,科大讯飞在机器翻译领域的积淀日益深厚。

紧接着,科大讯飞开始将技术落地,打造AI软硬件一体化设备,正式进行“翻译设备”的研发,并于2016年推出了讯飞晓译翻译机,引领这一品类的发展。

随后在2017年两会期间,总理亲自体验了讯飞翻译机,并给予认可和鼓励支持。2018年两会期间,科大讯飞董事长刘庆峰在采访中又现场展示了一把讯飞翻译机的中英翻译功能。讯飞翻译机也由此走向火热,将翻译机这一品类推向大众视野。

▲科大讯飞董事长刘庆峰展示翻译机功能

尽管科大讯飞很早就布局语音技术以及机器翻译,但翻译机对讯飞而言也是全新的场景。翟吉博告诉智东西,面对翻译机使用场景的具体需求,讯飞不断将自身积累的技术落地场景,场景中新的问题又推动讯飞的AI翻译技术继续向前探索。

▲讯飞翻译机2.0

如果说一代翻译机产品是讯飞AI能力的小试牛刀,那么二代产品则代表着讯飞在消费市场的全面拓展。2017年末,讯飞翻译机业务正式由讯飞消费者事业群组队操盘,进行研发、产品、市场、销售一体的市场化运作。

在此过程中,讯飞开始更加紧密的与消费者进行连接,更加深入面向场景痛点需求推进技术研发。随后,讯飞离线翻译技术于2017年9月率先在行业取得突破,2017年10月份又实现了翻译机端麦克风阵列技术的突破。这些最新的技术都应用在今年4月发布的讯飞翻译机2.0中。

此外,科大讯飞也陆续把口音识别、拍照翻译、行业AI翻译等引入翻译机中,让翻译体验更加准确,也推动讯飞翻译技术继续向前迈进。

如果说翻译机产品的从无到有,科大讯飞扮演了至关重要的角色,完成了这一市场的从0到1,那么技术的迭代则是从1到N的过程,讯飞也在这条道路上不断引领行业发展。

重点升级行业AI翻译

经过大半年的酝酿,在刚刚过去的12月7日讯飞翻译机2.0又迎来一次升级,这次升级主要包括四个方面:

第一,首发行业AI翻译,首批上线医疗/金融/计算机三大行业AI翻译管,解决专业领域翻译难题;

第二,语音翻译语种增加至51种,本次新增17种语言,覆盖地区由升级前的161个国家上升至近200多个国家;

第三,在方言与英语的互译之外,新增普通话语粤语之间的互译,解决国人之间的语言互通;

第四,自建全球化服务节点,语言翻译平均响应时间由升级前的1.2秒缩短至0.6秒,响应速度提升一倍。

其中,行业AI翻译是讯飞翻译机本次升级的最大亮点,也是科大讯飞继离线翻译后在翻译机场景的又一重要进展。

翟吉博解释道,从用户使用场景来说,翻译机的核心是准确性。但是在一个专业领域,以人为例,即使是通用口译水平很高的人,将他放到医疗等专业的场景,他可能也很难做出很好的翻译,机器更是如此。


比如“His SUV is very abnormal”在通用语境下我们可能理解为“他的越野车很不正常”,但在医疗领域,表示“他的标准化摄取值很不正常”。

科大讯飞正是看到除了旅游等日常交流场景外,用户针对专业场景的跨语言交流需求也十分突出,因此今年翻译机重点升级行业AI翻译,并首选医疗、金融和计算机三大需求普遍的行业,让用户在这些场景拥有更准确的翻译体验。

将行业AI翻译落地翻译机,让讯飞翻译机在技术与用户体验上再上一层楼。

占据翻译机市场大半壁江山

如果说从布局机器翻译技术到2016年讯飞翻译机的问世,代表了科大讯飞引领了这一品类,开拓新市场;那么从讯飞翻译机1.0再到翻译机2.0,则代表了讯飞继续引领这一行业。

今年4月讯飞翻译机2.0发布时,科大讯飞执行总裁、消费者BG总裁胡郁曾宣布,讯飞翻译机在这之前的一年中销量达到20万台,覆盖137个国家,服务次数2000万,用户好评率达98%。他当时笑称,最初做翻译机时根本没想到会有这么大需求。

讯飞翻译机的走红,也让不少玩家看到了这一市场中的机会,纷纷涌入这一赛道。比如网易有道在2017年10月推出一款网易有道翻译蛋,搜狗在2018年1月推出搜狗旅行翻译宝等。

就连小米生态链企业香蕉出行也来凑热闹,它在2018年5月推出一款魔芋AI翻译机,还是小米生态链的一贯作风,打出了249元的低价。而讯飞翻译机售价为2999元,尽管价格相差10倍以上,小米生态链企业显然没有打入这一领域。

今年双十一京东翻译机品类排行榜(11月1日~11月11日)显示,讯飞翻译机连续11天稳居第一。据科大讯飞数据显示,双十一期间讯飞翻译机的销售额在同类产品中占比超70%,是其他翻译机销售额总和的2倍以上。


10月25日,科大讯飞在互动平台回复投资者提问时称,讯飞翻译机2.0上线5个月销量就超过20万台,销量增速明显。

可以看到,今年不少玩家涌入翻译机赛道,并推出低价产品企图用硬件的产品思维进行包抄突围,然而科大讯飞仍然继续引领这一行业。

从用户场景出发构建优质体验

智东西通过调查发现,翻译机产品跟其他硬件逻辑大不相同,硬件往往规模越大成本越低,但是翻译机并非如此,用户使用频率越高,服务调用次数越多,就需要花费更大量的服务器成本。

目前来看,翻译机仍是一个强技术导向、强应用场景的产品,尤其是机器翻译技术刚刚处于可商业阶段,这意味着背后在数据、算法等层面大量的研发投入,而消费者主要看重的是翻译机在不同场景是否好用。

翟吉博谈道,翻译机核心价值体现在用户感知端是翻译准确性,它是一个强技术导向的产品,只有通过软硬件的结合,才能够提供给用户更好的体验。只有对用户需求的持续洞察结合技术端的持续积累,翻译机才能在准确性和体验上有持续的迭代。

第一代翻译机产品推出后,所有的翻译服务都必须要在云端完成,这往往要求稳定的网络情况。但后来讯飞发现,国外不同场景网络覆盖情况差别很大,网络问题成为使用翻译机的一大障碍。

在发现离线翻译这个强需求后,讯飞就重点研发离线翻译技术,并于2017年9月上线离线翻译功能,这也是业内首个离线翻译应用。目前,讯飞翻译机支持中文与英、俄、日、韩4种离线翻译。

翻译机能否翻译准确首先取决于它能否“听清”,讯飞在既有的麦克风阵列技术基础上,针对翻译机场景进行优化,这项技术在2017年10月份左右取得进展,并集成在讯飞翻译机2.0中。

此外,方言翻译、行业AI翻译等都是讯飞针对翻译机场景的痛点,在技术与应用上所取得的突破。正是在技术落地场景发过程中, 科大讯飞也探索出一套面向用户的评价标准:听得清、听得懂、译得准、表达美。

可以看到,讯飞翻译机的演进历程就是不断在实际场景中发现问题,推动技术研发解决问题的过程,从而不断保持翻译机产品的行业领先。

翟吉博,讯飞之所以保持产品上的优势,很大原因在于讯飞团队专业的能力和专注的心态,讯飞是把翻译当做一项事业来做的。

技术代差+场景洞察构建讯飞行业优势

智东西从产业链得知,目前已经有不下50家企业涌入AI翻译机这一市场,仅仅是今年推出的为大家所知的产品就有近十款。

这些玩家大致可分为两类,一类是自身掌握AI核心技术的企业,比如科大讯飞、百度、搜狗、分音塔等;另一类大多是消费电子领域的硬件公司,他们依托百度、微软、谷歌等的机器翻译技术落地翻译机产品。

一位行业从业者曾吐槽道,翻译机是一个强技术导向的产品,如今一些硬件公司看到了机会,靠着通用机器翻译技术和产业链落地产品,但这些公司投机性更强,很难真正投入研发。

可见真正推动这一行业前进的仍是有核心AI技术的企业。翟吉博称,在这一行业的早期,更多玩家的涌入对这一市场是好事,才能快速推动这一行业发展,但前提是公司确实是围绕产品创新、技术突破在投入。

相比行业的其他玩家,科大讯飞除了在翻译机产品的先发优势外,最核心的优势在于技术代差与场景深入洞察上。

在技术上,科大讯飞是国内最早从事AI翻译的公司之一,并且不断探索AI技术的前沿领域。目前讯飞不再把语音到语音的翻译看做是语音识别,语音文本翻译和语音合成的组合,而是通过端到端模型,将语音识别、语义理解、语音合成等过程融合在一起,从而实现更好的效果。

翟吉博称,这代表了当前现阶段最先进的语音翻译架构,领先业界。

而在用户使用场景洞察上,正是由于语言是科大讯飞的一项事业,讯飞会投入更多的资源率先发现翻译机应用场景中的痛点问题,依托技术积累与研发,快速推进问题的解决。正是在这一过程中,讯飞推出离线翻译、方言翻译、行业AI翻译等能力,在推动用户体验更加准确的同时,引领行业的发展。

结语:用翻译机引领AI翻译浪潮

翟吉博谈道,未来讯飞翻译机会继续围绕听得清、听得懂、译得准、表达美这四大标准继续发力,让产品越来越人性化,让产品的存在感越来越小,让翻译能力更加准确自然。

可以看到,语言、翻译是科大讯飞的一项重要事业。一个小小的翻译机产品,代表了讯飞AI的落地能力。

反过来翻译机场景中的新问题,用户对翻译场景准确性的需求,也进一步推动讯飞对新技术的探索,不断保持在AI翻译浪潮中的领先。

2018 AI生产力创新奖评选

人工智能相关技术已成为这个时代最具潜力的生产力,AI生产力创新奖旨在表彰中国技术创新的引领者们,是他们将AI技术真正转化会社会生产力,赋能各行各业产业升级。



登录查看更多
0

相关内容

1999年成立,主要技术包括:语音合成和语音识别。
华为发布《自动驾驶网络解决方案白皮书》
专知会员服务
125+阅读 · 2020年5月22日
【德勤】中国人工智能产业白皮书,68页pdf
专知会员服务
301+阅读 · 2019年12月23日
2019中国硬科技发展白皮书 193页
专知会员服务
81+阅读 · 2019年12月13日
【大数据白皮书 2019】中国信息通信研究院
专知会员服务
137+阅读 · 2019年12月12日
【白皮书】“物联网+区块链”应用与发展白皮书-2019
专知会员服务
93+阅读 · 2019年11月13日
刘庆峰:无限风光在险峰
秦朔朋友圈
4+阅读 · 2019年2月6日
讯飞来了,一大批人将面临失业!
创业财经汇
5+阅读 · 2018年4月25日
无人驾驶免费、人脸识别免费、语音识别免费…百度要干啥?
人工智能机器人联盟
4+阅读 · 2017年12月15日
智能语音成“AI四大项目” 千亿市场待开发
IT时报
3+阅读 · 2017年11月26日
李开复:人工智能将加大贫富不均 最大受益者是BAT
人工智能机器人联盟
4+阅读 · 2017年10月28日
Arxiv
5+阅读 · 2019年4月21日
Arxiv
4+阅读 · 2018年9月6日
Arxiv
7+阅读 · 2018年4月11日
VIP会员
相关VIP内容
相关资讯
刘庆峰:无限风光在险峰
秦朔朋友圈
4+阅读 · 2019年2月6日
讯飞来了,一大批人将面临失业!
创业财经汇
5+阅读 · 2018年4月25日
无人驾驶免费、人脸识别免费、语音识别免费…百度要干啥?
人工智能机器人联盟
4+阅读 · 2017年12月15日
智能语音成“AI四大项目” 千亿市场待开发
IT时报
3+阅读 · 2017年11月26日
李开复:人工智能将加大贫富不均 最大受益者是BAT
人工智能机器人联盟
4+阅读 · 2017年10月28日
Top
微信扫码咨询专知VIP会员