「翻译,是讯飞秉着改变人类世界的信念,要一直做下去的事情。」胡郁说。
撰文 | 王艺
编辑 | 微胖
「科大讯飞做翻译,不是要做一个产品,一项技术或者是一个服务。」胡郁说。
在讯飞看来,语言之间的切换,能够直接影响到人类的交流,进而影响到人类未来的命运。因此,胡郁表示,讯飞的翻译,是要秉着改变人类世界的信念一直做下去的事情。
4 月 20 日,讯飞翻译机 2.0 发布,成为讯飞在翻译领域继讯飞听见翻译平台、讯飞晓译翻译机之后的第三个尝试。
讯飞翻译机 2.0 售价 2999,外观采用经典设计,共有三种配色——星辰黑、香槟金和樱花粉。虽然二代产品与一代产品讯飞晓译售价相同,但在功能方面有了很大的提升。
功能上的大范围提升
首先一个非常直观的不同,就是二代产品搭配了屏幕。
产品经理翟吉博现场表示,由于很多一代用户反馈,因为没有屏幕,所以机器本身的联网设置需要依靠手机 APP 进行,非常不方便;加上如果翻译出错了,也看不到是哪里出了问题,没有安全感。因此二代产品搭配了屏幕。
胡郁对屏幕的理解则更宏观。
一代产品的出现是为了促进援疆援藏官员与当地居民的沟通,而当地文字普及率不高,所以没有设计屏幕。而翻译机发展到现在,除了维语和藏语,还走到了更广阔的国际舞台,这些用户对文字是有刚性需求的。
另外,胡郁认为翻译机正担当起文化大使的角色,文字则是文化交流中不可或缺的一部分。二代产品的设计顺应了国际用户的审美和需求,搭配了屏幕。
除此之外,屏幕的出现还使得拍照翻译成为了可能。
在国外,单单满足语音互译是不够的,因为用户有很大一部分需求来自路牌、菜单、说明书看不懂。
针对这一需求,讯飞翻译机 2.0 搭载摄像头,搭配屏幕实现了拍照翻译的功能。科大讯飞表示,目前,翻译机 2.0 能够对包括英、日、韩、法等十一种语言的印刷体以及手写体进行翻译。拍照过后,用户还可以根据自身需求在屏幕上对照片进行剪裁操作。
拍照翻译演示视频
其次,在语种数量方面,晓译支持中、英、日、韩、法、西六种语言,翻译机二代则升级到 33 种语言。据讯飞估计,这 33 种语言覆盖了 95% 的中国用户出境游场景。
除语种数量的提升外,讯飞还在方言层面进行了改进。目前,讯飞翻译机 2.0 支持粤语、四川话、河南话、东北话四种方言。
四川话翻译演示视频
据翟吉博介绍,翻译机的方言能力来自输入法亿级用户对产品的积累和打磨。目前,讯飞输入法已支持 22 种方言。
第三,在联网方面,二代产品为用户提供了「一揽子」解决方案,包括 Wifi 连接、sim 卡插卡连接、以及免 sim 卡上网方案。在翻译机界面中,有一个全球上网功能,支持四十多个国家和地区的流量套餐,且资费与传统运营商相比更实惠。
购买流量套餐后,还能利用翻译机的网络共享功能将翻译机当做热点进行使用。这样,通过翻译机购买的套餐就能支持手机或者电脑的网络连接。
第四,即使准备周全,出国在外,常会遇到网络不佳的情况,因此离线翻译成为用户呼声最大的需求之一。
讯飞翻译机一代产品支持中英离线翻译,讯飞表示,一代产品对于日常用语的离线翻译效果已经可以媲美其在线翻译水平。
在二代产品中,讯飞采用了多语种翻译技术框架,并将很快基于此框架推出更多语种的离线翻译功能,包括日、韩、俄等语种。
翟吉博透露道,讯飞的目标是在世界杯之前,将俄语的在线、离线翻译完整地打包起来,支持去往俄罗斯的中国球迷使用。
除此之外,二代产品能够针对在线、离线翻译进行无感知的智能切换,保障用户在复杂网络环境下得到可靠的服务。
第五,在一些正式的场合,比如商务会谈,需要非常准确的翻译服务。讯飞翻译机二代为类似场合准备了人工翻译方案。讯飞与人工翻译服务平台进行合作。当用户有翻译需求时,可以通过翻译机远程拨通连线,获取实时的人工翻译服务。
总结起来,新一代讯飞翻译机搭载了屏幕,支持 12 种语言的拍照翻译,在线翻译语种扩充到 33 种,并支持四种方言,针对联网服务进行了改进,并对离线翻译进行了语种扩充,此外,还贴心地搭配了远程人工实时翻译的功能。
翻译质量上的持续改进
对于一个翻译硬件来说,功能上的扩充是一方面。另一方面,翻译的准确度也要过关。
胡郁介绍道,讯飞在机器翻译方面已经进行了大量的尝试。
「2010 年到 2014 年之间,我们将深度学习技术用在语音识别以及合成方面,并创新性地在统计模式识别的语音翻译中间用上了基于深度神经网络的语言模型,做出了当时最好的中英文翻译系统。」
2016 年,讯飞提出了使用完全神经网络的方法实现翻译任务。2017 年,讯飞推出基于语义信息量压缩的压缩方法,将原本只能运行在大型服务器上的翻译系统压缩到小型设备上。
2018 年,讯飞推出了「语音到语音」的翻译系统,将传统机器翻译的三段论——语音识别、文本翻译、语音合成组合成一个整体。
胡郁在讯飞翻译机 2.0 发布会现场
胡郁谈到,凭借这些技术,讯飞已经在多个国际大赛中获得佳绩。
比如,在语音合成方面,在第四届英文语音合成技术大赛 CHiME 上取得了第一名,成绩与上一届的第一名相比提升了 100%;在另一个英文语音合成技术大赛 Blizzard Challenge 上连续 12 年获得冠军。
在文本理解方面,讯飞在 Knowledge Base Population 大赛中也曾获得冠军;在近两年大热的 SQuAD 阅读理解的比赛中,讯飞也曾四次刷新到最好成绩。
除「语音到语音」的翻译外,胡郁表示,讯飞还于 2017 年在业内首次推出了全双工语音翻译系统,能够自动识别语种,并像真正的同声传译员一样,一边听一边说,做到实时无间断的翻译工作。
胡郁介绍,最近,讯飞的翻译技术还参加了一次大学英语六级的翻译题考试。满分 15 分,机器得分 12 分。
「应该说是超过了大多数的人类考生。」胡郁说,
「有了六级,我们下一步的目标是专八。其实我们认为六级水平已经能够满足一般旅游场景下的用户需求。」
胡郁谈「为什么你需要翻译机」
如今智能手机广泛普及,在手机上可以做几乎一切事情,翻译也不例外。那么,既然手机里躺着一个翻译 APP,为什么消费者还要购买一个专用的翻译硬件?
胡郁认为,主要原因有三:
第一,手机是为了近讲使用的,一般在打电话或者语音输入时,用户会将麦克风靠在嘴边。而翻译场景中,两个人可能相距较远,周边环境可能会很嘈杂。这时,通过翻译机这样的硬件设备,能够通过专业的手段抑制周边噪声,并提高远讲识别的准确率。
第二,智能硬件的精髓在于无论在什么地方都能「随手就用」。
如果使用手机,需要进行五六步操作才能打开翻译功能,并且过程中还要担心操作是否会触发软件的其他障碍。这时专用硬件的出现就能极大改善用户体验。
第三,翻译场景需要有很好的亲和力。当你把自己的手机举到另一个人的嘴边的时候,对方会明显地感到不舒服,因为这违反了人与人之间安全距离的限定。而翻译机的远讲能力让你不需要将它递到对方嘴边,交互更自然。
专用硬件兴起的翻译市场
讯飞并不是市场上唯一生产翻译机的公司,但却是最早的一个。
2009 年新疆七五事件之后,胡郁来到乌鲁木齐。他看到了种族之间语言隔膜带来的后果,因此,此行的目的,便是前往新疆大学,希望就汉语和维语之间的翻译达成合作。
2010 年,在汉维翻译取得初步成果后,胡郁又来到西藏,与西藏大学建立联合实验室,共同研发汉语和藏语之间的翻译技术。
经过六年时间的打磨,2015 年和 2016 年,讯飞先后发布了维语和藏语翻译的发布会。
当时,为了更好地援助新疆和西藏的建设,每个省都有援藏和援疆计划。讯飞看到,这一计划最大的阻碍在于援藏援疆干部和当地的老百姓没有办法进行沟通,且当地老百姓多不识字。
基于这种情况,响应国家需求,讯飞晓译翻译机应运而生。
进入 2017 年,翻译硬件市场突然火爆。不仅讯飞,网易有道、搜狗都相继推出了自己的翻译硬件设备。这一方面得益于境外游市场的繁荣,另一方面,长期旅居在外的商务人士也意识到了自己对翻译硬件的需求。
(更多关于翻译机背后的逻辑,请点击这里)
就在讯飞发布翻译机 2.0 的同一周,网易有道将硬件产品定位为最新公司战略的一环。网易有道目前已经推出的产品名为「翻译蛋」,主打高性价比,售价 699,云端连接有道的在线翻译技术,不支持离线翻译。有道表示,将在二代产品中新增里线翻译功能。
3 月初,搜狗发布了旅行翻译宝。售价 1498 元,搭配屏幕以及拍照翻译功能,支持离线翻译。技术负责人陈伟表示,目前搜狗旅行翻译宝的离线模型已经压缩到在线模型的 1/48,且精度接近无损,还能实时响应。
除讯飞、网易、搜狗等大厂外,一些初创公司例如分音塔科技也推出了一些翻译硬件设备。然而,也有一些翻译软件公司不看好硬件市场。
靠天气软件「彩云天气」一炮打响的彩云科技也于 2017 年 3 月上线了翻译软件「彩云晓译」。创始人兼 CEO 袁行远认为,如果这些翻译硬件没有超过 APP 的用户体验,只是卖一个装上翻译 APP 的专用手机的话,是在拿名声换钱。
「靠软件赚钱要等到什么时候。」袁行远说。
关于专用的翻译硬件,搜狗认为,当前翻译宝形态的产品只是一个过渡,未来翻译技术将被嵌入至耳机、眼镜等硬件中。据悉,搜狗翻译耳机的市场调研已经开始进行。
那么,翻译机到底是昙花一现还是真正的刚需,讯飞交给我们这样一串数字。2017 年,讯飞晓译翻译机销量 20 万台,覆盖 137 个国家,服务次数超过 2000 万次,用户好评率达 98%。
机器之能开年对话
8位AI行业局内人讲述对过去、对未来的看法
点击下方,阅读更多