今天上午,在2018博鳌亚洲论坛分论坛“未来的生产”现场。
第一句话刚刚说出,“腾讯同传”翻译的中英双语字幕就紧随其后,实时出现在会场两侧的大屏幕上。
这是已创办17年的博鳌亚洲论坛,首次尝试在开幕式及部分论坛现场使用AI同传翻译技术。
论坛之前,一场AI竞争已经开始。
经过与市场上的同类产品竞选,"腾讯同传"成功突围,最终成为2018年博鳌亚洲论坛官方采用的首家AI同传技术展示合作方。
扫码看博鳌双语同传
介绍一下“腾讯同传”这位同事
它是腾讯翻译君联合微信智聆于2017年共同推出的人工智能(AI)同声传译解决方案。
走向博鳌论坛这样顶级的国际会议。其实,可以从腾讯公司一次内部年会说起。
2017年12月腾讯员工大会现场,“腾讯同传”面对几位腾讯高管各异的口音,从容应对,准确翻译了他们的演讲。
这次经历给了“腾讯同传”团队信心,也让他们决定将眼光放在更多有挑战、更高规格水平的会议上。
“腾讯同传”在2018微信公开课Pro、腾讯媒体+峰会和腾讯全球合作伙伴大会等上百场线上线下多语种会议上有过亮相,并取得不俗的表现。
它通过大量实战,积累经验,通过机器深度学习不断自我提升。
在一场多语种大型国际会议中,语言的复杂性和多样性,是腾讯AI同传需要面对的最大挑战。比如汉语方言和各式口音的英语,还有多人讨论时,中英双语的切换......
加之博鳌亚洲论坛作为亚洲最具影响力的政治经济盛会,涵盖政治、经济、科技等多个专业方向,专业术语较多。这些都进一步加大了AI同传的难度。
此前,为了帮助“腾讯同传”学习提高,团队发花了不少精力给它“补课”。
例如:
一些多义词语——
火
他听了我的话,比较火大。
He listened to me and was more angry.
这款游戏最近很火。
This game has been very popular lately.
前面的树林着火了。
the woods ahead are on fire.
“面对这些多义的词语,需要利用上下文信息获取更加准确的意思”
再比如,最近大热的——
绝地求生
机器不知道这是一款游戏,研发人员就告诉它,在某个语境下,“绝地求生”是一款游戏,应该翻译成:
PUBG
而不是“To survive at a dead place”(在绝境处生还)。
又或者,王者荣耀里的人气角色——
不知火舞
如果按照字面意思,很容易翻译成:
I don't know how to dance.
"有些词语有专门的说法,不能由着引擎自己去理解,必须要告诉引擎——这东西英文应该这么翻。"
另一个挑战来自中华大地上的各式方言:
“弗兰”是“湖南”
“秋秋”是“QQ”
“孩子”是“鞋子”
“嘎哈”是“干啥”
“在针对方言较有代表性的地区,项目组会搜集几百条案例,把方言的发音习惯整理归纳进词库中,让AI来学习。”
在备战博鳌亚洲论坛期间,除了这些训练,“腾讯同传”学习了该论坛过往数百份演讲稿。
“AI在一开始会翻译不好,但人类多找点材料让它学习,它就能从不同文本和语境中了解词汇的使用意义。久而久之,它自然就能学到了。”
据“腾讯同传”的研发人员介绍,为了实现高质量的同传,“腾讯同传”结合了腾讯翻译君和微信智聆两方面的能力。
腾讯翻译君——通过自研的神经网络机器翻译技术,优化提升“腾讯同传”翻译系统的翻译质量。
神经网络机器翻译技术能够从语料库中自主学习自动翻译,并将整个句子视作翻译的基本单元,使译文更准确,更符合各个国家的语言习惯。
除了自身的技术能力,来自用户的声音也在帮助翻译君不断成长。在内测期间,腾讯的产品体验官们曾针对翻译君提出多条建议,并被项目组采纳。
目前,翻译君可支持15个语种,其中中英互译引擎已经在新闻、学习和部分科技领域达到业界领先水平。
微信智聆——相当于“腾讯同传”的嘴巴和耳朵。
它是腾讯微信团队自研语音技术产品,致力于语音识别、语音合成、声纹认证等语音技术领域,其中中文语音识别率经过数年打磨已达到业内领先水平。
最后,告诉你一个好消息,这两项技术目前均通过腾讯云向外部开放,日均请求量分别为4亿次和3亿次。
“腾讯同传”是腾讯公司在人工智能领域成功落地应用的一个产品。
团队的同事说,这些产品在国家政治经济文化交流中扮演着桥梁作用,希望未来,能让普通用户跨越语言障碍,享受交流的乐趣。
- 第一时间解读鹅厂最新动态 -