闻其声,见其意,藏在字幕后的功臣

2019 年 9 月 11 日 程序猿

北京时间9月11日凌晨1点,主题为“致创新”的2019苹果秋季新品发布会在美国加州的史蒂夫·乔布斯剧院举办,和往年的发布会一样,苹果的发布会仍然是属于数码行业以及数码爱好者的狂欢。

 

除了有三款新iPhone即将与大家见面外,发布会上还带来了iPad、AppleWatch等多款新品。尽管许多产品在发布之前都已经被爆出了细节信息,但这并没有影响发布会受关注的火热程度。虽然这两年苹果不断被唱衰,可事实上,其仍旧是当仁不让的行业龙头,乃至数码行业的风向标。或许也正是因为此,尽管发布会时间在北京时间凌晨1点,依旧有许多人一改养生作息,想要先睹为快。



为此,腾讯视频、爱奇艺、优酷、哔哩哔哩4️大直播平台迅速和苹果达成了直播协议,为那些期待者们分享同步的快乐。事实上,在去年的秋季发布会上,腾讯视频、看看新闻、第一财经3大直播平台,也是全程支持苹果发布会直播,除了第一手的视频以外,实时字幕更是让人感受到了科技带来的智慧生活(除了看看新闻是直接机器翻译外,其余都是直接对官方的中文语音做中文识别,呈现出来中文字幕)。



这时候才意识到语言问题的朋友大可放心,在这次的直播中,大家依旧可以享受到实时字幕带来的便捷——各大平台显然不会放过第一时间的实时翻译来收拢流量。


没错,今天我们要讲的东西并非苹果的发布会,而是苹果发布会直播中的功臣——语音识别技术


语言作为人们日常交流的一种主要表达方式。很多时候语种的不同会限制我们的沟通和交流,对于翻译的需求也就应运而生,然而,关于对话的实时翻译与文字翻译相比,难度更大,这是因为对于翻译有着更加高标准的需求,不仅要能“译得准”,还要“听得清”,这对于技术的要求显然更高,而常见的AI翻译在实时翻译的过程中,更多的只是提供一些参考性的东西,对于技术标准以及专业术语上的翻译有着较大的偏差。



所以,语音翻译并不是简单的语音+翻译,简单的语音识别的错误肯可能会被后续的翻译放大,甚至一个字的识别错误都会导致整个句子的翻译错误。达成令人满意的翻译效果需妥善解决识别容错、智能断句与标点等一系列技术难题,这就要求一个公司具备全面的AI能力,进行语音、翻译的深度融合与技术创新,而业界具备这种能力的公司,屈指可数。


这就不得不提提科大讯飞了。其在本次苹果发布会上,与看看新闻,中关村在线,新浪科技和bilibili直播四大平台合作,为用户提供了第一手的直播字幕。



科大讯飞股份有限公司是一家专业从事智能语音及语音技术研究、软件及芯片产品开发、语音信息服务的国家级骨干软件企业,这些年一直致力于人机交互技术的研究。作为中国优秀的智能语音技术提供商,科大讯飞在苹果发布会直播的幕后,默默地提供着实时字幕的输出。



提起2019世界人工智能大会,可能很多数码爱好者都不陌生,马云以及马斯克关于人工智能、宇宙、教育、人类命途等话题的对话风趣幽默,而他们的英文对话也被实时转写,并翻译成中文上屏,让人们可以更直观的读懂这场“双马对话”。没错,这就是讯飞听见智能会议系统所提供的转写翻译支持。所谓科技,简单来说就是沟通人与工具的距离,提升行为效率。与会期间的对话迅速实时的呈现出来,显然为旁观者提供了第一手的信息。无论是对于媒体工作者,还是沟通存在障碍的非母语人士来说,这都是一个极其友好的表现。



讯飞听见智能会议系统除了为大会提供全程服务外,还在“双马对话”前,其“新一代语音翻译关键技术及系统 ”甚至荣获大会颁发的,目前国内人工智能领域最高荣誉——SAIL应用奖(Super AI Leader,即“卓越人工智能引领者奖”)。



讯飞听见智能会议系统V4.0.0版本可以说是集目前语音技术之大成,其采用的全新中英文混合识别引擎,中英交谈场景无需手动切换识别语种。仅这一点,就足够甩开大部分的同业者了,然而除此之外,用户还可在系统中将说话人的发言内容进行声纹模型注册,在后续实时会议中,将自动实现声纹角色分离和识别的效果。也就是说,在多语种环境下,讯飞听见智能会议系统会迅速的分别出不同语种,并进行实时辨别,对于高效率的会议提供了强有力的语言识别支撑。



其实简单来说,听见智能会议系统就是一款以科大讯飞语音识别、翻译技术为核心的智能语音类产品,它能够通过实时、快速、准确的语音数据完成转写翻译,并且辅助会议工作者实现会后快速出材的目标,并对会议内容行程一体化知识信息管理。



还记得电视上那些翻译官么?听见智能会议系统和他们最大的区别就是,它能够完成整场回忆的记录,而不单单是一对一的翻译输出,而且能够将语音实时转成文字,会议结束即可成稿。


众所周知,2018被看作AI元年,人工智能技术应用所催生的商业价值逐步凸显。人工智能逐步切入到社会生活的方方面面,带来生产效率及生活品质的大幅提升。智能红利时代开启!资本、巨头和创业公司纷纷涌入,将人工智能拉到了信息产业革命的风口。



而自90年代中期以来,科大讯飞便在历次国内外的语音合成评测中,取得了各项关键指标名列第一的好成绩。自2008年至今,科大讯飞更是连续在国际说话人、语种识别评测大赛中名列前茅。近年来,科大讯飞多次在机器翻译、自然语言理解、图像识别、图像理解、知识图谱、知识发现、机器推理等各项国际评测中占据榜首位置。


也许这么一句话才能形容科大讯飞:因为热爱,所以专业。


当一个产品为行业所认可时,那么它的身影显然会出现你身边的角角落落,而这,也就是听见智能会议系统的身影出现WWDC、苹果发布会等场合上的原因。

登录查看更多
0

相关内容

Yoshua Bengio最新《深度学习》MLSS2020教程,附104页PPT及视频
专知会员服务
126+阅读 · 2020年7月10日
多模态深度学习综述,18页pdf
专知会员服务
213+阅读 · 2020年3月29日
姿势服装随心换-CVPR2019
专知会员服务
34+阅读 · 2020年1月26日
【斯坦福新课】CS234:强化学习,附课程PPT下载
专知会员服务
114+阅读 · 2020年1月15日
资源|Blockchain区块链中文资源阅读列表
专知会员服务
43+阅读 · 2019年11月20日
CMU 深度学习导论更新 | 第四讲:反向传播
雷锋网
5+阅读 · 2018年11月27日
讯飞来了,一大批人将面临失业!
创业财经汇
5+阅读 · 2018年4月25日
CS231n 2017 今天正式开课!双语字幕版独家上线!
AI研习社
36+阅读 · 2017年11月9日
Neural Image Captioning
Arxiv
5+阅读 · 2019年7月2日
Arxiv
3+阅读 · 2019年3月29日
Deep Reinforcement Learning: An Overview
Arxiv
17+阅读 · 2018年11月26日
Arxiv
7+阅读 · 2018年4月11日
Arxiv
20+阅读 · 2018年1月17日
Arxiv
11+阅读 · 2018年1月11日
VIP会员
相关论文
Neural Image Captioning
Arxiv
5+阅读 · 2019年7月2日
Arxiv
3+阅读 · 2019年3月29日
Deep Reinforcement Learning: An Overview
Arxiv
17+阅读 · 2018年11月26日
Arxiv
7+阅读 · 2018年4月11日
Arxiv
20+阅读 · 2018年1月17日
Arxiv
11+阅读 · 2018年1月11日
Top
微信扫码咨询专知VIP会员