Traditionally, research in automated speech recognition has focused on local-first encoding of audio representations to predict the spoken phonemes in an utterance. Unfortunately, approaches relying on such hyper-local information tend to be vulnerable to both local-level corruption (such as audio-frame drops, or loud noises) and global-level noise (such as environmental noise, or background noise) that has not been seen during training. In this work, we introduce a novel approach which leverages a self-supervised learning technique based on masked language modeling to compute a global, multi-modal encoding of the environment in which the utterance occurs. We then use a new deep-fusion framework to integrate this global context into a traditional ASR method, and demonstrate that the resulting method can outperform baseline methods by up to 7% on Librispeech; gains on internal datasets range from 6% (on larger models) to 45% (on smaller models).


翻译:传统上,自动语音识别研究的焦点是用当地第一编码的音频表达方式来预测在一段话语中的语音。 不幸的是,依赖这种超地方信息的方法往往容易受到地方一级腐败(如音频框架滴落或响声噪音)和全球一级噪音(如环境噪音或背景噪音)的伤害。 在这项工作中,我们引入了一种新颖的方法,利用以隐蔽语言模型为基础的自我监督学习技术来计算全球多模式的发音环境编码。 我们随后使用一个新的深度聚合框架将这一全球环境纳入传统的ASR方法,并表明由此产生的方法可以在Librispeech上超过7%的基准方法;内部数据集的收益从6%(大模型)到45%(小模型)不等。

0
下载
关闭预览

相关内容

Automator是苹果公司为他们的Mac OS X系统开发的一款软件。 只要通过点击拖拽鼠标等操作就可以将一系列动作组合成一个工作流,从而帮助你自动的(可重复的)完成一些复杂的工作。Automator还能横跨很多不同种类的程序,包括:查找器、Safari网络浏览器、iCal、地址簿或者其他的一些程序。它还能和一些第三方的程序一起工作,如微软的Office、Adobe公司的Photoshop或者Pixelmator等。
卷积神经网络中的注意力机制综述
专知会员服务
76+阅读 · 2021年10月22日
专知会员服务
53+阅读 · 2020年11月17日
因果图,Causal Graphs,52页ppt
专知会员服务
248+阅读 · 2020年4月19日
Hierarchically Structured Meta-learning
CreateAMind
26+阅读 · 2019年5月22日
Transferring Knowledge across Learning Processes
CreateAMind
28+阅读 · 2019年5月18日
逆强化学习-学习人先验的动机
CreateAMind
16+阅读 · 2019年1月18日
强化学习的Unsupervised Meta-Learning
CreateAMind
17+阅读 · 2019年1月7日
Unsupervised Learning via Meta-Learning
CreateAMind
42+阅读 · 2019年1月3日
vae 相关论文 表示学习 1
CreateAMind
12+阅读 · 2018年9月6日
【论文】图上的表示学习综述
机器学习研究会
14+阅读 · 2017年9月24日
已删除
将门创投
6+阅读 · 2017年7月6日
VIP会员
相关VIP内容
卷积神经网络中的注意力机制综述
专知会员服务
76+阅读 · 2021年10月22日
专知会员服务
53+阅读 · 2020年11月17日
因果图,Causal Graphs,52页ppt
专知会员服务
248+阅读 · 2020年4月19日
相关资讯
Top
微信扫码咨询专知VIP会员