利用培训前的代言人利用培训前的代言人的机会,改善获得来自濒危语言的未受限制的言语的机会 (Leveraging pre-trained representations to improve access to untranscribed speech from endangered languages)

Nay San,Martijn Bartelds,Mitchell Browne,Lily Clifford,Fiona Gibson,John Mansfield,David Nash,Jane Simpson,Myfany Turpin,Maria Vollmer,Sasha Wilmoth,Dan Jurafsky

from arxiv, Accepted at ASRU 2021

Pre-trained speech representations like wav2vec 2.0 are a powerful tool for automatic speech recognition (ASR). Yet many endangered languages lack sufficient data for pre-training such models, or are predominantly oral vernaculars without a standardised writing system, precluding fine-tuning. Query-by-example spoken term detection (QbE-STD) offers an alternative for iteratively indexing untranscribed speech corpora by locating spoken query terms. Using data from 7 Australian Aboriginal languages and a regional variety of Dutch, all of which are endangered or vulnerable, we show that QbE-STD can be improved by leveraging representations developed for ASR (wav2vec 2.0: the English monolingual model and XLSR53 multilingual model). Surprisingly, the English model outperformed the multilingual model on 4 Australian language datasets, raising questions around how to optimally leverage self-supervised speech representations for QbE-STD. Nevertheless, we find that wav2vec 2.0 representations (either English or XLSR53) offer large improvements (56-86% relative) over state-of-the-art approaches on our endangered language datasets.

翻译：诸如 wav2vec 2. 0 等经过事先训练的语音表达方式是自动语音识别(ASR)的有力工具。然而,许多濒危语言缺乏对此类模式进行预培训的充分数据,或主要是口述方言,没有标准化的书写系统,因此无法进行微调。逐个字的口头用词检测(QbE-STD)为通过查找语音查询术语来迭接未受限制的语音组合提供了一种代用索引的替代方法。使用来自7种澳大利亚土著语言和荷兰多种区域语言的数据,所有这些语言都受到威胁或脆弱。我们发现,通过利用为ASR开发的表达方式(Wav2vec 2.0:英语单语模式和XLSR53多语言模式),QbE-STD可以改进QbE-STD。令人惊讶的是,英语模型在4个澳大利亚语言数据集上优于多语言模式,提出了如何最佳地利用自我控制的语音表达方式的问题。尽管如此,我们发现 wav2vec 2.0 表达方式(英语或XLSR53)为我们的濒危域数据方法提供了很大的改进(56-86%相对)。

相关内容

MoDELS

关注 43

ACM/IEEE第23届模型驱动工程语言和系统国际会议，是模型驱动软件和系统工程的首要会议系列，由ACM-SIGSOFT和IEEE-TCSE支持组织。自1998年以来，模型涵盖了建模的各个方面，从语言和方法到工具和应用程序。模特的参加者来自不同的背景，包括研究人员、学者、工程师和工业专业人士。MODELS 2019是一个论坛，参与者可以围绕建模和模型驱动的软件和系统交流前沿研究成果和创新实践经验。今年的版本将为建模社区提供进一步推进建模基础的机会，并在网络物理系统、嵌入式系统、社会技术系统、云计算、大数据、机器学习、安全、开源等新兴领域提出建模的创新应用以及可持续性。官网链接：http://www.modelsconference.org/