评价BERT URAL语言模式的可转让性 (Evaluating Transferability of BERT Models on Uralic Languages)

Transformer-based language models such as BERT have outperformed previous models on a large number of English benchmarks, but their evaluation is often limited to English or a small number of well-resourced languages. In this work, we evaluate monolingual, multilingual, and randomly initialized language models from the BERT family on a variety of Uralic languages including Estonian, Finnish, Hungarian, Erzya, Moksha, Karelian, Livvi, Komi Permyak, Komi Zyrian, Northern S\'ami, and Skolt S\'ami. When monolingual models are available (currently only et, fi, hu), these perform better on their native language, but in general they transfer worse than multilingual models or models of genetically unrelated languages that share the same character set. Remarkably, straightforward transfer of high-resource models, even without special efforts toward hyperparameter optimization, yields what appear to be state of the art POS and NER tools for the minority Uralic languages where there is sufficient data for finetuning.

翻译：BERT等基于变异语言模型在大量英文基准方面优于先前的模型,但其评价通常仅限于英语或少数资源充足的语言。在这项工作中,我们评估了BERT家族在包括爱沙尼亚语、芬兰语、匈牙利语、埃尔恰语、莫克沙语、卡雷连语、利维语、科米·佩米亚克语、科米齐里安语、北苏米语和斯科尔特S'ami语等各种乌拉利语在内的乌拉利语的单一语言、多语言和随机初始语言模型。当有单一语言模型(目前仅使用英语或少量资源丰富的语言)时,这些模型在本地语言上表现更好,但一般而言,它们所传播的比多语言模式或具有相同字符集的基因无关语言模型更差。值得注意的是,高资源模型的简单转换,即使没有特别努力进行超比对称优化,也产生了少数乌拉利语的艺术 POS 和 NER 工具的状态,那里有足够的数据可以进行微调。

相关内容

MoDELS

关注 43

ACM/IEEE第23届模型驱动工程语言和系统国际会议，是模型驱动软件和系统工程的首要会议系列，由ACM-SIGSOFT和IEEE-TCSE支持组织。自1998年以来，模型涵盖了建模的各个方面，从语言和方法到工具和应用程序。模特的参加者来自不同的背景，包括研究人员、学者、工程师和工业专业人士。MODELS 2019是一个论坛，参与者可以围绕建模和模型驱动的软件和系统交流前沿研究成果和创新实践经验。今年的版本将为建模社区提供进一步推进建模基础的机会，并在网络物理系统、嵌入式系统、社会技术系统、云计算、大数据、机器学习、安全、开源等新兴领域提出建模的创新应用以及可持续性。官网链接：http://www.modelsconference.org/