参数有效转移学习何时能为机器翻译工作? (When does Parameter-Efficient Transfer Learning Work for Machine Translation?)

Parameter-efficient fine-tuning methods (PEFTs) offer the promise of adapting large pre-trained models while only tuning a small number of parameters. They have been shown to be competitive with full model fine-tuning for many downstream tasks. However, prior work indicates that PEFTs may not work as well for machine translation (MT), and there is no comprehensive study showing when PEFTs work for MT. We conduct a comprehensive empirical study of PEFTs for MT, considering (1) various parameter budgets, (2) a diverse set of language-pairs, and (3) different pre-trained models. We find that 'adapters', in which small feed-forward networks are added after every layer, are indeed on par with full model fine-tuning when the parameter budget corresponds to 10% of total model parameters. Nevertheless, as the number of tuned parameters decreases, the performance of PEFTs decreases. The magnitude of this decrease depends on the language pair, with PEFTs particularly struggling for distantly related language-pairs. We find that using PEFTs with a larger pre-trained model outperforms full fine-tuning with a smaller model, and for smaller training data sizes, PEFTs outperform full fine-tuning for the same pre-trained model.

翻译：参数高效微调方法(PEFTs)有望在对少数参数进行调试的同时对大型预先培训的模型进行调整,而只是对少量参数进行调试。事实证明,这些模型具有竞争力,对许多下游任务进行完全的模型微调。然而,先前的工作表明,PEFTs可能无法与机器翻译(MT)一样有效,而且没有全面研究显示PEFTs为MT工作的时间。我们为MT对PEFTs进行全面的经验性研究,考虑到:(1)各种参数预算,(2)一套不同的语言版,(3)不同的预先培训模式。我们发现,“适应者”,其中每个层之后都添加了小型饲料向前网络,当参数预算与全部模型参数参数参数参数参数参数参数参数的10%相匹配时,确实与完全的模型微调完全相同。然而,随着调参数的数量减少,PEFFTs的性能下降幅度取决于语言配对,而PEFTs的幅度取决于远程相关语言面语言板的难度特别大。我们发现,使用较大型的模型前模型超越模型的模型,完全的FTFT型升级的模型,用于更小的完整的模型。

相关内容

MoDELS

关注 43

ACM/IEEE第23届模型驱动工程语言和系统国际会议，是模型驱动软件和系统工程的首要会议系列，由ACM-SIGSOFT和IEEE-TCSE支持组织。自1998年以来，模型涵盖了建模的各个方面，从语言和方法到工具和应用程序。模特的参加者来自不同的背景，包括研究人员、学者、工程师和工业专业人士。MODELS 2019是一个论坛，参与者可以围绕建模和模型驱动的软件和系统交流前沿研究成果和创新实践经验。今年的版本将为建模社区提供进一步推进建模基础的机会，并在网络物理系统、嵌入式系统、社会技术系统、云计算、大数据、机器学习、安全、开源等新兴领域提出建模的创新应用以及可持续性。官网链接：http://www.modelsconference.org/