深度学习技术的发展使得神经机器翻译(NMT)模型在充分的训练数据和训练时间下变得极为强大。
然而,系统在翻译具有独特风格或词汇的新领域的文本时会遇到困难。对具有代表性的训练语料库进行调优可以实现良好的域内翻译,但这种以数据为中心的方法可能会导致对新数据的过度拟合和对之前学习过的行为的“灾难性遗忘”。
我们将重点放在更为鲁棒的领域适应方法上,特别是在一个系统可能需要翻译多个领域的句子的情况下。我们将技术分为数据选择技术、模型结构技术、参数自适应技术和推理技术。
最后,我们强调了领域适应和多领域适应技术对其他学科的研究的好处。
https://www.zhuanzhi.ai/paper/ded38c3d1df3a669bbf8d9c9bad96a5c