题目: Low-Resource Text Classification using Domain-Adversarial Learning
简介:
深度学习技术最近在自然语言处理任务中取得了成功。 但是,它们需要大量的注释数据,而这些数据通常会丢失。 本文探讨了在训练新目标域或语言中的低资源和零资源设置的深度,复杂神经网络的领域不变特征时,如何使用领域对抗学习作为正则化函数来避免过度拟合。 在使用新语言的情况下,我们证明了单语言单词向量可以直接用于训练而无需预先对齐。 它们在公共空间中的映射可以在训练时临时学习,以达到预训练的多语言单词向量的最终性能。