题目: Are All Good Word Vector Spaces Isomorphic?
摘要: 现有的对齐跨语言单词向量空间的算法假设向量空间是近似同构的。结果,它们在非同构空间上表现很差或完全失败。这种非同构性几乎完全是由语言之间的类型学差异造成的。在这项工作中,我们问非同构是否也是退化字向量空间的一个重要标志。我们在不同的语言之间进行了一系列的实验,这些实验表明,除了固有的类型差异外,语言对之间表现的差异在很大程度上可以归因于可用单语资源的大小,以及单语训练的性质和持续时间(例如,训练不足)。