最近一份研究(Fisher et al, 2020)发现知识库嵌入(knowledge base embedding)中包含性别差异。针对上述差异,本文进一步研究了有关这些差异的两个问题: 1) 如何更准确地量化这些差异, 以及 2) 如何追溯这些差异在训练数据中的起源。由于其简单性和普及性, 本文主要关注 TransE 知识库嵌入训练算法。
对于第一个问题, 本文分别为一组实体(entity)和每个单独的实体开发了两个新的差异测度(bias measure)。通过与现实世界的人口普查数据对比, 本文验证了它们的有效性。对于第二个问题, 本文使用影响函数(influence function)分析了知识库中的每个三元组(triple)对整体差异的贡献;同时, 为了便于开展大规模分析, 本文为TransE量身开发了一个常数时间复杂度的影响函数算法(前人工作中该算法为线性时间复杂度)。