一种潜在的知识图谱基础模型定义是:一个图神经网络(GNN)模型,经过大规模知识图谱数据集的预训练,这些图谱涵盖了多个领域(例如,体育、艺术),该模型可以在不进行重新训练的情况下,泛化到新任务中,适用于未见过的领域、未知的关系类型和节点特征空间(例如,医疗健康)。在本研究中,我们探讨了基于不变性理论的数学基础,这为这种可适应模型提供了可能。我们的结果突出了不变性理论、图论、统计学与机器学习概念(如元学习)之间的若干有前景的联系,提供了一条通向更加灵活且可泛化的知识库图模型的路径。
2 大规模语言模型(LLMs)