理解人类层次的知识是推进人工智能的基础,特别是通过融入常识知识,这包括关于事件、信念和欲望的基本事实。本论文探讨了常识知识在不同层次上的表示与应用——词汇、短语和句子,利用结构化知识图谱和生成性语言模型。我们研究了知识图谱从词汇资源(如WordNet)到常识知识图谱(如ConceptNet和ATOMIC)的演变。 关键贡献包括使用Z加权策略解决词汇层次语义表示中的训练偏差,开发通用语义表示以缓解多语言环境中的数据稀缺问题,并提出了一种多替代对比学习框架(MICO)以有效进行短语级表示。此外,我们通过一种新的“基础化-剪枝-推理”管道,研究了知识图谱和语言模型两种知识源的高效知识推理,从而提高了推理任务的效率。 最终,本研究不仅推进了常识知识的理解及其在各种下游任务中的应用,包括词义消歧、知识检索和问答系统,还为探索具身AI的应用开辟了新的途径。具身AI能够利用这些丰富的知识,在现实世界环境中实现更直观和智能的互动。