https://www.zhuanzhi.ai/paper/19590a2a40a84addde18b8a37112c3fc
关于概念及其属性的常识知识(CSK)对于人工智能应用程序(如健壮的聊天机器人)是有用的。以前的作品,如ConceptNet、TupleKB和其他一些人编译了大量的CSK集合,但它们在表达上受到限制,只包含了S的简单概念和P和o的单一字符串的主语-谓语-宾语(SPO)三元组。此外,这些项目要么优先考虑精度,要么优先考虑回忆,但很难协调这些互补的目标。本文提出了一种自动构建大规模CSK断言知识库的方法——Ascent,该方法具有更高的表达能力,同时具有比以往的研究更好的查全率和查全率。Ascent通过捕获带有子组和方面的复合概念,以及使用语义方面精炼断言,从而超越了三元组。后者对于表示断言和进一步限定符的时间和空间有效性很重要。Ascent使用语言模型将开放信息提取相结合。内部评估显示了提升Ascent KB知识库的卓越大小和质量。