知识图谱已被用于支持广泛的应序,并增强了多个主要搜索引擎(如Google和Bing)的搜索结果。在亚马逊,我们正在构建一个产品图谱,一个全球所有产品的权威知识图。我们需要建立数千个产品垂直模型,我们需要从中提取知识的大量数据源,我们每天需要处理的大量新产品,以及我们希望支持的搜索、发现、个性化、语音等各种应用程序,都给构建这样一个图带来了巨大的挑战。
在本次演讲中,我们将介绍我们为数千种产品收集知识所做的努力。我们将介绍如何确定交付数据业务最重要的第一步:培训生成准确数据的高精度模型。然后,我们描述了如何通过从有限的标签中学习来扩展模型,以及如何通过多模式模型和web提取来提高收益率。我们分享了构建此产品图谱并将其应用于支持面向客户的应用的许多经验教训。