知识图谱不仅可以用于提高推荐算法的准确性,还可以为推荐提供推理(reasoning)的能力。然而在新闻场景中,现有的推荐推理方法存在一定的缺陷,例如计算成本高,只能用于排序;只能寻找单一路径,不能很好的结合新闻文本信息等。
在本文中,微软亚洲研究院的研究员们提出了一种新的基于知识图谱的推理范式 AnchorKG,它的优点有以下几点:
(1)可拓展性强,支持大规模的通用知识图谱; (2)能够结合知识图谱和文本内容; (3)不局限于只提供单一解释路径; (4)能够灵活地应用于推荐的不同阶段:召回和排序。
对于每篇新闻文章,研究员们从知识图谱中生成一个和这篇新闻内容紧密相关的小规模子图(Anchor KG)。这个子图包含了出现在新闻中的重要实体,以及在知识图谱中与这篇新闻紧密相关的信息。当在进行新闻间的推荐推理时,研究员们利用两篇新闻 Anchor KG 的重合关系,就可以找出两篇相关新闻间的推理路径。
为了得到 Anchor KG 的生成器,研究员们还提出了一种基于强化学习的框架,并用经典的演员-评论家(actor-critic)算法进行优化,如图7所示。生成器(即演员)学习动作策略函数 ,它以状态和可能的动作空间为条件,来计算动作的概率分布,同时使用多层感知器来建模演员网络。评论家则通过估计 MDP 环境中的动作价值函数,来评估动作好坏,并使用时间差异方法进行训练。此外,为了更好地学习模型,研究员们设计了几种训练技巧,包括:1)热启动训练;2)基于知识图谱的负采样;3)多任务学习。