数据稀疏和冷启动是当前推荐系统面临的两大挑战. 以知识图谱为表现形式的附加信息能够在某种程度上缓解数据稀疏和冷启动带来的负面影响, 进而提高推荐的准确度. 本文综述了最近提出的应用知识图谱的推荐方法和系统, 并依据知识图谱来源与构建方法、推荐系统利用知识图谱的方式, 提出了应用知识图谱的推荐方法和系统的分类框架, 进一步分析了本领域的研究难点. 本文还给出了文献中常用的数据集. 最后讨论了未来有价值的研究方向.
http://www.aas.net.cn/cn/article/doi/10.16383/j.aas.c200128
推荐系统推荐系统是一种向目标用户建议可能感兴趣物品的软件工具. 随着网络与现实信息的爆炸式增长, 越来越多的在线服务商为用户提供商品、音乐、电影等(以下统称为物品)的推荐服务. 推荐系统能够满足用户的个性化需求, 为在线服务商带来巨大商业价值. 同时, 推荐方法与系统的研究促进了偏好挖掘、大数据处理、决策支持等领域的相关理论和实践的飞速发展, 其学术价值也引起了广泛的关注.
推荐系统面临的重要挑战主要是数据稀疏性问题和冷启动问题. 数据稀疏问题指的是相对于数量庞大的用户和物品, 仅有少量的物品获得了用户的评价或者购买, 难以据此获得相似的用户或相似的物品, 使得传统推荐方法失效了. 冷启动问题指的是系统由于并不知道新加入用户的历史行为, 无法给他们推荐物品, 同样新加入的物品也由于没有被用户评价或购买过而无法被针对性的推荐.
推荐系统中通常利用附加信息来解决上述问题, 以提高性能. 附加信息(一般也称上下文信息)分为显式信息和隐式信息[1]. 显式信息是通过诸如物理设备感知、用户问询、用户主动设定等方式获取的与用户、物品相关联的上下文信息. 隐式信息即利用已有数据或周围环境间接获取的一些上下文信息, 例如可根据用户与系统的交互日志获取时间上下文信息.
近年来, 利用以知识图谱为表示形式的附加信息的推荐方法受到了学者们的关注. 知识图谱最初用于提升搜索系统的性能[2], 刻画了海量实体之间的多种关系, 具有网状结构, 能够用于推荐系统中来增强用户、物品之间联系的认知与解释, 从而提高推荐准确度. 本文综述了2015年~2019年发表在DLRS、RecSys、KDD、CIKM、NIPS、TIST、UMAP、SIGIR等会议和期刊中的利用知识图谱的推荐方法的文献, 共23篇. 在利用知识图谱的推荐系统中, 通常首先将收集到的用户信息、物品信息、在利用知识图谱的推荐系统中, 通常首先将收集到的用户信息、物品信息、用户历史行为等数据或者一些相关的外部数据表示成知识图谱的形式. 然后, 设计推荐算法, 利用知识图谱生成推荐. 此类推荐系统通常包含知识图谱构建和利用知识图谱产生推荐两个环节. 本文根据这两个环节中构建知识图谱数据的不同来源, 以及推荐方法中利用知识图谱信息的不同形式提出了分类框架, 并据此对相关文献进行了分类综述, 详情请参看本文第三章. 与本文最为相关是文献[3]. 该文献综述了2009年~2017年16篇利用知识图谱的推荐方法的文献. 本文在综述的文章数量上超过了文献[3]. 此外, 本文提出文献分类框架能够更好地覆盖新提出的方法.
本文第一章介绍了利用知识图谱的推荐方法的相关背景知识; 第二章对利用知识图谱的推荐方法文献进行分类与综述; 第三章整理了目前常用的推荐系统数据集和知识图谱数据集; 第四章、第五章分别讨论了应用知识图谱的推荐系统的研究难点与发展前景; 最后, 在第六章中对全文进行了总结.