基于内容的推荐系统通过基于描述性特征(通常通过处理文本内容获得)构建用户和条目的表示,向用户推荐与用户过去喜欢的条目相似的条目。处理文本内容的一种经典方法是使用基于关键字的表示,其中提取的术语很少代表整个内容。经典的基于关键字的表示有一个明显的局限性,即它们通常不足以正确地捕捉用户的偏好以及条目所传达的信息内容。当然,对信息内容的次优理解会导致用户和条目的次优表示,进而导致不准确的推荐。因此,为了充分利用基于内容的特征和文本数据的潜力,有必要改进这种表示。语义感知的推荐系统代表了最具创新性的研究方向之一,其目标是使用语义方法来表示内容。有了这些表象,才有可能赋予自然语言所表达的信息以意义,并获得更深层次的理解。本教程旨在从理论和实践两个角度介绍用于内容表示的语义感知技术,以实现有效和负责任的推荐系统。我们将介绍由SWAP研究组开发的全面的Python框架ClayRS,它将在未来几个月公开发布,旨在为研究人员和对用户建模和推荐系统的最新语义感知技术感兴趣的实践者提供一个共同的基础。
目录内容:
引言 Introduction (30 minutes)* Recommender Systems and the role of content Content representation: issues and challenges Towards accountable recommender systems Reproducibility and Replicability issues Frameworks for advanced content representations and accountability
用于内容表示的语义感知技术 Semantic-aware techniques for content-representations (1 hour) Basics of Content Representation Encoding Exogenous Semantics Linked Open Data and DBpedia Entity Linking Encoding Endogenous Semantics Distributional Semantic Models Word Embedding Techniques Contextualized Word Representations
ClayRS: a Python framework for content representation and reproducibility in recommender systems (1.30hour)
Architecture of the framework Focus on the Content Analyzer Module + Hands-on session TF-IDF and data pre-processing Word Embedding Techniques and Contextualized Word Representations Entity Linking Focus on the Recommendation Module + Hands-on session Strategies based on Neighborhoods Strategies based on Neural Networks Strategies based on Graphs Focus on the Evaluation Module + Hands-on session Focus on the Configuration Files and Graphical User Interface + Hands-on session