基于内容的推荐系统通过基于描述性特征(通常通过处理文本内容获得)构建用户和条目的表示,向用户推荐与用户过去喜欢的条目相似的条目。处理文本内容的一种经典方法是使用基于关键字的表示,其中提取的术语很少代表整个内容。经典的基于关键字的表示有一个明显的局限性,即它们通常不足以正确地捕捉用户的偏好以及条目所传达的信息内容。当然,对信息内容的次优理解会导致用户和条目的次优表示,进而导致不准确的推荐。因此,为了充分利用基于内容的特征和文本数据的潜力,有必要改进这种表示。语义感知的推荐系统代表了最具创新性的研究方向之一,其目标是使用语义方法来表示内容。有了这些表象,才有可能赋予自然语言所表达的信息以意义,并获得更深层次的理解。本教程旨在从理论和实践两个角度介绍用于内容表示的语义感知技术,以实现有效和负责任的推荐系统。我们将介绍由SWAP研究组开发的全面的Python框架ClayRS,它将在未来几个月公开发布,旨在为研究人员和对用户建模和推荐系统的最新语义感知技术感兴趣的实践者提供一个共同的基础。
目录内容:
引言 Introduction (30 minutes)
Recommender Systems and the role of content
Content representation: issues and challenges
Towards accountable recommender systems
Reproducibility and Replicability issues
Frameworks for advanced content representations and accountability
用于内容表示的语义感知技术 Semantic-aware techniques for content-representations (1 hour)
Basics of Content Representation
Encoding Exogenous Semantics
Linked Open Data and DBpedia
Entity Linking
Encoding Endogenous Semantics
Distributional Semantic Models
Word Embedding Techniques
Contextualized Word Representations
ClayRS: a Python framework for content representation and reproducibility in recommender systems (1.30hour)
Architecture of the framework
Focus on the Content Analyzer Module + Hands-on session
TF-IDF and data pre-processing
Word Embedding Techniques and Contextualized Word Representations
Entity Linking
Focus on the Recommendation Module + Hands-on session
Strategies based on Neighborhoods
Strategies based on Neural Networks
Strategies based on Graphs
Focus on the Evaluation Module + Hands-on session
Focus on the Configuration Files and Graphical User Interface + Hands-on session
专知便捷查看
便捷下载,请关注专知公众号(点击上方蓝色专知关注)
后台回复“E148” 就可以获取《【ACM UMAP 2022 】可复现推荐系统的语义感知内容表示,148页ppt》专知下载链接