论文题目:Contrastive Curriculum Learning for Sequential User Behavior Modeling via Data Augmentation(Applied Research Track )
作者:卞书青,赵鑫,周昆,蔡晶,何晏成,尹存祥,文继荣
通讯作者:赵鑫
论文概述:在线App场景中,捕捉用户连续行为的语义信息准确建模用户兴趣至关重要。然而,行为特征的动态性和稀疏问题使得难以有效训练用户表示来建模用户顺序行为。受到对比学习等最新技术的启发,我们提出了一种新颖的对比课程学习 (CCL) 框架,用于生成对用户连续行为建模的有效表示。本文在两个方面做出了重要的技术改进,即数据质量和采样顺序。首先,我们通过拟合用户属性信息生成高质量的样例设计了基于模型的数据生成器。通过给定目标用户,可以利用融合的属性语义来生成更接近真实序列的增广数据。其次,我们提出了一种课程学习的策略,通过由易到难的学习过程进行对比学习。核心模块是一个可学习的难度评估器,它可以对增强序列进行打分,并将它们安排在课程中以进一步增强对比学习的能力以更好地进行表示学习。同时我们在公开数据集和行业数据集上进行了广泛的实验,结果证明了我们的方法在三个下游任务上均有提升,取得了良好的效果。