开源项目Recommended System with TF2.0
主要是对阅读过的部分推荐系统、CTR预估论文进行复现。建立的原因有三个:
当然也看过一些知名的开源项目,如DeepCTR等,不过对自己目前的水平来说,只适合拿来参考。
项目特点:
.md文件
)或者其他方式进行解释;
目前复现的模型有(按复现时间进行排序):
持续更新中······
目前实验使用的数据集主要有三个:Movielens、Amazon、Criteo。
MovieLens是历史最悠久的推荐系统数据集,主要分为:ml-100k(1998年)、ml-1m(2003年)、ml-10m(2009年)、ml-20m(2015年)、ml-25m(2019年)。实验中主要使用ml-1m数据集。
已处理过的数据集:ml-1m
ml-1m数据集的具体介绍与处理:传送门【https://grouplens.org/datasets/movielens/】
Amazon提供了商品数据集,该数据集包含亚马逊的产品评论和元数据,包括1996年5月至2014年7月期间的1.428亿评论。它包括很多子数据集,如:Book、Electronics、Movies and TV等,实验中我们主要使用Electronics子数据集。
Amazon-Electronics数据集的具体介绍与处理:传送门【https://jmcauley.ucsd.edu/data/amazon/】
Criteo广告数据集是一个经典的用来预测广告点击率的数据集。2014年,由全球知名广告公司Criteo赞助举办Display Advertising Challenge比赛。但比赛过去太久,Kaggle已不提供数据集。现有三种方式获得数据集或其样本:
Criteo数据集的具体介绍与处理:传送门【https://github.com/BlackSpaceGZY/Recommended-System-with-TF2.0/blob/master/Dataset%20Introduction.md#3-criteo】
模型:
数据集:
Movielens、Pinterest
代码解析:
原文开源代码:
https://github.com/hexiangnan/neural_collaborative_filtering
原文地址:
https://arxiv.org/pdf/1708.05031.pdf?source=post_page
模型:
数据集:
Amazon数据集中Electronics子集。
代码解析:
参考原文开源代码地址:
https://github.com/zhougr1993/DeepInterestNetwork
原文地址:
https://arxiv.org/pdf/1706.06978.pdf
模型:
数据集:
由于原文没有给出公开数据集,所以在此我们使用Amazon Dataset中的Electronics子集,由于数据集的原因,模型可能与原文的有所出入,但整体思想还是不变的。
代码解析:
原文地址:
https://arxiv.org/pdf/1606.07792.pdf
模型:
数据集:
Criteo
代码解析:
原文地址:
https://arxiv.org/pdf/1708.05123.pdf
模型:
数据集:
Criteo
代码解析:
原文地址:
https://arxiv.org/pdf/1611.00144.pdf
模型:
数据集:
Crieto
代码解析:
Deep Crossing代码文档
原文地址:
https://www.kdd.org/kdd2016/papers/files/adf0975-shanA.pdf
希望大家给个star支持一下,非常感谢🙏
喜欢的话点个在看吧👇