电子商务
1、Amazon
简介:
该数据集包括自1996年5月至2014年7月,来自Amazon上的1.428亿产品的评论和metadata。
下载链接:
http://jmcauley.ucsd.edu/data/amazon/
2、阿里巴巴
简介:
该数据集为20000用户在一个月内的移动端行为数据以及百万级的商品信息(部分已脱敏)。该数据集包含两个部分,第一部分是用户在商品全集上的移动端行为数据(D),表名为tianchi_fresh_comp_train_user_2w,第二个部分是商品子集(P),表名为tianchi_fresh_comp_train_item_2w。
下载链接:
https://tianchi.aliyun.com/competition/entrance/231522/information
3、RetailRocket推荐系统数据集
简介:
该数据集来自现实世界的电子商务网站,由三个文件组成:一个属性数据集(item_properties.сsv),一个行为数据集(events.csv)以及一个类目树数据集(category_tree.сsv)。
下载链接:
https://www.kaggle.com/retailrocket/ecommerce-dataset
书籍
4、Book Crossing
简介:
该数据集由Cai-Nicolas花了4周的时间(2004年8月~9月)从Book-Crossing社区中爬取得到的。
下载链接:
http://www2.informatik.uni-freiburg.de/~cziegler/BX/
电影
5、Netflix
简介:
该数据集为Netflix竞赛中使用的官方数据集。
下载链接:
http://academictorrents.com/details/9b13183dc4d60676b773c9e2cd6de5e5542cee9a
6、MovieLens
简介:
该数据集为GroupLens Research从他们的电影网站收集并整理的rating数据集。
下载链接:
https://grouplens.org/datasets/movielens/
7、CiaoDVD
简介:
该数据集为是2013年12月从dvd.ciao.co.uk网站上抓取的DVD类别数据集。
下载链接:
https://webscope.sandbox.yahoo.com/catalog.php?datatype=r
8、FilmTrust
简介:
该数据集为是2011年6月从整个FilmTrust网站上抓取的一个小型数据集。
下载链接:
https://www.librec.net/datasets.html
音乐
9、Yahoo Music
简介:
该数据集包含从两个不同来源收集的歌曲的rating数据集。它是一个快照,收集了音乐社区对各种音乐艺术家的偏好等。
下载链接:
https://webscope.sandbox.yahoo.com/catalog.php?datatype=r
10、Amazon Music
简介:
该数据集包含来自亚马逊的元数据和评论。
下载链接:
http://jmcauley.ucsd.edu/data/amazon/
11、LastFM(Implicit)
简介:
该数据集收集了Last.fm网站上2千名用户的社交网络、tagging和music artist listening信息。
下载链接:
https://grouplens.org/datasets/hetrec-2011/
12、Milion Song Dataset
简介:
该数据集是一个免费的数据集,提供了一百万条当代流行音乐曲目相关的metadata和audio features。
下载链接:
https://labrosa.ee.columbia.edu/millionsong/
游戏
13、Steam Video Games
简介:
该数据集是一个用户行数据集,包含:game-title,user-id,behavior-name,value等。
下载链接:
https://www.kaggle.com/tamber/steam-video-games/data
笑话
14、Jester
简介:
该数据集包含来自73,496个用户,关于100个笑话的410万连续rating数据(-10.00到+10.00)。
下载链接:
http://www.ieor.berkeley.edu/~goldberg/jester-data/
餐饮
15、Chicago Entree
简介:
该数据集包含用户与Entree Chicago餐厅推荐系统交互的记录数据。
下载链接: http://archive.ics.uci.edu/ml/datasets/Entree+Chicago+Recommendation+Data
动漫
16、动漫推荐数据集
简介:
该数据集包含来自12,294个动漫的73,516个用户的用户偏好数据。每个用户都可以将动画添加到已完成的列表中并为其评分,该数据集把这些评级整理起来。
下载链接:
https://www.kaggle.com/CooperUnion/anime-recommendations-database
其他数据集
17、斯坦福大型网络数据集汇编
下载链接:
https://snap.stanford.edu/data/
18、GroupLens数据集
下载链接:
https://grouplens.org/datasets/
19、Yahoo Research数据集
下载链接:
https://webscope.sandbox.yahoo.com/catalog.php?datatype=r
20、LibRec数据集
下载链接:
https://www.librec.net/datasets.html
推荐阅读