本文整理了一些网上公开的数据集,分类下载地址如下,希望能节约大家找数据的时间。
涵盖5个领域的数据集下载资源:
|推荐系统
|图像数据
|视频数据
|音频数据
|自然语言处理
文末有彩蛋。。。
1.推荐系统
Netflix 电影评价数据
http://dataju.cn/Dataju/web/datasetInstanceDetail/32
MovieLens 20m 电影推荐数据集
http://dataju.cn/Dataju/web/datasetInstanceDetail/116
WikiLens
http://dataju.cn/Dataju/web/datasetInstanceDetail/97
Jester
http://dataju.cn/Dataju/web/datasetInstanceDetail/99
HetRec2011
http://dataju.cn/Dataju/web/datasetInstanceDetail/101
Book Crossing
http://dataju.cn/Dataju/web/datasetInstanceDetail/100
Large Movie Review
http://dataju.cn/Dataju/web/datasetInstanceDetail/98
Retailrocket 商品评论和推荐数据
http://dataju.cn/Dataju/web/datasetInstanceDetail/290
2.图像数据
综合图像
Visual Genome 图像数据
http://dataju.cn/Dataju/web/datasetInstanceDetail/85
Visual7w 图像数据
http://dataju.cn/Dataju/web/datasetInstanceDetail/107
COCO 图像数据
http://dataju.cn/Dataju/web/datasetInstanceDetail/51
SUFR 图像数据
http://dataju.cn/Dataju/web/datasetInstanceDetail/240
ILSVRC 2014 训练数据(ImageNet的一部分)
http://dataju.cn/Dataju/web/datasetInstanceDetail/55
PASCAL Visual Object Classes 2012 图像数据
http://dataju.cn/Dataju/web/datasetInstanceDetail/40
PASCAL Visual Object Classes 2011 图像数据
http://dataju.cn/Dataju/web/datasetInstanceDetail/45
PASCAL Visual Object Classes 2010 图像数据
http://dataju.cn/Dataju/web/datasetInstanceDetail/48
80 Million Tiny Image 图像数据【数据太大仅有介绍】
http://dataju.cn/Dataju/web/datasetInstanceDetail/138
ImageNet【数据太大仅有介绍】
http://dataju.cn/Dataju/web/datasetInstanceDetail/83
Google Open Images【数据太大仅有介绍】
http://dataju.cn/Dataju/web/datasetInstanceDetail/183
场景图象
Street Scences 图像数据
http://dataju.cn/Dataju/web/datasetInstanceDetail/74
Places2 场景图像数据
http://dataju.cn/Dataju/web/datasetInstanceDetail/112
UCF Google Street View 图像数据
http://dataju.cn/Dataju/web/datasetInstanceDetail/160
SUN 场景图像数据
http://dataju.cn/Dataju/web/datasetInstanceDetail/234
The Celebrity in Places 图像数据
http://dataju.cn/Dataju/web/datasetInstanceDetail/173
WEB图像标签
HARRISON 社交标签图像
http://dataju.cn/Dataju/web/datasetInstanceDetail/52
NUS-WIDE 标签图像
http://dataju.cn/Dataju/web/datasetInstanceDetail/235
Visual Synset 标签图像
http://dataju.cn/Dataju/web/datasetInstanceDetail/236
Animals With Attributes 标签图像
http://dataju.cn/Dataju/web/datasetInstanceDetail/253
人形轮廓图象
PII Human Shape人体轮廓数据
http://dataju.cn/Dataju/web/datasetInstanceDetail/129
Biwi Kinect Head Pose 头部姿势数据
http://dataju.cn/Dataju/web/datasetInstanceDetail/110
上半身人像数据
http://dataju.cn/Dataju/web/datasetInstanceDetail/49
INRIA Person 数据集
http://dataju.cn/Dataju/web/datasetInstanceDetail/73
视觉文字识别图像
Street View House Number 门牌号图像数据
http://dataju.cn/Dataju/web/datasetInstanceDetail/47
MNIST 手写数字识别图像数据
http://dataju.cn/Dataju/web/datasetInstanceDetail/23
3D MNIST 数字识别图像数据【Kaggle数据】
http://dataju.cn/Dataju/web/datasetInstanceDetail/203
MediaTeam Document 文档影印和内容数据
http://dataju.cn/Dataju/web/datasetInstanceDetail/128
Text Recognition 文字图像数据
http://dataju.cn/Dataju/web/datasetInstanceDetail/176
NIST Handprinted Forms and Characters 手写英文字符数据
http://dataju.cn/Dataju/web/datasetInstanceDetail/278
NIST Structured Forms Reference Set of Binary Images\n(SFRS) 图像数据
http://dataju.cn/Dataju/web/datasetInstanceDetail/294
NIST Structured Forms Reference Set of Binary Images\n(SFRS) II 图像数据
http://dataju.cn/Dataju/web/datasetInstanceDetail/295
特定一类事物图像
著名的猫图像标注数据
http://dataju.cn/Dataju/web/datasetInstanceDetail/41
Caltech-UCSD\nBirds200 鸟类图像数据
http://dataju.cn/Dataju/web/datasetInstanceDetail/105
Stanford Car 汽车图像数据Cars 汽车图像数据
http://dataju.cn/Dataju/web/datasetInstanceDetail/106
MIT Cars 汽车图像数据
http://dataju.cn/Dataju/web/datasetInstanceDetail/254
Stanford Cars 汽车图像数据
http://dataju.cn/Dataju/web/datasetInstanceDetail/255
Food-101 美食图像数据
http://dataju.cn/Dataju/web/datasetInstanceDetail/109
17_Category_Flower\n图像数据
http://dataju.cn/Dataju/web/datasetInstanceDetail/114
102_Category_Flower\n图像数据
http://dataju.cn/Dataju/web/datasetInstanceDetail/115
UCI Folio Leaf 图像数据
http://dataju.cn/Dataju/web/datasetInstanceDetail/60
Labeled Fishes\nin the Wild 鱼类图像
http://dataju.cn/Dataju/web/datasetInstanceDetail/61
美国 Yelp 点评网站酒店照片
http://dataju.cn/Dataju/web/datasetInstanceDetail/63
CMU-Oxford\nSculpture 塑像雕像图像
http://dataju.cn/Dataju/web/datasetInstanceDetail/174
Oxford-IIIT Pet 宠物图像数据
http://dataju.cn/Dataju/web/datasetInstanceDetail/256
Nature\nConservancy Fisheries Monitoring 过度捕捞监控图像数据【Kaggle数据】
http://dataju.cn/Dataju/web/datasetInstanceDetail/301
材质纹理图像
CURET 纹理材质图像数据
http://dataju.cn/Dataju/web/datasetInstanceDetail/118
ETHZ Synthesizability 纹理图像数据
http://dataju.cn/Dataju/web/datasetInstanceDetail/111
KTH-TIPS 纹理材质图像数据
http://dataju.cn/Dataju/web/datasetInstanceDetail/127
Describable Textures 纹理图像数据
http://dataju.cn/Dataju/web/datasetInstanceDetail/172
物体分类图像
COIL-20 图像数据
http://dataju.cn/Dataju/web/datasetInstanceDetail/71
COIL-100 图像数据
http://dataju.cn/Dataju/web/datasetInstanceDetail/62
Caltech-101 图像数据
http://dataju.cn/Dataju/web/datasetInstanceDetail/70
Caltech-256 图像数据
http://dataju.cn/Dataju/web/datasetInstanceDetail/54
CIFAR-10 图像数据
http://dataju.cn/Dataju/web/datasetInstanceDetail/46
CIFAR-100 图像数据
http://dataju.cn/Dataju/web/datasetInstanceDetail/42
STL-10 图像数据
http://dataju.cn/Dataju/web/datasetInstanceDetail/53
LabelMe_12_50k图像数据
http://dataju.cn/Dataju/web/datasetInstanceDetail/72
NORB v1.0 图像数据
http://dataju.cn/Dataju/web/datasetInstanceDetail/69
NEC Toy Animal 图像数据
http://dataju.cn/Dataju/web/datasetInstanceDetail/117
iCubWorld 图像分类数据
http://dataju.cn/Dataju/web/datasetInstanceDetail/237
Multi-class 图像分类数据
http://dataju.cn/Dataju/web/datasetInstanceDetail/238
GRAZ 图像分类数据
http://dataju.cn/Dataju/web/datasetInstanceDetail/239
人脸图像
IMDB-WIKI 500k+ 人脸图像、年龄性别数据
http://dataju.cn/Dataju/web/datasetInstanceDetail/108
Labeled Faces in the Wild 人脸数据
http://dataju.cn/Dataju/web/datasetInstanceDetail/68
Extended Yale Face Database B 人脸数据
http://dataju.cn/Dataju/web/datasetInstanceDetail/50
Bao Face 人脸数据
http://dataju.cn/Dataju/web/datasetInstanceDetail/131
DC-IGN 论文人脸数据
http://dataju.cn/Dataju/web/datasetInstanceDetail/87
300 Face in Wild 图像数据
http://dataju.cn/Dataju/web/datasetInstanceDetail/119
BioID Face 人脸数据
http://dataju.cn/Dataju/web/datasetInstanceDetail/120
CMU Frontal Face Images
http://dataju.cn/Dataju/web/datasetInstanceDetail/122
FDDB_Face Detection Data Set and Benchmark
http://dataju.cn/Dataju/web/datasetInstanceDetail/123
NIST Mugshot Identification Database
http://dataju.cn/Dataju/web/datasetInstanceDetail/130
Faces in the Wild 人脸数据
http://dataju.cn/Dataju/web/datasetInstanceDetail/140
CelebA 名人人脸图像数据
http://dataju.cn/Dataju/web/datasetInstanceDetail/170
VGG Face 人脸图像数据
http://dataju.cn/Dataju/web/datasetInstanceDetail/175
Caltech 10k Web Faces 人脸图像数据
http://dataju.cn/Dataju/web/datasetInstanceDetail/189
姿势动作图像
HMDB_a large human motion database
http://dataju.cn/Dataju/web/datasetInstanceDetail/125
Human Actions and Scenes Dataset
http://dataju.cn/Dataju/web/datasetInstanceDetail/126
Buffy Stickmen V3 人体轮廓识别图像数据
http://dataju.cn/Dataju/web/datasetInstanceDetail/177
Human Pose Evaluator 人体轮廓识别图像数据
http://dataju.cn/Dataju/web/datasetInstanceDetail/178
Buffy pose 人类姿势图像数据
http://dataju.cn/Dataju/web/datasetInstanceDetail/179
VGG Human Pose Estimation 姿势图像标注数据
http://dataju.cn/Dataju/web/datasetInstanceDetail/181
指纹识别图像
NIST FIGS 指纹识别数据
http://dataju.cn/Dataju/web/datasetInstanceDetail/197
NIST Supplemental Fingerprint Card Data (SFCD) 指纹识别数据
http://dataju.cn/Dataju/web/datasetInstanceDetail/281
NIST Plain and Rolled Images from Paired Fingerprint Cards\nin 500 pixels per inch 指纹识别数据
http://dataju.cn/Dataju/web/datasetInstanceDetail/280
NIST Plain and Rolled Images from Paired Fingerprint Cards\n1000 pixels per inch 指纹识别数据
http://dataju.cn/Dataju/web/datasetInstanceDetail/279
其他图像数据
Visual Question Answering V1.0 图像数据
http://dataju.cn/Dataju/web/datasetInstanceDetail/77
Visual Question Answering V2.0 图像数据
http://dataju.cn/Dataju/web/datasetInstanceDetail/289
3.视频数据
综合视频
DAVIS_Densely Annotated Video Segmentation 数据
http://dataju.cn/Dataju/web/datasetInstanceDetail/132
YouTube-8M 视频数据集【数据太大仅有介绍】
http://dataju.cn/Dataju/web/datasetInstanceDetail/84
YouTube 网站视频备份【数据太大仅有介绍】
http://dataju.cn/Dataju/web/datasetInstanceDetail/241
人类动作视频
Microsoft Research Action 人类动作视频数据
http://dataju.cn/Dataju/web/datasetInstanceDetail/147
UCF50 Action Recognition 动作识别数据
http://dataju.cn/Dataju/web/datasetInstanceDetail/133
UCF101 Action Recognition 动作识别数据
http://dataju.cn/Dataju/web/datasetInstanceDetail/134
UT-Interaction 人类动作视频数据
http://dataju.cn/Dataju/web/datasetInstanceDetail/144
UCF iPhone 运动中传感器数据
http://dataju.cn/Dataju/web/datasetInstanceDetail/135
UCF YouTube 人类动作视频数据
http://dataju.cn/Dataju/web/datasetInstanceDetail/136
UCF Sport 人类动作视频数据
http://dataju.cn/Dataju/web/datasetInstanceDetail/137
UCF-ARG 人类动作视频数据
http://dataju.cn/Dataju/web/datasetInstanceDetail/148
HMDB 人类动作视频
http://dataju.cn/Dataju/web/datasetInstanceDetail/125
HOLLYWOOD2 人类行为动作视频数据
http://dataju.cn/Dataju/web/datasetInstanceDetail/126
Recognition of human actions 动作视频数据
http://dataju.cn/Dataju/web/datasetInstanceDetail/141
Motion Capture 动作捕捉视频数据
http://dataju.cn/Dataju/web/datasetInstanceDetail/157
SBU Kinect Interaction 肢体动作视频数据
http://dataju.cn/Dataju/web/datasetInstanceDetail/146
目标检测视频
UCSD Pedestrian 行人视频数据
http://dataju.cn/Dataju/web/datasetInstanceDetail/244
Caltech Pedestrian 行人视频数据
http://dataju.cn/Dataju/web/datasetInstanceDetail/245
ETH 行人视频数据
http://dataju.cn/Dataju/web/datasetInstanceDetail/246
INRIA 行人视频数据
http://dataju.cn/Dataju/web/datasetInstanceDetail/247
TudBrussels 行人视频数据
http://dataju.cn/Dataju/web/datasetInstanceDetail/248
Daimler 行人视频数据
http://dataju.cn/Dataju/web/datasetInstanceDetail/223
ALOV++ 物体追踪视频数据
http://dataju.cn/Dataju/web/datasetInstanceDetail/159
密集人群视频
Crowd Counting 高密度人群图像
http://dataju.cn/Dataju/web/datasetInstanceDetail/151
Crowd Segmentation 高密度人群视频数据
http://dataju.cn/Dataju/web/datasetInstanceDetail/150
Tracking in High Density Crowds 高密度人群视频
http://dataju.cn/Dataju/web/datasetInstanceDetail/152
其他视频
Fire Detection 视频数据
http://dataju.cn/Dataju/web/datasetInstanceDetail/156
4.音频数据
综合音频
Google Audioset 音频数据【数据太大仅有介绍】
http://dataju.cn/Dataju/web/datasetInstanceDetail/243
语音识别
Sinhala TTS 英语语音识别
http://dataju.cn/Dataju/web/datasetInstanceDetail/200
TIMIT 美式英语语音识别数据
http://dataju.cn/Dataju/web/datasetInstanceDetail/186
LibriSpeech ASR corpus 语音数据
http://dataju.cn/Dataju/web/datasetInstanceDetail/164
Room Impulse Response and Noise 语音数据
http://dataju.cn/Dataju/web/datasetInstanceDetail/251
ALFFA 非洲语音数据
http://dataju.cn/Dataju/web/datasetInstanceDetail/252
THUYG-20 维吾尔语语音数据
http://dataju.cn/Dataju/web/datasetInstanceDetail/194
AMI Corpus 语音识别
http://dataju.cn/Dataju/web/datasetInstanceDetail/191
5.自然语言处理
RCV1英语新闻数据
http://dataju.cn/Dataju/web/datasetInstanceDetail/96
20news 英语新闻数据
http://dataju.cn/Dataju/web/datasetInstanceDetail/93
First Quora Release Question Pairs 问答数据
http://dataju.cn/Dataju/web/datasetInstanceDetail/90
JRC Names各国语言专有实体名称
http://dataju.cn/Dataju/web/datasetInstanceDetail/78
Multi-Domain Sentiment V2.0
http://dataju.cn/Dataju/web/datasetInstanceDetail/94
LETOR 信息检索数据
http://dataju.cn/Dataju/web/datasetInstanceDetail/92
Yale Youtube Vedio Text
http://dataju.cn/Dataju/web/datasetInstanceDetail/89
斯坦福问答数据【Kaggle数据】
http://dataju.cn/Dataju/web/datasetInstanceDetail/205
美国假新闻数据【Kaggle数据】
http://dataju.cn/Dataju/web/datasetInstanceDetail/221
NIPS会议文章信息数据(1987-2016)【Kaggle数据】
http://dataju.cn/Dataju/web/datasetInstanceDetail/212
2016年美国总统选举辩论数据【Kaggle数据】
http://dataju.cn/Dataju/web/datasetInstanceDetail/268
WikiLinks 跨文档指代语料
http://dataju.cn/Dataju/web/datasetInstanceDetail/269
European Parliament Proceedings Parallel Corpus 机器翻译数据
http://dataju.cn/Dataju/web/datasetInstanceDetail/277
WikiText 英语语义词库数据
http://dataju.cn/Dataju/web/datasetInstanceDetail/285
WMT 2011 News Crawl 机器翻译数据
http://dataju.cn/Dataju/web/datasetInstanceDetail/272
Stanford Sentiment Treebank 词汇数据
http://dataju.cn/Dataju/web/datasetInstanceDetail/288
英语语言模型单词预测竞赛数据
http://dataju.cn/Dataju/web/datasetInstanceDetail/334
站稳了哟,有人
拆桥呢。。。。。
猛戳原文,提前塞满购物车