全网最全的数据集网站汇总贴

2020 年 11 月 6 日 AINLP

Wikipedia

  • 网址:https://en.wikipedia.org/wiki/List_of_datasets_for_machine-learning_research
  • 内容:Wikipedia List of datasets for machine-learning research.
  • 数据集数量:中等;
  • 是否提供下载链接:不提供;
  • 推荐指数:⭐️⭐️

UCI

  • 网址:https://archive.ics.uci.edu/ml/index.php
  • 内容:UCI Machine Learning Repository;
  • 数据集数量:较多;
  • 是否提供下载链接:提供;
  • 推荐指数:⭐️⭐️⭐️⭐️

figshare

  • 网址:https://figshare.com/
  • 内容:研究成果共享平台;
  • 数据集数量:较多;
  • 是否提供下载链接:提供;
  • 推荐指数:⭐️⭐️⭐️

data.gov

  • 网址:https://www.data.gov/
  • 内容:美国政府开发数据;
  • 数据集数量:较多;
  • 是否提供下载链接:提供;
  • 推荐指数:⭐️⭐️⭐️

datasetlist

  • 网址:https://www.datasetlist.com/
  • 内容:Machine learning datasets
  • 数据集数量:中等;
  • 是否提供下载链接:不提供;
  • 推荐指数:⭐️⭐️⭐️

谷歌数据集搜索

  • 网址:https://datasetsearch.research.google.com/
  • 内容:Goggle datasets search;
  • 数据集数量:较多;
  • 是否提供下载链接:不提供;
  • 推荐指数:⭐️⭐️

bifrost

  • 网址:https://datasets.bifrost.ai/
  • 内容:Search for visual datasets
  • 数据集数量:中等;
  • 是否提供下载链接:不提供;
  • 推荐指数:⭐️⭐️

Kaggle Datasets

  • 网址:https://www.kaggle.com/datasets
  • 内容:Find and use datasets or complete tasks;
  • 数据集数量:较多;
  • 是否提供下载链接:提供;
  • 推荐指数:⭐️⭐️⭐️⭐️⭐️

computervisiononline

  • 网址:https://computervisiononline.com/datasets
  • 内容:Computer Vision Online Datasets;
  • 数据集数量:中等;
  • 是否提供下载链接:不提供;
  • 推荐指数:⭐️⭐️⭐️⭐️

VisualData

  • 网址:https://www.visualdata.io/discovery
  • 内容:Best place to find and share computer vision datasets;
  • 数据集数量:中等;
  • 是否提供下载链接:不提供;
  • 推荐指数:⭐️⭐️⭐️

CVonline

  • 网址:http://homepages.inf.ed.ac.uk/rbf/CVonline/Imagedbase.htm
  • 内容:This is a collated list of image and video databases that people have found useful for computer vision research and algorithm evaluation.
  • 数据集数量:较多;
  • 是否提供下载链接:不提供;
  • 推荐指数:⭐️⭐️⭐️⭐️

hyper

  • 网址:https://hyper.ai/datasets
  • 内容:收集了 343 个公开数据集资源,整理并提供相应的存储服务;
  • 数据集数量:中等;
  • 是否提供下载链接:不提供;
  • 推荐指数:⭐️⭐️⭐️

格物钛

  • 网址:https://www.graviti.cn/open-datasets
  • 内容:公开数据集;
  • 数据集数量:中等;
  • 是否提供下载链接:提供;
  • 推荐指数:⭐️⭐️⭐️⭐️⭐️

由于微信平台算法改版,公号内容将不再以时间排序展示,如果大家想第一时间看到我们的推送,强烈建议星标我们和给我们多点点【在看】。星标具体步骤为:

(1)点击页面最上方"AINLP",进入公众号主页。

(2)点击右上角的小点点,在弹出页面点击“设为星标”,就可以啦。

感谢支持,比心

欢迎加入推荐系统交流群
进群请添加AINLP小助手微信 AINLPer(id: ainlper),备注推荐系统

推荐阅读

这个NLP工具,玩得根本停不下来

征稿启示| 200元稿费+5000DBC(价值20个小时GPU算力)

完结撒花!李宏毅老师深度学习与人类语言处理课程视频及课件(附下载)

从数据到模型,你可能需要1篇详实的pytorch踩坑指南

如何让Bert在finetune小数据集时更“稳”一点

模型压缩实践系列之——bert-of-theseus,一个非常亲民的bert压缩方法

文本自动摘要任务的“不完全”心得总结番外篇——submodular函数优化

Node2Vec 论文+代码笔记

模型压缩实践收尾篇——模型蒸馏以及其他一些技巧实践小结

中文命名实体识别工具(NER)哪家强?

学自然语言处理,其实更应该学好英语

斯坦福大学NLP组Python深度学习自然语言处理工具Stanza试用

关于AINLP

AINLP 是一个有趣有AI的自然语言处理社区,专注于 AI、NLP、机器学习、深度学习、推荐算法等相关技术的分享,主题包括文本摘要、智能问答、聊天机器人、机器翻译、自动生成、知识图谱、预训练模型、推荐系统、计算广告、招聘信息、求职经验分享等,欢迎关注!加技术交流群请添加AINLPer(id:ainlper),备注工作/研究方向+加群目的。


阅读至此了,分享、点赞、在看三选一吧🙏

登录查看更多
0

相关内容

数据集,又称为资料集、数据集合或资料集合,是一种由数据所组成的集合。
Data set(或dataset)是一个数据的集合,通常以表格形式出现。每一列代表一个特定变量。每一行都对应于某一成员的数据集的问题。它列出的价值观为每一个变量,如身高和体重的一个物体或价值的随机数。每个数值被称为数据资料。对应于行数,该数据集的数据可能包括一个或多个成员。
【干货书】Python数据科学入门,464页pdf
专知会员服务
72+阅读 · 2020年9月20日
【2020新书】实战R语言4,323页pdf
专知会员服务
100+阅读 · 2020年7月1日
谷歌机器学习速成课程中文版pdf
专知会员服务
145+阅读 · 2019年12月4日
【推荐系统/计算广告/机器学习/CTR预估资料汇总】
专知会员服务
87+阅读 · 2019年10月21日
【深度学习视频分析/多模态学习资源大列表】
专知会员服务
91+阅读 · 2019年10月16日
机器学习入门的经验与建议
专知会员服务
92+阅读 · 2019年10月10日
计算机视觉最佳实践、代码示例和相关文档
专知会员服务
17+阅读 · 2019年10月9日
TensorFlow 2.0 学习资源汇总
专知会员服务
66+阅读 · 2019年10月9日
机器学习相关资源(框架、库、软件)大列表
专知会员服务
39+阅读 · 2019年10月9日
【干货】20大推荐系统公共数据集分享
机器学习与推荐算法
57+阅读 · 2020年3月13日
集成学习相关资源大列表
专知
9+阅读 · 2019年8月5日
干货 | 100+个NLP数据集大放送,再不愁数据!
数据派THU
11+阅读 · 2018年5月2日
【资源】史上最全数据集汇总
七月在线实验室
18+阅读 · 2018年4月24日
不要担心没数据!史上最全数据集网站汇总
各领域机器学习数据集汇总(附下载地址)
七月在线实验室
4+阅读 · 2018年1月31日
【推荐】Kaggle机器学习数据集推荐
机器学习研究会
8+阅读 · 2017年11月19日
自然语言处理数据集免费资源开放(附学习资料)
福利 | 最全面超大规模数据集下载链接汇总
AI研习社
26+阅读 · 2017年9月7日
Arxiv
0+阅读 · 2021年1月26日
Arxiv
0+阅读 · 2021年1月21日
Arxiv
0+阅读 · 2021年1月17日
Arxiv
27+阅读 · 2020年12月24日
A Comprehensive Survey on Transfer Learning
Arxiv
121+阅读 · 2019年11月7日
VIP会员
相关VIP内容
【干货书】Python数据科学入门,464页pdf
专知会员服务
72+阅读 · 2020年9月20日
【2020新书】实战R语言4,323页pdf
专知会员服务
100+阅读 · 2020年7月1日
谷歌机器学习速成课程中文版pdf
专知会员服务
145+阅读 · 2019年12月4日
【推荐系统/计算广告/机器学习/CTR预估资料汇总】
专知会员服务
87+阅读 · 2019年10月21日
【深度学习视频分析/多模态学习资源大列表】
专知会员服务
91+阅读 · 2019年10月16日
机器学习入门的经验与建议
专知会员服务
92+阅读 · 2019年10月10日
计算机视觉最佳实践、代码示例和相关文档
专知会员服务
17+阅读 · 2019年10月9日
TensorFlow 2.0 学习资源汇总
专知会员服务
66+阅读 · 2019年10月9日
机器学习相关资源(框架、库、软件)大列表
专知会员服务
39+阅读 · 2019年10月9日
相关资讯
【干货】20大推荐系统公共数据集分享
机器学习与推荐算法
57+阅读 · 2020年3月13日
集成学习相关资源大列表
专知
9+阅读 · 2019年8月5日
干货 | 100+个NLP数据集大放送,再不愁数据!
数据派THU
11+阅读 · 2018年5月2日
【资源】史上最全数据集汇总
七月在线实验室
18+阅读 · 2018年4月24日
不要担心没数据!史上最全数据集网站汇总
各领域机器学习数据集汇总(附下载地址)
七月在线实验室
4+阅读 · 2018年1月31日
【推荐】Kaggle机器学习数据集推荐
机器学习研究会
8+阅读 · 2017年11月19日
自然语言处理数据集免费资源开放(附学习资料)
福利 | 最全面超大规模数据集下载链接汇总
AI研习社
26+阅读 · 2017年9月7日
Top
微信扫码咨询专知VIP会员