原来算法工程师80%的时间都在努力做好这件事!

2020 年 10 月 14 日 计算机视觉life

    进行数据挖掘、实现公司产品需求、研究新的智能分析算法、对现有算法进行优化以提升用户体验……这些就是算法工程师的本职工作内容。但真实情况又是怎样的呢?

    当谈及他们80%的时间在做什么,几乎每位算法工程师都有一肚子话要讲。


那就是找数据。明明工程师已经准备了很多优质的数据集,但是其他成员并不知道,开始重复造轮子!!

7年算法工程师-陆先生

4年算法工程师-李小姐

进入研发前花大量时间进行模型预研,需要找寻相关的数据集,于是就在数据的可视化、标签转换上白白耗费了很多心血!


    作为大数据时代背景下的互联网从业者,我们每时每刻都在和数据打交道,算法工程师们当然不例外。在一个合格模型的诞生过程中,繁杂的数据收集与处理工作往往给算法工程师带来了低效的工作体验。

    但从现在开始,我们再也不用为此担忧了,因为小编发现了它——Graviti Open Dataset,一款绝佳的免费数据集聚合平台。


一、丰富多元的数据集种

    目前该平台上线仅一月,就已经收录了1000多个高质量人工智能数据集。目前已覆盖2D/3D目标检测、图像分割、图像分类、目标跟踪、OCR、姿态估计、无人驾驶、智慧零售、机器人等多种AI应用领域。与此同时,它还包含了点云、图像、视频序列、三维模型等多种数据格式。


    以下两张图片就展示了刚搜到的无人驾驶方面海量优质数据。

(KITTI-object,含有2D/3D目标检测点云和图像数据)


(Synscapes,含25000个真实街景图像)


二、便捷迅速的数据集查找

    想找心仪数据集,现在一目了然。你不仅可以靠数据集的内容关键词搜索,还可以通过应用行业、标注类型等属性进行多维度查询


    众所周知:找数据难,找海外数据更是难上加难。但拥有Graviti网站就像拥有一把万能钥匙——例如想进行最新的COVID肺部医学影像检测模型训练,只需要随手输入“COVID”即可一键抵达。


(搜索得到的优质数据集示例)


    还有更多医学影像数据集,勾选“medical”进行行业搜索即得。


(更多医学相关数据集)


三、直接美观的数据集可视化

    话不多说,先上图片。

(训练集人像截取示例)


(图像多元素分类)


    无需下载即可浏览样例数据,更有多种可视化方案供你随时查看。再也不用担心费劲下完整套数据才发现根本不是自己想要的内容。还没有心动吗?


四、畅通高速的海外数据下载

    压轴亮点来了!很多时候,我们的数据获取渠道都只提供主流的国内公开数据集,而更普适的模型却需要用海内外的多元数据去共同训练。


    针对海外数据获取难、下载慢的问题,Graviti给出了一站式解决方案。将全球资源Host至国内镜像,无需VPN访问,满带宽极速下载。和小编自己进入海外官网下载相比,在Graviti,至少提速100%从此告别繁琐的登录注册流程,告别令人抓狂的下载时长。


(普通带宽下载海外数据,实测就有10MB/s的速度)


    那么问题来了,海外下载提速需要会员吗?还是多少钱一次呢?

    答案是——完全免费


    实际上,在Graviti,还有更多有趣又高质量的数据集在持续更新中,快来一起探索吧!


一键获取数据集

↑进官方微信群



阅读原文,一键直达。

登录查看更多
1

相关内容

数据集,又称为资料集、数据集合或资料集合,是一种由数据所组成的集合。
Data set(或dataset)是一个数据的集合,通常以表格形式出现。每一列代表一个特定变量。每一行都对应于某一成员的数据集的问题。它列出的价值观为每一个变量,如身高和体重的一个物体或价值的随机数。每个数值被称为数据资料。对应于行数,该数据集的数据可能包括一个或多个成员。
中国工业机器视觉产业发展白皮书,31页pdf
专知会员服务
100+阅读 · 2020年11月14日
英特尔《中国金融行业AI 实战手册》,56页pdf
专知会员服务
37+阅读 · 2020年11月8日
一图搞定ML!2020版机器学习技术路线图,35页ppt
专知会员服务
92+阅读 · 2020年7月28日
【ICML2020】小样本目标检测
专知会员服务
90+阅读 · 2020年6月2日
专知会员服务
121+阅读 · 2020年3月26日
《人工智能2020:落地挑战与应对 》56页pdf
专知会员服务
195+阅读 · 2020年3月8日
模型压缩究竟在做什么?我们真的需要模型压缩么?
专知会员服务
27+阅读 · 2020年1月16日
【大数据白皮书 2019】中国信息通信研究院
专知会员服务
133+阅读 · 2019年12月12日
硬核公开课 | 智能文本信息抽取算法的进阶与应用
人工智能头条
6+阅读 · 2019年7月10日
准备了2个月,终于拿到了推荐算法岗的offer
算法与数据结构
7+阅读 · 2019年5月31日
BP神经网络
Datartisan数据工匠
5+阅读 · 2018年8月9日
智能时代如何构建金融反欺诈体系?
数据猿
12+阅读 · 2018年3月26日
为什么“高大上”的算法工程师变成了数据民工?
数据挖掘入门与实战
5+阅读 · 2018年2月25日
课程 | 推荐系统资深架构师在这里等你!
AI研习社
3+阅读 · 2017年9月7日
Arxiv
0+阅读 · 2020年12月2日
Arxiv
1+阅读 · 2020年12月1日
Arxiv
3+阅读 · 2018年8月27日
Arxiv
19+阅读 · 2018年5月17日
VIP会员
相关VIP内容
中国工业机器视觉产业发展白皮书,31页pdf
专知会员服务
100+阅读 · 2020年11月14日
英特尔《中国金融行业AI 实战手册》,56页pdf
专知会员服务
37+阅读 · 2020年11月8日
一图搞定ML!2020版机器学习技术路线图,35页ppt
专知会员服务
92+阅读 · 2020年7月28日
【ICML2020】小样本目标检测
专知会员服务
90+阅读 · 2020年6月2日
专知会员服务
121+阅读 · 2020年3月26日
《人工智能2020:落地挑战与应对 》56页pdf
专知会员服务
195+阅读 · 2020年3月8日
模型压缩究竟在做什么?我们真的需要模型压缩么?
专知会员服务
27+阅读 · 2020年1月16日
【大数据白皮书 2019】中国信息通信研究院
专知会员服务
133+阅读 · 2019年12月12日
相关资讯
硬核公开课 | 智能文本信息抽取算法的进阶与应用
人工智能头条
6+阅读 · 2019年7月10日
准备了2个月,终于拿到了推荐算法岗的offer
算法与数据结构
7+阅读 · 2019年5月31日
BP神经网络
Datartisan数据工匠
5+阅读 · 2018年8月9日
智能时代如何构建金融反欺诈体系?
数据猿
12+阅读 · 2018年3月26日
为什么“高大上”的算法工程师变成了数据民工?
数据挖掘入门与实战
5+阅读 · 2018年2月25日
课程 | 推荐系统资深架构师在这里等你!
AI研习社
3+阅读 · 2017年9月7日
Top
微信扫码咨询专知VIP会员