进行数据挖掘、实现公司产品需求、研究新的智能分析算法、对现有算法进行优化以提升用户体验……这些就是算法工程师的本职工作内容。但真实情况又是怎样的呢?
当谈及他们80%的时间在做什么,几乎每位算法工程师都有一肚子话要讲。
那就是找数据。明明工程师已经准备了很多优质的数据集,但是其他成员并不知道,开始重复造轮子!!
7年算法工程师-陆先生
4年算法工程师-李小姐
进入研发前花大量时间进行模型预研,需要找寻相关的数据集,于是就在数据的可视化、标签转换上白白耗费了很多心血!
作为大数据时代背景下的互联网从业者,我们每时每刻都在和数据打交道,算法工程师们当然不例外。在一个合格模型的诞生过程中,繁杂的数据收集与处理工作往往给算法工程师带来了低效的工作体验。
但从现在开始,我们再也不用为此担忧了,因为小编发现了它——Graviti Open Dataset,一款绝佳的免费数据集聚合平台。
一、丰富多元的数据集种类
目前该平台上线仅一月,就已经收录了1000多个高质量人工智能数据集。目前已覆盖2D/3D目标检测、图像分割、图像分类、目标跟踪、OCR、姿态估计、无人驾驶、智慧零售、机器人等多种AI应用领域。与此同时,它还包含了点云、图像、视频序列、三维模型等多种数据格式。
以下两张图片就展示了刚搜到的无人驾驶方面海量优质数据。
(KITTI-object,含有2D/3D目标检测点云和图像数据)
(Synscapes,含25000个真实街景图像)
二、便捷迅速的数据集查找
想找心仪数据集,现在一目了然。你不仅可以靠数据集的内容关键词搜索,还可以通过应用行业、标注类型等属性进行多维度查询。
众所周知:找数据难,找海外数据更是难上加难。但拥有Graviti网站就像拥有一把万能钥匙——例如想进行最新的COVID肺部医学影像检测模型训练,只需要随手输入“COVID”即可一键抵达。
(搜索得到的优质数据集示例)
还有更多医学影像数据集,勾选“medical”进行行业搜索即得。
(更多医学相关数据集)
三、直接美观的数据集可视化
话不多说,先上图片。
(训练集人像截取示例)
(图像多元素分类)
无需下载即可浏览样例数据,更有多种可视化方案供你随时查看。再也不用担心费劲下完整套数据才发现根本不是自己想要的内容。还没有心动吗?
四、畅通高速的海外数据下载
压轴亮点来了!很多时候,我们的数据获取渠道都只提供主流的国内公开数据集,而更普适的模型却需要用海内外的多元数据去共同训练。
针对海外数据获取难、下载慢的问题,Graviti给出了一站式解决方案。将全球资源Host至国内镜像,无需VPN访问,满带宽极速下载。和小编自己进入海外官网下载相比,在Graviti,至少提速100%。从此告别繁琐的登录注册流程,告别令人抓狂的下载时长。
(普通带宽下载海外数据,实测就有10MB/s的速度)
那么问题来了,海外下载提速需要会员吗?还是多少钱一次呢?
答案是——完全免费。
实际上,在Graviti,还有更多有趣又高质量的数据集在持续更新中,快来一起探索吧!
一键获取数据集↓
↑进官方微信群
阅读原文,一键直达。