这个CV数据集生成器火了，支持13类复杂CV任务，DeepMind谷歌MIT等打造丨开源

会员服务 ·

这个CV数据集生成器火了，支持13类复杂CV任务，DeepMind谷歌MIT等打造丨开源

2022 年 3 月 19 日 极市平台

↑ 点击蓝字关注极市平台

来源丨量子位

编辑丨极市平台

极市导读

来自谷歌、MIT、DeepMind、MILA和剑桥大学等11家机构的34名研究人员，联手打造了一个名叫Kubric的数据集生成器，不仅能自己渲染，而且图像效果也非常真实。 >>加入极市CV技术交流群，走在计算机视觉的最前沿

这年头，AI玩家们想找到合适的图像数据集，简直是越来越难了。

不仅数据质量参差不齐，合适的数据类型也难找（如光流图、深度图等）。

为了解决这些问题，来自谷歌、MIT、DeepMind、MILA和剑桥大学等11家机构的34名研究人员，联手打造了一个名叫Kubric的数据集生成器，不仅能自己渲染，而且图像效果也非常真实。

不仅各种图像数据都能做，像语义分割、深度图或光流图这种“特殊数据”都能一键生成：

还能控制渲染的真实度，渲染出的视频可以达到以假乱真的效果：

据作者们表示，目前Kubric支持13类CV任务的数据类型生成，效果也不比用已有数据集训练出来的差。

这样的一个数据集生成器，到底要怎么上手？

可生成13类CV任务所需数据

先来看看这个Kubric数据集生成器究竟是个啥。

简单来说，它有点像是一个专为图像AI打造的“数据车间”，基于跨平台开源物理引擎PyBullet和3D图像渲染软件Blender打造。

其中，PyBullet给用户提供了一个模拟3D物体运动的平台，例如两个球之间的弹性碰撞参数就可以用它来模拟。（当然，除了PyBullet以外，也可以扩展到其他物理引擎如MuJoCo上）

Blender则是一个渲染3D动画的平台，但它的优势在于操作方便，而且既可以做出照片级逼真的渲染图像，也可以输出3D动画效果。（例如有设计师拿它设计服装纹理）

可能这时候你会问，Kubric相比自己手动渲染视频或图像数据集，方便在哪？

一方面，Kubric自带一系列预处理的基础图像数据库。

除了11个基础3D模型以外：

还内置了Google Scanned Objects（GSO）室内家具物品数据集中的一系列模型，以及包含背景、光照、材料纹理等参数的Polyhaven数据集，还有ShapeNet数据集等（包含55种常见的物品类型及51300个3D模型）。

也就是说，如果你对渲染不太了解，也能利用内置的数据库快速生成想要的图像。

另一方面，Kubric直接提供了从“渲染数据”到输出“AI训练数据”的管道，省去了将渲染图像转成特殊数据（如深度图、光流图）、或是额外收集如视场、相机参数、光照等数据的麻烦。

这也使得Kubric支持生成13类CV任务所需的图像数据，具体包括光流、NeRF、姿态估计、3D重建等。

没错，即使这些生成的图像中有2D也有3D类型，需要的数据量也从MB到TB级别不等，但Kubric都能满足。

嗯，作者们还专门针对各种视觉任务，用Kubric生成的数据集一个个试了试，强调“用他们生成的数据集效果更好”。

△Kubric生成的光流图

那么，这样的数据集生成器究竟要怎么用呢？

自带Python接口

作者提供了一些简单的操作流程。

在安装之后，第一步就是创建默认场景：

然后，再通过这两步，分别创建一块地板、和一个球体（也可以换成其他形状）：

接下来就是在场景中加一个照明，以及渲染摄像头采集图像：

导出文件后，就能获取一个3D球体的图像了：

△Blender中的效果

如果需要深度图、灰度图等特殊图层的话，也是几行代码就能搞定：

比自己手动导出要更方便一些：

当然，如果还是感觉上手较难，作者也直接提供了示例代码，改改参数就能用：

在原基础上，再加5行代码就能直接运行出动态视频版：

看起来，做完数据集后，即使不懂渲染的也能成为半个行家了（doge）

目前新的一批内置数据集还在施工中，感兴趣的小伙伴可以先上手试玩~

项目地址：
https://github.com/google-research/kubric

论文地址：
https://arxiv.org/abs/2203.03570

参考链接：
https://twitter.com/taiyasaki/status/1501288630697877504

公众号后台回复“数据集”获取60+深度学习数据集下载～

△点击卡片关注极市平台，获取最新CV干货

极市干货

数据集资源汇总： 10个开源工业检测数据集汇总｜ 21个深度学习开源数据集分类汇总

算法trick ：目标检测比赛中的tricks集锦｜从39个kaggle竞赛中总结出来的图像分割的Tips和Tricks

技术综述：一文弄懂各种loss function ｜工业图像异常检测最新研究总结（2019-2020）

# CV技术社群邀请函 #

△长按添加极市小助手

添加极市小助手微信（ID : cvmart4）

备注：姓名-学校/公司-研究方向-城市（如：小极-北大-目标检测-深圳）

即可申请加入极市目标检测/图像分割/工业检测/人脸/医学影像/3D/SLAM/自动驾驶/超分辨率/姿态估计/ReID/GAN/图像增强/OCR/视频理解等技术交流群

每月大咖直播分享、真实项目需求对接、求职内推、算法竞赛、干货资讯汇总、与 10000+来自港科大、北大、清华、中科院、CMU、腾讯、百度等名校名企视觉开发者互动交流~

觉得有用麻烦给个在看啦~

登录查看更多

相关内容

生成器

关注 2

生成器是一次生成一个值的特殊类型函数。可以将其视为可恢复函数。调用该函数将返回一个可用于生成连续 x 值的生成【Generator】，简单的说就是在函数的执行过程中，yield语句会把你需要的值返回给调用生成器的地方，然后退出函数，下一次调用生成器函数的时候又从上次中断的地方开始执行，而生成器内的所有变量参数都会被保存下来供下一次使用。

【CVPR2022】好玩有趣的新成果：GAN监督学习实现密集视觉对齐（代码开源，附slides，伯克利、CMU、MIT等联合发表）

专知会员服务

30+阅读 · 2022年3月16日

【ICCV2021】一张草图训练可控的GAN？CMU朱俊彦团队

专知会员服务

22+阅读 · 2021年8月10日

MIT《图神经网络的任务结构与泛化》，22页ppt

专知会员服务

24+阅读 · 2021年2月28日

【GitHub实战】Pytorch实现的小样本逼真的视频到视频转换

专知会员服务

36+阅读 · 2019年12月15日