【学界】中科院发布了目标追踪数据集，1万多条视频，150万个边界框

2018 年 12 月 31 日 GAN生成式对抗网络

来源：量子位

中科院发布了一个目标追踪数据集，叫做Got-10k。很大，很精致。

它包含了超过10,000条视频，主角都是在现实世界里移动的物体，分成560多个类别。

物体的边界框全部是手动标记，总计超过150万个。

除此之外，数据集还是个Benchmark，可以用来衡量模型的性能，也已经有排行榜了。

官方还提供Python工具包，以便小伙伴们用这个Benchmark来测试自己的AI。

那么，来仔细观察一下数据集，吧。

事无巨细

除了规模大，Got-10k还有许多重要的特质。

通用类别 (Generic Classes)

数据集是以WordNet英文词汇数据库作为骨架，搭建起来的。分成5个大类：

动物 (Animal) 、人造物体 (Artifact) 、人物 (Person) 、自然物体 (Natural Object) ，以及Part。

大类之下再细分，一共563个类别。

上面讲的是目标类别，只是数据的其中一个标签。

另一个标签是动作类别，一共分为87种。一部分按照WordNet来划分，还有一部分是数据收集者定义的。

单样本学习 (One-Shot Learning)

为了训练出的模型能有更强的泛化能力，训练集和测试集之间不存在交集。

模型可以用少量的数据去学习分类，这样也能避免测试结果偏向AI熟悉的那些样本类别。

统一训练数据 (Unified Training Data)

所有方法都用相同的训练数据。依靠这样的协议，来保障所有追踪器之间的公平对比。

额外标记 (Extra Labeling)

除了目标类别、动作类别和标记框之外，还有其他标签。

比如，目标可见比 (针对遮挡或者出画的情况) ，负责监督那些难度比较大的任务。

有效评估 (Efficient Evaluation)

测试集包含180段视频，分属于84个目标类别，32个动作类别，用来衡量模型的追踪能力。

万事俱备，只差你了

现在，完整的GOT-10k数据集已经可以下载了。

并且，评估服务器 (Evaluation Server) 准备好为各路模型打分了，排行榜也会实时更新。

温暖的官方为小伙伴们提供了Python工具包，用来运行实验，方便在Benchmark上评估性能。

另外，除了Python工具包，还有MATLAB工具包。

你还不来么？

△ 这样好像可以玩一天

数据集传送门：
http://got-10k.aitestunion.com/downloads

Python工具包：
https://github.com/got-10k/toolkit

MATLAB工具包：
https://github.com/got-10k/toolkit-matlab

数据集论文：
https://arxiv.org/abs/1810.11981

高质量延伸阅读

☞ OpenPV平台发布在线的ParallelEye视觉任务挑战赛

☞【学界】第1届“智能车辆中的平行视觉”研讨会成功举行

☞【学界】生成式对抗网络：从生成数据到创造智能

☞【学界】OpenPV：中科院研究人员建立开源的平行视觉研究平台

☞【学界】基于平行视觉的特定场景下行人检测

☞【学界】ParallelEye：面向交通视觉研究构建的大规模虚拟图像集

☞【CFP】Virtual Images for Visual Artificial Intelligence

☞【最详尽的GAN介绍】王飞跃等：生成式对抗网络 GAN 的研究进展与展望

☞【智能自动化学科前沿讲习班第1期】王飞跃教授：生成式对抗网络GAN的研究进展与展望

☞【智能自动化学科前沿讲习班第1期】王坤峰副研究员：GAN与平行视觉

☞【重磅】平行将成为一种常态：从SimGAN获得CVPR 2017最佳论文奖说起

☞【平行讲坛】平行图像：图像生成的一个新型理论框架

☞【学界】基于生成对抗网络的低秩图像生成方法

☞【学界】Ian Goodfellow等人提出对抗重编程，让神经网络执行其他任务

☞【学界】六种GAN评估指标的综合评估实验，迈向定量评估GAN的重要一步

☞【资源】T2T：利用StackGAN和ProGAN从文本生成人脸

☞【学界】 CVPR 2018最佳论文作者亲笔解读：研究视觉任务关联性的Taskonomy

☞【业界】英特尔OpenVINO™工具包为创新智能视觉提供更多可能

☞【学界】ECCV 2018: 对抗深度学习: 鱼 (模型准确性) 与熊掌 (模型鲁棒性) 能否兼得

登录查看更多

相关内容

目标追踪

关注 2

【干货课】计算机视觉领域自适应，59页ppt，UCSD加州大学圣地亚哥分校

专知会员服务

55+阅读 · 2020年6月26日

【ICML2020】小样本目标检测

专知会员服务

91+阅读 · 2020年6月2日

斯坦福2020硬课《分布式算法与优化》

专知会员服务

123+阅读 · 2020年5月6日

【CVPR2020-谷歌】多目标(车辆)跟踪与检测框架 RetinaTrack

专知会员服务

45+阅读 · 2020年4月10日

【CVPR2020-牛津-谷歌】语音到动作:动作识别的跨模态监督，Cross-modal Supervision

专知会员服务

24+阅读 · 2020年3月31日

【CVPR2020】从未标记的视频中学习视频对象分割，Learning Video Object Segmentation from Unlabeled Videos

专知会员服务

36+阅读 · 2020年3月12日

自动驾驶汽车的计算机视觉全面综述论文：问题、数据集和现状，附283页PDF下载

专知会员服务

113+阅读 · 2019年12月20日

【GitHub实战】Pytorch实现的小样本逼真的视频到视频转换

专知会员服务

36+阅读 · 2019年12月15日

零样本图像分类综述 : 十年进展

专知会员服务

128+阅读 · 2019年11月16日

【视频中的零样本动作识别：综述】Zero-Shot Action Recognition in Videos: A Survey

专知会员服务

39+阅读 · 2019年10月12日

CVPR 2019 | 亮风台推出全球最大单目标跟踪数据集 LaSOT

AI科技评论

3+阅读 · 2019年6月27日

视频目标识别资源集合

专知

25+阅读 · 2019年6月15日

280万样本！谷歌开放史上最大分割掩码数据集，开启新一轮挑战赛

极市平台

4+阅读 · 2019年5月10日

63万张！旷视发布最大物体检测数据集Objects365，物体检测竞赛登陆CVPR

极市平台

4+阅读 · 2019年4月19日

竞赛 | 旷视发布通用物体检测数据集 Objects365，开启 CVPR 物体检测挑战赛

AI科技评论

5+阅读 · 2019年4月17日

【学界】CVPR 2019「准满分」论文：英伟达推出首个跨摄像头汽车跟踪数据集

GAN生成式对抗网络

8+阅读 · 2019年3月27日

用PyTorch做物体检测和追踪

AI研习社

12+阅读 · 2019年1月6日

谷歌发布最大图像标注数据集，190 万张图片开启公开图像挑战赛

AI研习社

7+阅读 · 2018年5月1日

一文带你入门视频目标分割（附数据集）

THU数据派

19+阅读 · 2017年10月10日

入门 | 一文概览视频目标分割

机器之心

10+阅读 · 2017年10月6日

Self-training with Noisy Student improves ImageNet classification

Arxiv

15+阅读 · 2019年11月11日

Object Hallucination in Image Captioning

Arxiv

3+阅读 · 2019年3月29日

Deep High-Resolution Representation Learning for Human Pose Estimation

Arxiv

5+阅读 · 2019年2月25日

Speeding-up Object Detection Training for Robotics with FALKON

Arxiv

6+阅读 · 2018年8月27日

Diverse Image-to-Image Translation via Disentangled Representations

Arxiv

13+阅读 · 2018年8月2日

Show, Tell and Discriminate: Image Captioning by Self-retrieval with Partially Labeled Data

Arxiv

4+阅读 · 2018年7月23日

Discovering Discrete Latent Topics with Neural Variational Inference

Arxiv

9+阅读 · 2018年5月21日

Object detection at 200 Frames Per Second

Arxiv

5+阅读 · 2018年5月16日

Detect-and-Track: Efficient Pose Estimation in Videos

Arxiv

5+阅读 · 2018年5月2日

Open Information Extraction on Scientific Text: An Evaluation

Arxiv

6+阅读 · 2018年2月15日