来源:量子位
中科院发布了一个目标追踪数据集,叫做Got-10k。很大,很精致。
它包含了超过10,000条视频,主角都是在现实世界里移动的物体,分成560多个类别。
物体的边界框全部是手动标记,总计超过150万个。
除此之外,数据集还是个Benchmark,可以用来衡量模型的性能,也已经有排行榜了。
官方还提供Python工具包,以便小伙伴们用这个Benchmark来测试自己的AI。
那么,来仔细观察一下数据集,吧。
除了规模大,Got-10k还有许多重要的特质。
数据集是以WordNet英文词汇数据库作为骨架,搭建起来的。分成5个大类:
动物 (Animal) 、人造物体 (Artifact) 、人物 (Person) 、自然物体 (Natural Object) ,以及Part。
大类之下再细分,一共563个类别。
上面讲的是目标类别,只是数据的其中一个标签。
另一个标签是动作类别,一共分为87种。一部分按照WordNet来划分,还有一部分是数据收集者定义的。
为了训练出的模型能有更强的泛化能力,训练集和测试集之间不存在交集。
模型可以用少量的数据去学习分类,这样也能避免测试结果偏向AI熟悉的那些样本类别。
所有方法都用相同的训练数据。依靠这样的协议,来保障所有追踪器之间的公平对比。
除了目标类别、动作类别和标记框之外,还有其他标签。
比如,目标可见比 (针对遮挡或者出画的情况) ,负责监督那些难度比较大的任务。
测试集包含180段视频,分属于84个目标类别,32个动作类别,用来衡量模型的追踪能力。
现在,完整的GOT-10k数据集已经可以下载了。
并且,评估服务器 (Evaluation Server) 准备好为各路模型打分了,排行榜也会实时更新。
温暖的官方为小伙伴们提供了Python工具包,用来运行实验,方便在Benchmark上评估性能。
另外,除了Python工具包,还有MATLAB工具包。
你还不来么?
数据集传送门:
http://got-10k.aitestunion.com/downloads
Python工具包:
https://github.com/got-10k/toolkit
MATLAB工具包:
https://github.com/got-10k/toolkit-matlab
数据集论文:
https://arxiv.org/abs/1810.11981
☞ OpenPV平台发布在线的ParallelEye视觉任务挑战赛
☞【学界】OpenPV:中科院研究人员建立开源的平行视觉研究平台
☞【学界】ParallelEye:面向交通视觉研究构建的大规模虚拟图像集
☞【CFP】Virtual Images for Visual Artificial Intelligence
☞【最详尽的GAN介绍】王飞跃等:生成式对抗网络 GAN 的研究进展与展望
☞【智能自动化学科前沿讲习班第1期】王飞跃教授:生成式对抗网络GAN的研究进展与展望
☞【智能自动化学科前沿讲习班第1期】王坤峰副研究员:GAN与平行视觉
☞【重磅】平行将成为一种常态:从SimGAN获得CVPR 2017最佳论文奖说起
☞【学界】Ian Goodfellow等人提出对抗重编程,让神经网络执行其他任务
☞【学界】六种GAN评估指标的综合评估实验,迈向定量评估GAN的重要一步
☞【资源】T2T:利用StackGAN和ProGAN从文本生成人脸
☞【学界】 CVPR 2018最佳论文作者亲笔解读:研究视觉任务关联性的Taskonomy
☞【业界】英特尔OpenVINO™工具包为创新智能视觉提供更多可能
☞【学界】ECCV 2018: 对抗深度学习: 鱼 (模型准确性) 与熊掌 (模型鲁棒性) 能否兼得