会员服务 ·

人体姿态估计相关开源数据集介绍及汇总

2022 年 3 月 27 日 极市平台

↑ 点击蓝字关注极市平台

编辑丨极市平台

极市导读

本文收集整理了一些开源的姿态估计相关的数据集，总大小约为55GB，均附有下载链接。 >>加入极市CV技术交流群，走在计算机视觉的最前沿

KTH 多视图足球数据集

数据集链接：http://m6z.cn/692agI

作者收集了一个带有注释关节的足球运动员数据集，可用于多视图重建。数据集包括：

771张足球运动员的照片
在 257 个时间实例中从 3 个视图中获取的图像
14 个带注释的身体关节

宾夕法尼亚动作数据集

数据集链接：http://m6z.cn/692akK

Penn Action Dataset（宾夕法尼亚大学）包含 15 个不同动作的 2326 个视频序列以及每个序列的人类联合注释。

BBC姿态数据集

数据集链接：http://m6z.cn/5xr6Xq

BBC Pose 包含 20 个视频（每个视频长度为 0.5 小时至 1.5 小时），由 BBC 录制，并配有手语翻译。这 20 个视频分为 10 个用于训练的视频、5 个用于验证的视频和 5 个用于测试的视频。

Poser 数据集

数据集链接：http://m6z.cn/6gynqz

Poser 数据集是用于姿态估计的数据集，由 1927 个训练图像和 418 个测试图像组成。这些图像是综合生成的，并调整为单峰预测。这些图像是使用 Poser 软件包生成的。

野外 3D 姿势数据集

数据集链接：http://m6z.cn/5xr6Z2

“野外 3D 姿势数据集”是野外第一个具有准确 3D 姿势用于评估的数据集。虽然存在户外其他数据集，但它们都仅限于较小的记录量。3DPW 是第一个包含从移动电话摄像头拍摄的视频片段的技术。

数据集包括：

60 个视频序列。
2D 姿势注释。
使用我们的方法获得的 3D 姿势。我们的方法利用了视频和 IMU，尽管场景很复杂，但姿势非常准确。
序列中每一帧的相机姿势。
3D 身体扫描和 3D 人物模型（可重新调整和重新塑造）。每个序列都包含其对应的模型。
18 个不同服装款式的 3D 模型。

V-COCO数据集

数据集链接：http://m6z.cn/5UGaii

V-COCO是一个基于 COCO 的数据集，用于人机交互检测。V-COCO 提供 10,346 张图像（2,533 张用于训练，2,867 张用于验证，4,946 张用于测试）和 16,199 个人物实例。每个人都有 29 个动作类别的注释，并且没有包括对象在内的交互标签。

宜家 ASM 数据集

数据集链接：http://m6z.cn/692aos

宜家 ASM 数据集是装配任务的多模式和多视图视频数据集，可对人类活动进行丰富的分析和理解。它包含 371 个家具组件样本及其真实注释。每个样本包括 3 个 RGB 视图、一个深度流、原子动作、人体姿势、对象片段、对象跟踪和外部相机校准。

立体人体姿势估计数据集

数据集链接：http://m6z.cn/62cnp5

这是一个立体图像对数据集，适用于上身人的立体人体姿态估计。SHPED 由 630 个立体图像对（即 1260 个图像）组成，分为 42 个视频片段，每个片段 15 帧。这些剪辑是从 26 个立体视频中提取的，这些视频是从 YouTube 获得的，标签为 yt3d:enable = true。此外，SHPED 包含 1470 条火柴人上身注释，对应于 49 个人根据这些条件：直立位置、所有上身部分几乎可见以及身体的非侧面视点。

AIST++ 舞蹈动作数据集

数据集链接：http://m6z.cn/5xr6M8

AIST++ 舞蹈动作数据集是从 AIST 舞蹈视频数据库构建的。对于多视图视频，设计了一个精心设计的管道来估计相机参数、3D 人体关键点和 3D 人体舞蹈动作序列：

它为 1010 万张图像提供 3D 人体关键点注释和相机参数，涵盖 9 个视图中的 30 个不同主题。这些属性使其成为具有 3D 人体关键点注释的最大和最丰富的现有数据集。它还包含 1,408 个 3D 人类舞蹈动作序列，表示为关节旋转以及根轨迹。舞蹈动作平均分布在 10 种舞蹈流派中，有数百种编舞。运动持续时间从 7.4 秒不等。至 48.0 秒。所有的舞蹈动作都有相应的音乐。