在公共基准数据集上,当前的动作识别技术已经取得了巨大的成功。然而,在现实世界的应用中,例如体育分析,它需要将一项活动分解成几个阶段,并区分细微不同的动作,它们的性能仍然远远不能令人满意。为了将动作识别提升到一个新的水平,我们开发了FineGym,一个建立在体操视频之上的新数据集。与现有的动作识别数据集相比,FineGym具有丰富、优质和多样性的特点。特别是,它提供了一个三层语义层次的动作和子动作级别的临时注释。例如,一个“平衡木”事件将被注释为来自5个集合的基本子动作序列:“leap-jump-hop”、“beam-turns”、“flight-salto”、“flight-handspring”和“dismount”,其中每个集合中的子动作将被进一步注释为定义良好的类标签。这种新的粒度级别对操作识别提出了重大挑战,例如如何从一个一致的操作解析时间结构,以及如何区分细微不同的操作类。我们系统地研究了该数据集上的代表性方法,并获得了一些有趣的发现。我们希望这个数据集可以促进动作理解的研究。

成为VIP会员查看完整内容
25

相关内容

【CVPR2020-Oral】用于深度网络的任务感知超参数
专知会员服务
28+阅读 · 2020年5月25日
【CVPR2020-旷视】DPGN:分布传播图网络的小样本学习
专知会员服务
27+阅读 · 2020年4月1日
已删除
将门创投
11+阅读 · 2019年8月13日
李飞飞等ICLR2019论文:构建人类眼睛感知评估
全球人工智能
4+阅读 · 2019年6月4日
商汤及联合实验室入选论文重点解读 | ECCV 2018
ETP:精确时序动作定位
极市平台
13+阅读 · 2018年5月25日
Arxiv
27+阅读 · 2018年4月12日
Arxiv
3+阅读 · 2018年1月31日
Arxiv
3+阅读 · 2018年1月10日
VIP会员
相关资讯
已删除
将门创投
11+阅读 · 2019年8月13日
李飞飞等ICLR2019论文:构建人类眼睛感知评估
全球人工智能
4+阅读 · 2019年6月4日
商汤及联合实验室入选论文重点解读 | ECCV 2018
ETP:精确时序动作定位
极市平台
13+阅读 · 2018年5月25日
微信扫码咨询专知VIP会员