Skeleton-based human action recognition has attracted much attention with the prevalence of accessible depth sensors. Recently, graph convolutional networks (GCNs) have been widely used for this task due to their powerful capability to model graph data. The topology of the adjacency graph is a key factor for modeling the correlations of the input skeletons. Thus, previous methods mainly focus on the design/learning of the graph topology. But once the topology is learned, only a single-scale feature and one transformation exist in each layer of the networks. Many insights, such as multi-scale information and multiple sets of transformations, that have been proven to be very effective in convolutional neural networks (CNNs), have not been investigated in GCNs. The reason is that, due to the gap between graph-structured skeleton data and conventional image/video data, it is very challenging to embed these insights into GCNs. To overcome this gap, we reinvent the split-transform-merge strategy in GCNs for skeleton sequence processing. Specifically, we design a simple and highly modularized graph convolutional network architecture for skeleton-based action recognition. Our network is constructed by repeating a building block that aggregates multi-granularity information from both the spatial and temporal paths. Extensive experiments demonstrate that our network outperforms state-of-the-art methods by a significant margin with only 1/5 of the parameters and 1/10 of the FLOPs. Code is available at https://github.com/yellowtownhz/STIGCN.


翻译:以 Skeleton 为基础的人类行动认知已引起人们的极大关注,因为广泛存在可获取的深度传感器。 最近,图形变异网络(GCNs)由于具有模拟图形数据的强大能力,因此被广泛用于这一任务。 相邻图形图的地形学是建模输入骨骼相关性的一个关键因素。 因此,先前的方法主要侧重于图形表层的设计/学习。 但是,一旦学会了这个表层学,网络的每个层层都只有一个单一规模的特征和一个转变。 许多洞察力,例如多尺度的信息和多套式的变异网络(GCNs),已被证明在图像变异神经网络(CNNNs)中非常有效。 GCNs没有在GCNs中调查。 原因是,由于图形结构的骨架数据与常规图像/视频数据之间存在差距,因此将这些洞察到GCNs。 要克服这一差距,我们只能重新改造GCNs 的分裂变异组合战略,用于骨架序列处理。 具体而言,我们设计了一个简单和高度模块化的变异网络结构结构结构,在1Gsal-Slovealal-alalalalalal lavealalalalal laves-mograversal a smal smal supal supalation supal lavealation laction sal laveal lavealmation the laveal commation supalmation smational lavemental commal commentalmal commental commental commal lavemental commental commental commental commental commation commental commental commental commations sald. commmental commmental commmental commmental commmental commmental commmental commal commal commal commal commal commment supal commation sal commation comment commmental commal commal commal commal commal commal commental commal comment

0
下载
关闭预览

相关内容

[综述]深度学习下的场景文本检测与识别
专知会员服务
77+阅读 · 2019年10月10日
AAAI2020 图相关论文集
图与推荐
10+阅读 · 2020年7月15日
基于人体骨架的行为识别【附PPT与视频资料】
人工智能前沿讲习班
31+阅读 · 2019年1月15日
【跟踪Tracking】15篇论文+代码 | 中秋快乐~
专知
18+阅读 · 2018年9月24日
ResNet, AlexNet, VGG, Inception:各种卷积网络架构的理解
全球人工智能
19+阅读 · 2017年12月17日
【推荐】ResNet, AlexNet, VGG, Inception:各种卷积网络架构的理解
机器学习研究会
20+阅读 · 2017年12月17日
Capsule Networks解析
机器学习研究会
11+阅读 · 2017年11月12日
【推荐】YOLO实时目标检测(6fps)
机器学习研究会
20+阅读 · 2017年11月5日
可解释的CNN
CreateAMind
17+阅读 · 2017年10月5日
【推荐】深度学习目标检测全面综述
机器学习研究会
21+阅读 · 2017年9月13日
Arxiv
3+阅读 · 2021年10月14日
Arxiv
4+阅读 · 2020年3月27日
Arxiv
31+阅读 · 2018年11月13日
VIP会员
相关VIP内容
[综述]深度学习下的场景文本检测与识别
专知会员服务
77+阅读 · 2019年10月10日
相关资讯
AAAI2020 图相关论文集
图与推荐
10+阅读 · 2020年7月15日
基于人体骨架的行为识别【附PPT与视频资料】
人工智能前沿讲习班
31+阅读 · 2019年1月15日
【跟踪Tracking】15篇论文+代码 | 中秋快乐~
专知
18+阅读 · 2018年9月24日
ResNet, AlexNet, VGG, Inception:各种卷积网络架构的理解
全球人工智能
19+阅读 · 2017年12月17日
【推荐】ResNet, AlexNet, VGG, Inception:各种卷积网络架构的理解
机器学习研究会
20+阅读 · 2017年12月17日
Capsule Networks解析
机器学习研究会
11+阅读 · 2017年11月12日
【推荐】YOLO实时目标检测(6fps)
机器学习研究会
20+阅读 · 2017年11月5日
可解释的CNN
CreateAMind
17+阅读 · 2017年10月5日
【推荐】深度学习目标检测全面综述
机器学习研究会
21+阅读 · 2017年9月13日
Top
微信扫码咨询专知VIP会员