With the advances in capturing 2D or 3D skeleton data, skeleton-based action recognition has received an increasing interest over the last years. As skeleton data is commonly represented by graphs, graph convolutional networks have been proposed for this task. While current graph convolutional networks accurately recognize actions, they are too expensive for robotics applications where limited computational resources are available. In this paper, we therefore propose a highly efficient graph convolutional network that addresses the limitations of previous works. This is achieved by a parallel structure that gradually fuses motion and spatial information and by reducing the temporal resolution as early as possible. Furthermore, we explicitly address the issue that human poses can contain errors. To this end, the network first refines the poses before they are further processed to recognize the action. We therefore call the network Pose Refinement Graph Convolutional Network. Compared to other graph convolutional networks, our network requires 86\%-93\% less parameters and reduces the floating point operations by 89%-96% while achieving a comparable accuracy. It therefore provides a much better trade-off between accuracy, memory footprint and processing time, which makes it suitable for robotics applications.


翻译:由于在捕捉 2D 或 3D 骨架数据方面的进展,基于骨架的行动识别在过去几年中引起了越来越多的兴趣。 由于骨架数据通常以图表为代表, 已经为此任务提出了图变网络。 虽然目前的图变网络准确识别了行动, 但对于计算资源有限的机器人应用来说,它们太昂贵了。 因此, 在本文件中, 我们建议建立一个高效的图变网络, 解决以往工程的局限性。 这是通过一个平行结构实现的, 它逐渐结合运动和空间信息, 并尽早减少时间分辨率。 此外, 我们明确解决了人体构成可能包含错误的问题。 为此, 网络首先对图像进行精细化, 然后再进一步处理, 以确认行动。 因此, 我们称之为网络 Pose Refinement 图表变迁网络。 与其他图表变迁网络相比, 我们的网络需要86 ⁇ - 93 ⁇ 更少的参数, 并且将浮点操作减少89%- 96%, 同时实现类似的准确性。 因此, 它在精确性、 记忆足迹和处理时间之间提供了更佳得多的交换。

0
下载
关闭预览

相关内容

【NeurIPS2020】点针图网络,Pointer Graph Networks
专知会员服务
39+阅读 · 2020年9月27日
【IJCAJ 2020】多通道神经网络 Multi-Channel Graph Neural Networks
专知会员服务
25+阅读 · 2020年7月19日
[综述]深度学习下的场景文本检测与识别
专知会员服务
77+阅读 · 2019年10月10日
行为识别(action recognition)目前的难点在哪?
极市平台
36+阅读 · 2019年2月14日
A Technical Overview of AI & ML in 2018 & Trends for 2019
待字闺中
17+阅读 · 2018年12月24日
计算机视觉领域顶会CVPR 2018 接受论文列表
(TensorFlow)实时语义分割比较研究
机器学习研究会
9+阅读 · 2018年3月12日
【推荐】全卷积语义分割综述
机器学习研究会
19+阅读 · 2017年8月31日
Arxiv
0+阅读 · 2020年11月25日
Arxiv
0+阅读 · 2020年11月24日
VIP会员
Top
微信扫码咨询专知VIP会员