With the advances in capturing 2D or 3D skeleton data, skeleton-based action recognition has received an increasing interest over the last years. As skeleton data is commonly represented by graphs, graph convolutional networks have been proposed for this task. While current graph convolutional networks accurately recognize actions, they are too expensive for robotics applications where limited computational resources are available. In this paper, we therefore propose a highly efficient graph convolutional network that addresses the limitations of previous works. This is achieved by a parallel structure that gradually fuses motion and spatial information and by reducing the temporal resolution as early as possible. Furthermore, we explicitly address the issue that human poses can contain errors. To this end, the network first refines the poses before they are further processed to recognize the action. We therefore call the network Pose Refinement Graph Convolutional Network. Compared to other graph convolutional networks, our network requires 86\%-93\% less parameters and reduces the floating point operations by 89%-96% while achieving a comparable accuracy. It therefore provides a much better trade-off between accuracy, memory footprint and processing time, which makes it suitable for robotics applications.


翻译:由于在捕捉 2D 或 3D 骨架数据方面的进展,基于骨架的行动识别在过去几年中引起了越来越多的兴趣。 由于骨架数据通常以图表为代表, 已经为此任务提出了图变网络。 虽然目前的图变网络准确识别了行动, 但对于计算资源有限的机器人应用来说,它们太昂贵了。 因此, 在本文件中, 我们建议建立一个高效的图变网络, 解决以往工程的局限性。 这是通过一个平行结构实现的, 它逐渐结合运动和空间信息, 并尽早减少时间分辨率。 此外, 我们明确解决了人体构成可能包含错误的问题。 为此, 网络首先对图像进行精细化, 然后再进一步处理, 以确认行动。 因此, 我们称之为网络 Pose Refinement 图表变迁网络。 与其他图表变迁网络相比, 我们的网络需要86 ⁇ - 93 ⁇ 更少的参数, 并且将浮点操作减少89%- 96%, 同时实现类似的准确性。 因此, 它在精确性、 记忆足迹和处理时间之间提供了更佳得多的交换。

0
下载
关闭预览

相关内容

专知会员服务
109+阅读 · 2020年3月12日
《DeepGCNs: Making GCNs Go as Deep as CNNs》
专知会员服务
30+阅读 · 2019年10月17日
【泡泡一分钟】OFF:快速鲁棒视频动作识别的运动表征
泡泡机器人SLAM
3+阅读 · 2019年3月12日
SkeletonNet:完整的人体三维位姿重建方法
计算机视觉life
21+阅读 · 2019年1月21日
逆强化学习-学习人先验的动机
CreateAMind
15+阅读 · 2019年1月18日
误差反向传播——RNN
统计学习与视觉计算组
18+阅读 · 2018年9月6日
Capsule Networks解析
机器学习研究会
11+阅读 · 2017年11月12日
gan生成图像at 1024² 的 代码 论文
CreateAMind
4+阅读 · 2017年10月31日
【推荐】全卷积语义分割综述
机器学习研究会
19+阅读 · 2017年8月31日
Arxiv
8+阅读 · 2020年10月12日
Arxiv
6+阅读 · 2019年4月8日
Arxiv
12+阅读 · 2018年9月15日
Arxiv
7+阅读 · 2018年1月10日
VIP会员
相关资讯
【泡泡一分钟】OFF:快速鲁棒视频动作识别的运动表征
泡泡机器人SLAM
3+阅读 · 2019年3月12日
SkeletonNet:完整的人体三维位姿重建方法
计算机视觉life
21+阅读 · 2019年1月21日
逆强化学习-学习人先验的动机
CreateAMind
15+阅读 · 2019年1月18日
误差反向传播——RNN
统计学习与视觉计算组
18+阅读 · 2018年9月6日
Capsule Networks解析
机器学习研究会
11+阅读 · 2017年11月12日
gan生成图像at 1024² 的 代码 论文
CreateAMind
4+阅读 · 2017年10月31日
【推荐】全卷积语义分割综述
机器学习研究会
19+阅读 · 2017年8月31日
Top
微信扫码咨询专知VIP会员