Predicting 3D human pose from a single monoscopic video can be highly challenging due to factors such as low resolution, motion blur and occlusion, in addition to the fundamental ambiguity in estimating 3D from 2D. Approaches that directly regress the 3D pose from independent images can be particularly susceptible to these factors and result in jitter, noise and/or inconsistencies in skeletal estimation. Much of which can be overcome if the temporal evolution of the scene and skeleton are taken into account. However, rather than tracking body parts and trying to temporally smooth them, we propose a novel transformer based network that can learn a distribution over both pose and motion in an unsupervised fashion. We call our approach Skeletor. Skeletor overcomes inaccuracies in detection and corrects partial or entire skeleton corruption. Skeletor uses strong priors learn from on 25 million frames to correct skeleton sequences smoothly and consistently. Skeletor can achieve this as it implicitly learns the spatio-temporal context of human motion via a transformer based neural network. Extensive experiments show that Skeletor achieves improved performance on 3D human pose estimation and further provides benefits for downstream tasks such as sign language translation.


翻译:单单单单相片的3D人造相的预测3D人造相,由于低分辨率、运动模糊和隐蔽等因素,预测3D人造相可能具有高度的挑战性。 此外,除了从 2D 中估算 3D 人造相的根本性模糊性之外,还存在根本性的模糊性。 直接从独立图像中反向3D 人造相的方法特别容易受这些因素的影响,并导致骨骼估计的紧张性、噪音和/或不一致性。如果将场景和骨架的时间变化考虑在内,其中的很大一部分是可以克服的。 但是,我们提议建立一个新型的基于变压机的变压器网络,能够以不受监督的方式对成形和运动进行分布。我们称之为Skeletor 的方法。Skeletor在检测和纠正部分或全部骨骼腐蚀方面克服了不准确性。Skeletor利用从2500万个框架学到的强力前科经验来纠正骨架序列的平稳和一贯性演变。 但是,Skeletor可以实现这一点,因为它暗地学习基于变压网络的人类运动的瞬间环境环境环境环境,我们提议。 广泛的实验显示,Skeletorssalalal latals ladess lavel lappss laus lapps pass pass pass

0
下载
关闭预览

相关内容

【CVPR2021】GAN人脸预训练模型
专知会员服务
23+阅读 · 2021年4月10日
专知会员服务
25+阅读 · 2021年4月2日
专知会员服务
25+阅读 · 2021年3月7日
Stabilizing Transformers for Reinforcement Learning
专知会员服务
58+阅读 · 2019年10月17日
Yoshua Bengio,使算法知道“为什么”
专知会员服务
7+阅读 · 2019年10月10日
BERT/Transformer/迁移学习NLP资源大列表
专知
19+阅读 · 2019年6月9日
计算机视觉领域顶会CVPR 2018 接受论文列表
计算机视觉近一年进展综述
机器学习研究会
9+阅读 · 2017年11月25日
gan生成图像at 1024² 的 代码 论文
CreateAMind
4+阅读 · 2017年10月31日
可解释的CNN
CreateAMind
17+阅读 · 2017年10月5日
Arxiv
27+阅读 · 2020年12月24日
Joint Monocular 3D Vehicle Detection and Tracking
Arxiv
8+阅读 · 2018年12月2日
Arxiv
5+阅读 · 2018年4月13日
Arxiv
7+阅读 · 2017年12月26日
VIP会员
相关VIP内容
Top
微信扫码咨询专知VIP会员