本文介绍CVPR2021中稿论文:MotionRNN: A Flexible Model for Video Prediction with Spacetime-Varying Motions

论文链接:https://arxiv.org/abs/2103.02243

引言

视频预测方法被广泛应用于降水预报(Precipitation Nowcasting)、交通流预测(Traffic Flow Prediction)、机器人视觉规划(Visual Planning)等众多任务中。

然而现实世界的运动极其复杂,且往往处于不断变化中,比如人体运动中的变向、变速、肢体运动,雷达回波中的云团产生、消散、位移、形变等等。这种复杂的时空变化使得准确预测未来的运动极具挑战性。

针对复杂时空运动,我们关注到现实世界的运动在时空上可以分解为整体运动趋势(motion trend)与瞬时变化(transient variation),并基于此提出了名为MotionRNN的模型,对运动趋势与瞬时变化进行统一建模。

同时,作为一个通用的视频预测模型,MotionRNN具有很好的灵活性,可以结合众多的基于RNN的时空预测模型,稳定提升它们应对复杂时空运动的能力。

成为VIP会员查看完整内容
14

相关内容

【WWW2021】面向时空图预测的神经结构搜索
专知会员服务
23+阅读 · 2021年4月23日
专知会员服务
73+阅读 · 2021年4月8日
【CVPR2021】动态度量学习
专知会员服务
40+阅读 · 2021年3月30日
专知会员服务
22+阅读 · 2021年3月25日
专知会员服务
46+阅读 · 2020年11月13日
SkeletonNet:完整的人体三维位姿重建方法
计算机视觉life
21+阅读 · 2019年1月21日
MSRA视觉组可变形卷积网络升级!更高性能,更强建模能力
未来产业促进会
6+阅读 · 2018年11月29日
【泡泡一分钟】SfM-Net:从视频中学习结构和运动
泡泡机器人SLAM
9+阅读 · 2018年5月29日
干货|基于双流递归神经网络的人体骨架行为识别!
全球人工智能
13+阅读 · 2017年12月15日
MoCoGAN 分解运动和内容的视频生成
CreateAMind
18+阅读 · 2017年10月21日
【技术分享】基于双流递归神经网络的人体骨架行为识别
机器学习研究会
5+阅读 · 2017年9月1日
Arxiv
1+阅读 · 2021年6月11日
VIP会员
微信扫码咨询专知VIP会员