本文介绍CVPR2021中稿论文:MotionRNN: A Flexible Model for Video Prediction with Spacetime-Varying Motions
论文链接:https://arxiv.org/abs/2103.02243
引言
视频预测方法被广泛应用于降水预报(Precipitation Nowcasting)、交通流预测(Traffic Flow Prediction)、机器人视觉规划(Visual Planning)等众多任务中。
然而现实世界的运动极其复杂,且往往处于不断变化中,比如人体运动中的变向、变速、肢体运动,雷达回波中的云团产生、消散、位移、形变等等。这种复杂的时空变化使得准确预测未来的运动极具挑战性。
针对复杂时空运动,我们关注到现实世界的运动在时空上可以分解为整体运动趋势(motion trend)与瞬时变化(transient variation),并基于此提出了名为MotionRNN的模型,对运动趋势与瞬时变化进行统一建模。
同时,作为一个通用的视频预测模型,MotionRNN具有很好的灵活性,可以结合众多的基于RNN的时空预测模型,稳定提升它们应对复杂时空运动的能力。