Spatiotemporal predictive learning (ST-PL) is a hotspot with numerous applications, such as object movement and meteorological prediction. It aims at predicting the subsequent frames via observed sequences. However, inherent uncertainty among consecutive frames exacerbates the difficulty in long-term prediction. To tackle the increasing ambiguity during forecasting, we design CMS-LSTM to focus on context correlations and multi-scale spatiotemporal flow with details on fine-grained locals, containing two elaborate designed blocks: Context Embedding (CE) and Spatiotemporal Expression (SE) blocks. CE is designed for abundant context interactions, while SE focuses on multi-scale spatiotemporal expression in hidden states. The newly introduced blocks also facilitate other spatiotemporal models (e.g., PredRNN, SA-ConvLSTM) to produce representative implicit features for ST-PL and improve prediction quality. Qualitative and quantitative experiments demonstrate the effectiveness and flexibility of our proposed method. With fewer params, CMS-LSTM outperforms state-of-the-art methods in numbers of metrics on two representative benchmarks and scenarios.


翻译:外观预测性学习(ST-PL)是一个热点,有多种应用,例如物体移动和气象预测,目的是通过观测序列预测随后的框架。但是,连续框架的内在不确定性加剧了长期预测的困难。为了解决预测期间日益模糊的问题,我们设计CMS-LSTM, 重点是环境相关性和多尺度的跨时流,详细介绍细微的本地人,包括两个精心设计的块:背景嵌入(CE)和斯帕蒂时表达(SE)块。 CE是设计用于大量环境互动的,而SE则侧重于隐蔽状态的多尺度波时表达。新推出的区块还促进其他波时模型(例如PredRNN、SA-CONLSTM),为ST-PLP产生具有代表性的隐含特征,并提高预测质量。定性和定量实验显示了我们拟议方法的有效性和灵活性。由于在两个具有代表性的基准和情景的测量数中,CMS-LSTM在数量上低于最新状态方法。

0
下载
关闭预览

相关内容

长短期记忆网络(LSTM)是一种用于深度学习领域的人工回归神经网络(RNN)结构。与标准的前馈神经网络不同,LSTM具有反馈连接。它不仅可以处理单个数据点(如图像),还可以处理整个数据序列(如语音或视频)。例如,LSTM适用于未分段、连接的手写识别、语音识别、网络流量或IDSs(入侵检测系统)中的异常检测等任务。
【2021新书】编码艺术,Coding Art,284页pdf
专知会员服务
75+阅读 · 2021年1月10日
专知会员服务
54+阅读 · 2019年12月22日
【Google论文】ALBERT:自我监督学习语言表达的精简BERT
专知会员服务
24+阅读 · 2019年11月4日
强化学习最新教程,17页pdf
专知会员服务
177+阅读 · 2019年10月11日
[综述]深度学习下的场景文本检测与识别
专知会员服务
78+阅读 · 2019年10月10日
Multi-Task Learning的几篇综述文章
深度学习自然语言处理
15+阅读 · 2020年6月15日
Transferring Knowledge across Learning Processes
CreateAMind
28+阅读 · 2019年5月18日
简评 | Video Action Recognition 的近期进展
极市平台
20+阅读 · 2019年4月21日
Unsupervised Learning via Meta-Learning
CreateAMind
42+阅读 · 2019年1月3日
Hierarchical Disentangled Representations
CreateAMind
4+阅读 · 2018年4月15日
(TensorFlow)实时语义分割比较研究
机器学习研究会
9+阅读 · 2018年3月12日
读书报告 | Deep Learning for Extreme Multi-label Text Classification
科技创新与创业
48+阅读 · 2018年1月10日
Arxiv
5+阅读 · 2021年9月30日
VIP会员
Top
微信扫码咨询专知VIP会员