With large quantities of data typically available nowadays, forecasting models that are trained across sets of time series, known as Global Forecasting Models (GFM), are regularly outperforming traditional univariate forecasting models that work on isolated series. As GFMs usually share the same set of parameters across all time series, they often have the problem of not being localised enough to a particular series, especially in situations where datasets are heterogeneous. We study how ensembling techniques can be used with generic GFMs and univariate models to solve this issue. Our work systematises and compares relevant current approaches, namely clustering series and training separate submodels per cluster, the so-called ensemble of specialists approach, and building heterogeneous ensembles of global and local models. We fill some gaps in the existing GFM localisation approaches, in particular by incorporating varied clustering techniques such as feature-based clustering, distance-based clustering and random clustering, and generalise them to use different underlying GFM model types. We then propose a new methodology of clustered ensembles where we train multiple GFMs on different clusters of series, obtained by changing the number of clusters and cluster seeds. Using Feed-forward Neural Networks, Recurrent Neural Networks, and Pooled Regression models as the underlying GFMs, in our evaluation on eight publicly available datasets, the proposed models are able to achieve significantly higher accuracy than baseline GFM models and univariate forecasting methods.


翻译:由于目前通常可以获得大量数据,因此在一系列时间序列(称为全球预测模型(GFM))中经过培训的预测模型往往优于在孤立序列中发挥作用的传统单向预测模型。由于GFMs通常在所有时间序列中共享相同的一组参数,因此它们往往有问题不能被定位到特定系列,特别是在数据集各不相同的情况下。我们研究如何使用通用GFMs和单向流模型组合技术解决这一问题。我们的工作系统化和比较相关当前方法,即集群系列和培训每个集群的单独子模型、所谓的专家组合办法以及建立全球和地方模型的混合组合。我们填补了现有的GFM本地化方法中的一些空白,特别是将基于特性的集群、基于远程的集群和随机组合等不同的组合技术纳入到不同的基础GFM模式中。我们随后提出了一个新的组合方法,即对不同系列的多类组合进行组合组合培训,即按不同组合的组合组合、所谓的专家组合组合组合,以及建立全球和地方模型的混合组合。我们通过大幅度改变现有的GFM系列和GFM系列数据基础网络,通过改变现有的GFM系列和GRFM系列和GFM系列,在现有的GFMFM系列和GFM系列中,在现有的数据库和GFMFMFMFMFMFMFMFSMFSM系列中可以实现现有数据库和GFMFMFMFM系列和GFM系列中可以取得新的数据组数组和GFFM系列和GFFMMMM系列和GFFMFMFM系列中,从而获得新的数据基数。

0
下载
关闭预览

相关内容

2019年机器学习框架回顾
专知会员服务
35+阅读 · 2019年10月11日
Transferring Knowledge across Learning Processes
CreateAMind
27+阅读 · 2019年5月18日
Github项目推荐 | RecQ - Python推荐系统框架
AI研习社
8+阅读 · 2019年1月23日
人工智能 | SCI期刊专刊信息3条
Call4Papers
5+阅读 · 2019年1月10日
A Technical Overview of AI & ML in 2018 & Trends for 2019
待字闺中
16+阅读 · 2018年12月24日
利用动态深度学习预测金融时间序列基于Python
量化投资与机器学习
18+阅读 · 2018年10月30日
计算机类 | 期刊专刊截稿信息9条
Call4Papers
4+阅读 · 2018年1月26日
算法|随机森林(Random Forest)
全球人工智能
3+阅读 · 2018年1月8日
【论文】图上的表示学习综述
机器学习研究会
14+阅读 · 2017年9月24日
【推荐】RNN/LSTM时序预测
机器学习研究会
25+阅读 · 2017年9月8日
【推荐】(Keras)LSTM多元时序预测教程
机器学习研究会
24+阅读 · 2017年8月14日
Embedding Logical Queries on Knowledge Graphs
Arxiv
3+阅读 · 2019年2月19日
Foreground-aware Image Inpainting
Arxiv
4+阅读 · 2019年1月17日
VIP会员
相关VIP内容
2019年机器学习框架回顾
专知会员服务
35+阅读 · 2019年10月11日
相关资讯
Transferring Knowledge across Learning Processes
CreateAMind
27+阅读 · 2019年5月18日
Github项目推荐 | RecQ - Python推荐系统框架
AI研习社
8+阅读 · 2019年1月23日
人工智能 | SCI期刊专刊信息3条
Call4Papers
5+阅读 · 2019年1月10日
A Technical Overview of AI & ML in 2018 & Trends for 2019
待字闺中
16+阅读 · 2018年12月24日
利用动态深度学习预测金融时间序列基于Python
量化投资与机器学习
18+阅读 · 2018年10月30日
计算机类 | 期刊专刊截稿信息9条
Call4Papers
4+阅读 · 2018年1月26日
算法|随机森林(Random Forest)
全球人工智能
3+阅读 · 2018年1月8日
【论文】图上的表示学习综述
机器学习研究会
14+阅读 · 2017年9月24日
【推荐】RNN/LSTM时序预测
机器学习研究会
25+阅读 · 2017年9月8日
【推荐】(Keras)LSTM多元时序预测教程
机器学习研究会
24+阅读 · 2017年8月14日
Top
微信扫码咨询专知VIP会员