We investigate ensemble methods for prediction in an online setting. Unlike all the literature in ensembling, for the first time, we introduce a new approach using a meta learner that effectively combines the base model predictions via using a superset of the features that is the union of the base models' feature vectors instead of the predictions themselves. Here, our model does not use the predictions of the base models as inputs to a machine learning algorithm, but choose the best possible combination at each time step based on the state of the problem. We explore three different constraint spaces for the ensembling of the base learners that linearly combines the base predictions, which are convex combinations where the components of the ensembling vector are all nonnegative and sum up to 1; affine combinations where the weight vector components are required to sum up to 1; and the unconstrained combinations where the components are free to take any real value. The constraints are both theoretically analyzed under known statistics and integrated into the learning procedure of the meta learner as a part of the optimization in an automated manner. To show the practical efficiency of the proposed method, we employ a gradient-boosted decision tree and a multi-layer perceptron separately as the meta learners. Our framework is generic so that one can use other machine learning architectures as the ensembler as long as they allow for a custom differentiable loss for minimization. We demonstrate the learning behavior of our algorithm on synthetic data and the significant performance improvements over the conventional methods over various real life datasets, extensively used in the well-known data competitions. Furthermore, we openly share the source code of the proposed method to facilitate further research and comparison.
翻译:我们调查了在线环境中预测的共性方法。 与所有文献相比, 我们第一次使用一个元学习器, 采用一种新的方法, 将基数模型的预测有效地结合起来, 其方法是使用基数特性的超级组合, 即基数特性矢量的组合, 而不是预测本身。 这里, 我们的模型不使用基数的预测作为机器学习算法的输入, 而是根据问题的现状选择每个步骤中可能的最佳组合。 我们探索了三个不同的制约空间, 基数学习者聚集起来, 线性地将基数预测合并起来, 这是一种共振动组合, 使基数的矢量的预测各组成部分不具有阴性, 总和总和性矢量的组合, 将实际的矢量矢量矢量矢量矢量矢量的矢量矢量矢量的矢量组合, 将我们所拟议的各种组成部分可以自由获取任何实际价值的组合。 限制在已知的统计中是理论上的, 并融入元学习器的学习程序, 以自动的方式, 将基数预测组合组合组合组合组合组合组合组合组合组合组合, 。 将我们所使用的一种传统数据 将一个不同的数据 学习系统, 将使用一个实际的深度数据 系统, 系统 将我们用来进行 学习 以 的 将一个不同的 学习 的 的 的 的 以 以 以 以 以 的 以 以 以 以 一种不同的 一种不同的 的 的 的 一种不同的 学习的 一种 学习 学习方式, 我们的 的 的 的 的 的 的 的 的 的 的 以 的 的 的 以 的 以 以 以 的 的 的 的 以 的 的 的 的 的 的 的 的 的 的 的 的 的 的 的 的 的 的 的 的 的 的 的 的 以 以 的 的 的 的 的 以 以 的 以 以 的 的 的 以 以 以 以 以 以 以 以 以 以 不同的 不同的 不同的 不同的 的 的 的