kNN based ensemble methods minimise the effect of outliers by identifying a set of data points in the given feature space that are nearest to an unseen observation in order to predict its response by using majority voting. The ordinary ensembles based on kNN find out the k nearest observations in a region (bounded by a sphere) based on a predefined value of k. This scenario, however, might not work in situations when the test observation follows the pattern of the closest data points with the same class that lie on a certain path not contained in the given sphere. This paper proposes a k nearest neighbour ensemble where the neighbours are determined in k steps. Starting from the first nearest observation of the test point, the algorithm identifies a single observation that is closest to the observation at the previous step. At each base learner in the ensemble, this search is extended to k steps on a random bootstrap sample with a random subset of features selected from the feature space. The final predicted class of the test point is determined by using a majority vote in the predicted classes given by all base models. This new ensemble method is applied on 17 benchmark datasets and compared with other classical methods, including kNN based models, in terms of classification accuracy, kappa and Brier score as performance metrics. Boxplots are also utilised to illustrate the difference in the results given by the proposed and other state-of-the-art methods. The proposed method outperformed the rest of the classical methods in the majority of cases. The paper gives a detailed simulation study for further assessment.
翻译:以 kNN 为基础的共集基于 commle 的共选方法 共选方法, 通过在特定特性空间中确定一组最接近于不可见观测的数据点, 以预测其响应, 从而用多数票来预测其响应 。 基于 kNN 的普通 共选组根据预先定义的 k. 的数值, 在一个区域( 以球为基数为基数) 中发现 k最近的观测 。 但是, 在试验观察遵循最接近数据点的模式, 同一类位于某一路径上, 而未包含在特定区域内的同一路径上时, 这一假设可能不会起到作用 。 本文建议使用 k 相邻最接近的一组 。 从最接近的测试点观察点开始, 算出一个最接近于前一步观测的 。 以 kNNW 为基础的一次单一观察点, 这个算法在17 基数的精确度中应用了新的精度计算方法, 并且以其他的评分方法比较了 。 以 基数 基数 方法 的精确度 和 基数 基数 的 的 的 的 的 的 方法 的 的 的 基数 基数 的 的 的 的 的 的 的 的 的 和 的 的 的 的 的 的 的 的 的 的 的 的 的 的 基数 的 的 基数 的 的 的 的 的 基数 的 的 方法 的 的 和 的 的 的 的 的 的 的 的 的 的 方法 的 的 的 的 的 的 的 和 的 的 的 的 的 的 的 的 的 的 的 方法 的 的 的 的 的 的 的 的 的 的 的 的 的 和 的 的 的 的 和 的 的 的 的 的 的 的 和 的 的 的 的 的 的 的 的 和 的 的 的 的 的 的 的 的 和 的