项目名称: 高维回归模型的预测稳定性研究
项目编号: No.11626159
项目类型: 专项基金项目
立项/批准年度: 2016
项目学科: 数理科学和化学
项目作者: 林炳清
作者单位: 深圳大学
项目金额: 3万元
中文摘要: 在高维数据分析中,人们通常采用变量选择方法选择出“最好”的模型,然后依赖于该模型得到最终的预测或者统计推断。然而,变量选择过程有着不同程度的不确定性,这种不确定性会造成模型解释的不可靠性和预测的不稳定性(即,数据的微小变化可能使我们选择出差别很大的模型,进而得到的预测值也差别很大)。本项目研究高维数据下变量选择过程的不确定性对模型预测的影响程度,并通过模型平均方法提高模型的预测稳定性。我们拟采用多次拆分数据的方法,构造候选模型集合,并用每个候选模型的预测值和原数据的因变量构造一个新的数据。然后使用新数据,通过最优化损失函数得到每个候选模型的权重。在理论上,我们拟研究提出算法的风险有界性等渐近性质。本项目拟提出的算法具有很好的可拓展性,可以有效的减少高维数据统计建模过程中的不确定性,提高高维数据分析结果的可靠性。
中文关键词: 模型选择;模型平均;非参数模型;不确定性分析;
英文摘要: In high-dimensional data analysis, one typically finds “best” model by using a variable selection procedure and make the final prediction and statistical estimation based on this model. However, variable selection procedures are uncertain on some level an
英文关键词: Model selection;model averaging;nonparametric model;uncertainty analysis;