项目名称: 基于偏相关系数截断法的超高维模型的变量选择
项目编号: No.11401497
项目类型: 青年科学基金项目
立项/批准年度: 2014
项目学科: 数理科学和化学
项目作者: 刘婧媛
作者单位: 厦门大学
项目金额: 22万元
中文摘要: 惩罚回归是在大数据模型中提取有用信息的办法之一。但对自变量个数随样本容量指数增长的超高维模型,我们通常需要一步额外的独立扫描步骤来降低模型维数。然而本项目旨在提出一种来源于不同理念框架的超高维变量选择方法——偏相关系数截断法。总体来说,此方法是基于偏相关系数体系以及部分忠实性理念的逐步检验法。它不仅可以处理超高维线性模型,也可以结合部分残差法扩展应用于超高维部分线性模型中。该方法将模型自变量和因变量的正态假设条件放宽为椭圆分布以适应真实数据通常面临的重尾性;它可以直接作用于超高维模型,无需进行传统的两步法;另外,为使本方法应用更加广泛,我们将从与传统方法不同的正则条件框架出发构造该方法的大样本性质,包括模型选择相合性、第一步检验的确定扫描性等。我们将利用模拟实验来比较偏相关系数截断法和传统的惩罚回归对于超高维模型的变量选择结果,并且将本方法应用于生物基因学领域和金融股票研究领域的数据分析。
中文关键词: 变量选择;线性及部分线性模型;偏相关系数;超高维数据;部分忠实性
英文摘要: The penalty-based variable selection technique is one of the appealing methods to identify significant variables in the high dimensional models. But for the ultrahigh dimensional models where the number of predictors increases exponentially with the samp
英文关键词: Variable selection;Linear and partially linear model;Partial correlation;Ultrahigh dimensional data;Partial faithfulness