项目名称: 数据缺失时高维数据降维分析的方法、理论与应用
项目编号: No.11171331
项目类型: 面上项目
立项/批准年度: 2012
项目学科: 数理科学和化学
项目作者: 王启华
作者单位: 中国科学院数学与系统科学研究院
项目金额: 40万元
中文摘要: 高维数据分析是当前统计研究的热点之一,特别是自从Li (1991,JASA)提出切片逆回归技术以来,许多降维方法被提出. 然而这些方法主要针对数据完全观察的情形。但实际中数据常常有缺失,而数据缺失时降维问题趋今研究较少,这方面值得特别的专门研究。本项目分别研究反映变量缺失或协变量缺失时降维方法与降维技术,在反映变量缺失时我们将首先发展融合-精练两步方法找到中心降维子空间,发展概率质量函数加权imputation方法估计所获得的中心降维子空间的基,并证明是根号n相合估计,将Zhu等(2009,Biometrika)中估计维数的方法推广到缺失数据情形;我们还将发展反映变量缺失时切片逆回归方法与极大化相关系数法;我们还通过求中心分位子空间获得中心子空间;研究反映变量缺失时降维技术在变量选择中的应用。此外,我们也研究协变量缺失时降维技术,在无须对倾向性得分函数作模型假设下发展降维技术。
中文关键词: 响应变量缺失;协变量缺失;变量筛选;高维数据;降维方法
英文摘要:
英文关键词: missing response;missing covariable;Variable screening;High dimension data;Dimension reduction method