项目名称: 随机矩阵/数组形式高维数据的充分降维:统计理论、方法及其应用
项目编号: No.11401095
项目类型: 青年科学基金项目
立项/批准年度: 2014
项目学科: 数理科学和化学
项目作者: 薛原
作者单位: 对外经济贸易大学
项目金额: 22万元
中文摘要: 随着数据收集技术的高速发展,当今数据呈现向高维化和结构化同时发展的趋势。不同于传统随机向量形式的数据,此类结构化、以多维数组形式存在的数据,每一维度都包含了一定的信息。如何充分地降低此类结构化数据的各个维度,从中提取有用信息,同时保持数据的结构性,给统计学研究带来了新的挑战。本项目旨在研究此类数据充分降维的理论、方法及其应用。首先,提出自变量在因变量条件分布泛函空间上充分降维的概念、研究其理论性质并构建具有一般性的估计方法;其次,基于对自变量关于因变量条件均值空间充分降维方法的研究,提出通过叠加中心条件均值充分降维空间,以估计关于条件分布函数充分降维空间的方法,从理论上去除现有方法对于变量分布假设条件的依赖;再其次,研究此类数据充分降维时变量选择的问题,以提高模型预测的准确性。以上方法将被应用到医学高维纵向数据以及股票变化率数据,为疾病侦测以及金融市场变动的研究提供分析工具。
中文关键词: 充分降维;局部回归;机器学习;稳健回归;渐近性质
英文摘要: With the rapid development of data collection technology, modern data are often large and structured. Unlike traditional vector-valued data, those high dimensional matrix-/array-valued data sets are structured with each dimension representing different in
英文关键词: Sufficient Dimension Reduction;Local Regression;Machine Learning;Robust Regression;Asymptotic Property