项目名称: 高维数据统计建模与分析
项目编号: No.11131002
项目类型: 重点项目
立项/批准年度: 2012
项目学科: 数理科学和化学
项目作者: 陈松蹊
作者单位: 北京大学
项目金额: 220万元
中文摘要: 随着现代数据的收集和储存技术的提高,统计数据呈现出高维性。由于可重复研究的限制,参加研究的个体数量相对很小。这就是现代统计学中最具挑战的"大p,小n"问题。具体地说,数据的维数大大超过样本的个数。 这尤其表现在生物基因学研究,网络信息,以及金融数据中。如何在样本量不是很大的前提下分析超高维数据,是一个非常具有挑战的、也是国际统计学的前沿课题。本项目将着重在五个方面对高维数据统计建模与分析进行科学的,系统的研究。这五个方面是:(1)高维数据的变量选择、(2)超高维多元统计分析、(3)复杂数据的相关性、(4)大规模在线数据的监控和(5)高维生存数据分析。这五方面的研究均对传统的统计推断理论提出了全新的挑战,且均是目前国际统计学研究的最前沿问题。这五个课题相对独立又相互依托,有理论也有应用,将从不同的方向对高维数据的统计推断提出有效的解决方法,建立一个统一的适应于高维数据统计建模与分析的框架。
中文关键词: 多元统计分析;变量选择;数据相关性;在线数据的监控;生存数据分析
英文摘要:
英文关键词: multivariate analysis;variable selection;dependence;on-line data monitoring;survival analysis