项目名称: 高维数据的假设检验

项目编号: No.11271031

项目类型: 面上项目

立项/批准年度: 2013

项目学科: 数理科学和化学

项目作者: 王汉生

作者单位: 北京大学

项目金额: 50万元

中文摘要: 在实际研究工作中,人们碰到的高维数据越来越多,而相应的统计方法的发展相对滞后。在过去的5-10年里,高维数据的变量选择方法获得了很大的发展,而在假设检验方面却建树甚微。这恰恰是最近一两年刚刚兴起的研究前沿。本课题将根据现有的研究以及文献进展,在以下各个方面做重要且深入的贡献:(1)考虑在因子结构下的超高维假设检验问题,而现有的结果都假设无因子结构;(2)考虑高维部分检验(Partial Test),而现有的结果都只考虑了全局检验(Global Test);(3)考虑高维数据挖掘方法的假设检验(例如:Na?ve Bayes),而现有的结果只考虑了经典的回归或者多元模型;(4)考虑大规模网络数据(Network Data)的假设检验问题,而现有的结果都基于独立同分布假设。本课题的成果将极大地丰富并发展现有的高维假设检验理论。

中文关键词: 超高维数据;假设检验;因子模型;网络结构;朴素贝叶斯

英文摘要: In real practice, high dimensional data are becoming increasingly available. In contrast, relevant statistical methods are not well developed. During the past 5-10 years, much progress has been made for high dimensional variable selection methods. However, much less has been done for corresponding testing problems. This happens to be one of the most frontier research topics in the past one or two years. Based on the current research and literature progress, this study intends to make important and further contributions on the following perspectives: (1) ultra high dimensional data analysis with a factor structure (most current results are based on non-factor structures); (2) high dimensional partial tests (most existing methods are for global tests); (3) high dimensional data mining methods (past studies mainly considered classical regression or multivariate models); and (4) large scale network data (most existing literatures are based on independent assumptions). As a result, the outputs of this study would further enrich the theory of high dimensional testing substantially.

英文关键词: High Dimensional Data;Hypotheses Testing;Factor Model;Network Structure;Naive Bayes

成为VIP会员查看完整内容
0

相关内容

专知会员服务
117+阅读 · 2021年10月6日
专知会员服务
112+阅读 · 2021年9月22日
专知会员服务
48+阅读 · 2021年8月29日
【经典书】数据结构与算法,770页pdf
专知会员服务
140+阅读 · 2021年4月15日
【经典书】数理统计学,142页pdf
专知会员服务
96+阅读 · 2021年3月25日
【经典书】机器学习:贝叶斯和优化方法,1075页pdf
专知会员服务
404+阅读 · 2020年6月8日
缺失数据统计分析,第三版,462页pdf
专知会员服务
108+阅读 · 2020年2月28日
WSDM 2020教程《深度贝叶斯数据挖掘》,附257页PPT下载
专知会员服务
156+阅读 · 2020年2月7日
基于机器学习的自动化网络流量分析
CCF计算机安全专委会
4+阅读 · 2022年4月8日
漫谈统计学习之经验贝叶斯(Empirical Bayes)
PaperWeekly
2+阅读 · 2022年3月23日
神经网络,凉了?
CVer
2+阅读 · 2022年3月16日
缺失数据统计分析,第三版,462页pdf
专知
46+阅读 · 2020年2月28日
R语言时间序列分析
R语言中文社区
12+阅读 · 2018年11月19日
R语言数据挖掘利器:Rattle包
R语言中文社区
21+阅读 · 2018年11月17日
数据分析师应该知道的16种回归方法:负二项回归
数萃大数据
74+阅读 · 2018年9月16日
贝叶斯机器学习前沿进展
机器学习研究会
21+阅读 · 2018年1月21日
国家自然科学基金
0+阅读 · 2017年12月31日
国家自然科学基金
1+阅读 · 2015年12月31日
国家自然科学基金
0+阅读 · 2015年12月31日
国家自然科学基金
1+阅读 · 2013年12月31日
国家自然科学基金
8+阅读 · 2012年12月31日
国家自然科学基金
0+阅读 · 2012年12月31日
国家自然科学基金
2+阅读 · 2012年12月31日
国家自然科学基金
0+阅读 · 2012年12月31日
国家自然科学基金
1+阅读 · 2011年12月31日
国家自然科学基金
5+阅读 · 2011年12月31日
Arxiv
0+阅读 · 2022年4月18日
Arxiv
0+阅读 · 2022年4月14日
Arxiv
14+阅读 · 2021年3月10日
Arxiv
15+阅读 · 2021年2月19日
小贴士
相关VIP内容
专知会员服务
117+阅读 · 2021年10月6日
专知会员服务
112+阅读 · 2021年9月22日
专知会员服务
48+阅读 · 2021年8月29日
【经典书】数据结构与算法,770页pdf
专知会员服务
140+阅读 · 2021年4月15日
【经典书】数理统计学,142页pdf
专知会员服务
96+阅读 · 2021年3月25日
【经典书】机器学习:贝叶斯和优化方法,1075页pdf
专知会员服务
404+阅读 · 2020年6月8日
缺失数据统计分析,第三版,462页pdf
专知会员服务
108+阅读 · 2020年2月28日
WSDM 2020教程《深度贝叶斯数据挖掘》,附257页PPT下载
专知会员服务
156+阅读 · 2020年2月7日
相关资讯
基于机器学习的自动化网络流量分析
CCF计算机安全专委会
4+阅读 · 2022年4月8日
漫谈统计学习之经验贝叶斯(Empirical Bayes)
PaperWeekly
2+阅读 · 2022年3月23日
神经网络,凉了?
CVer
2+阅读 · 2022年3月16日
缺失数据统计分析,第三版,462页pdf
专知
46+阅读 · 2020年2月28日
R语言时间序列分析
R语言中文社区
12+阅读 · 2018年11月19日
R语言数据挖掘利器:Rattle包
R语言中文社区
21+阅读 · 2018年11月17日
数据分析师应该知道的16种回归方法:负二项回归
数萃大数据
74+阅读 · 2018年9月16日
贝叶斯机器学习前沿进展
机器学习研究会
21+阅读 · 2018年1月21日
相关基金
国家自然科学基金
0+阅读 · 2017年12月31日
国家自然科学基金
1+阅读 · 2015年12月31日
国家自然科学基金
0+阅读 · 2015年12月31日
国家自然科学基金
1+阅读 · 2013年12月31日
国家自然科学基金
8+阅读 · 2012年12月31日
国家自然科学基金
0+阅读 · 2012年12月31日
国家自然科学基金
2+阅读 · 2012年12月31日
国家自然科学基金
0+阅读 · 2012年12月31日
国家自然科学基金
1+阅读 · 2011年12月31日
国家自然科学基金
5+阅读 · 2011年12月31日
微信扫码咨询专知VIP会员