项目名称: 基于变系数半参数模型的高维数据统计分析

项目编号: No.11301279

项目类型: 青年科学基金项目

立项/批准年度: 2014

项目学科: 数理科学和化学

项目作者: 来鹏

作者单位: 南京信息工程大学

项目金额: 23万元

中文摘要: 高维及超高维数据是当今社会多个领域会经常碰到的数据类型,能否有效的对其进行统计分析具有非常重要的意义。参数模型,常数系数模型越来越无法适应对数据分析的要求。高维以及超高维数据下的变系数类型的半参数模型是本项目研究的重点,该类模型的灵活性使其更能适应于复杂的数据结构。本项目拟对单指标变系数模型从估计有效性、变量选择和模型的识别性问题方面进行研究,在证明其大样本性质的同时,通过数值模拟研究其有限样本性质。本项目还将对超高维数据下变系数类型的半参数模型的降维问题进行研究,给出函数型系数变量的筛选方法,从而进行变量选择,证明筛选方法的相合性,并研究混合函数型系数与常数系数变量的模型的变量筛选及筛选方法的相合性,通过数值模拟研究其有限样本性质。

中文关键词: 半参数模型;变量选择;有效性;超高维;特征筛选

英文摘要: High dimensional data and ultrahigh-dimensional data are often encountered in many different areas in our social lives. It is meaningful to do statistical analysis effectively to these types of data. For the parametric models and constant coefficient models, they are increasingly unable to meet the requirement of data analysis. This project will focus on studying the varying-coefficient semiparametric models with high dimensional and ultrahigh-dimensional data. This kind of models is flexible so that it can adapt to the complex data structure. This project aims to study the estimation efficiency, variable selection procedure and model identification problems for the single-index varying-coefficient models. It will give the proof of the large sample properties, and complete the numerical simulations to verify the finite sample properties. On the other hand, this project will also study the dimension reduction problem for the varying-coefficient semiparametric models with ultrahigh-dimensional data. The screening methods for screening the functional coefficient variables are proposed, thus the general variable selection procedure is proceeded. The consistent property of the screening method will be proved. Furthermore, this project aims to study on the consistency of the screening method for the model which have m

英文关键词: Semiparametric model;variable selection;efficiency;ultrahigh dimension;feature screening

成为VIP会员查看完整内容
1

相关内容

专知会员服务
77+阅读 · 2021年10月12日
专知会员服务
117+阅读 · 2021年10月6日
专知会员服务
21+阅读 · 2021年9月23日
专知会员服务
48+阅读 · 2021年8月29日
专知会员服务
35+阅读 · 2021年5月10日
【经典书】数理统计学,142页pdf
专知会员服务
96+阅读 · 2021年3月25日
专知会员服务
144+阅读 · 2021年2月3日
少即是多?非参数语言模型,68页ppt
专知会员服务
23+阅读 · 2020年11月22日
专知会员服务
45+阅读 · 2020年11月13日
缺失数据统计分析,第三版,462页pdf
专知会员服务
108+阅读 · 2020年2月28日
基于机器学习的自动化网络流量分析
CCF计算机安全专委会
4+阅读 · 2022年4月8日
神经网络,凉了?
CVer
2+阅读 · 2022年3月16日
再谈变分自编码器(VAE):估计样本概率密度
PaperWeekly
3+阅读 · 2021年12月23日
正则化方法小结
极市平台
2+阅读 · 2021年11月24日
缺失数据统计分析,第三版,462页pdf
专知
46+阅读 · 2020年2月28日
R语言时间序列分析
R语言中文社区
12+阅读 · 2018年11月19日
国家自然科学基金
1+阅读 · 2015年12月31日
国家自然科学基金
5+阅读 · 2013年12月31日
国家自然科学基金
3+阅读 · 2013年12月31日
国家自然科学基金
0+阅读 · 2013年12月31日
国家自然科学基金
0+阅读 · 2013年12月31日
国家自然科学基金
0+阅读 · 2012年12月31日
国家自然科学基金
2+阅读 · 2012年12月31日
国家自然科学基金
0+阅读 · 2012年12月31日
国家自然科学基金
1+阅读 · 2011年12月31日
国家自然科学基金
4+阅读 · 2011年12月31日
Arxiv
0+阅读 · 2022年4月20日
Arxiv
0+阅读 · 2022年4月19日
Arxiv
110+阅读 · 2020年2月5日
Arxiv
11+阅读 · 2018年5月21日
小贴士
相关VIP内容
专知会员服务
77+阅读 · 2021年10月12日
专知会员服务
117+阅读 · 2021年10月6日
专知会员服务
21+阅读 · 2021年9月23日
专知会员服务
48+阅读 · 2021年8月29日
专知会员服务
35+阅读 · 2021年5月10日
【经典书】数理统计学,142页pdf
专知会员服务
96+阅读 · 2021年3月25日
专知会员服务
144+阅读 · 2021年2月3日
少即是多?非参数语言模型,68页ppt
专知会员服务
23+阅读 · 2020年11月22日
专知会员服务
45+阅读 · 2020年11月13日
缺失数据统计分析,第三版,462页pdf
专知会员服务
108+阅读 · 2020年2月28日
相关资讯
基于机器学习的自动化网络流量分析
CCF计算机安全专委会
4+阅读 · 2022年4月8日
神经网络,凉了?
CVer
2+阅读 · 2022年3月16日
再谈变分自编码器(VAE):估计样本概率密度
PaperWeekly
3+阅读 · 2021年12月23日
正则化方法小结
极市平台
2+阅读 · 2021年11月24日
缺失数据统计分析,第三版,462页pdf
专知
46+阅读 · 2020年2月28日
R语言时间序列分析
R语言中文社区
12+阅读 · 2018年11月19日
相关基金
国家自然科学基金
1+阅读 · 2015年12月31日
国家自然科学基金
5+阅读 · 2013年12月31日
国家自然科学基金
3+阅读 · 2013年12月31日
国家自然科学基金
0+阅读 · 2013年12月31日
国家自然科学基金
0+阅读 · 2013年12月31日
国家自然科学基金
0+阅读 · 2012年12月31日
国家自然科学基金
2+阅读 · 2012年12月31日
国家自然科学基金
0+阅读 · 2012年12月31日
国家自然科学基金
1+阅读 · 2011年12月31日
国家自然科学基金
4+阅读 · 2011年12月31日
相关论文
Arxiv
0+阅读 · 2022年4月20日
Arxiv
0+阅读 · 2022年4月19日
Arxiv
110+阅读 · 2020年2月5日
Arxiv
11+阅读 · 2018年5月21日
微信扫码咨询专知VIP会员