项目名称: 稳健且有效的回归和变量选择方法研究

项目编号: No.11271383

项目类型: 面上项目

立项/批准年度: 2013

项目学科: 数理科学和化学

项目作者: 王学钦

作者单位: 中山大学

项目金额: 60万元

中文摘要: 如何构造高稳健又高有效的回归估计,尤其在超高维数据中,是一个具有挑战性的工作。对于回归模型和(超)高维环境中的大多数M-估计,虽然在模拟实验中能够验证它们具有一定的稳健性,但是它们的一个重要的稳健性度量- - -有限样本的崩溃点很低,渐进为0。基于分步M-估计的MM估计和ARETE等估计可以改进这些不足,使得它们能够同时具有高稳健性和高有效性,但它们都依赖于一个高稳健的初始估计。也因为这种依赖性,ARETE虽然是第一个提供稳健理论证明的稳健变量选择方法,但不能简单推广到超高维数据中。因此,本项目试图回答两个问题:1)是否可以构造不依赖高稳健的初始估计的高稳健又高有效的回归估计? 从而提出针对超高维数据的高稳健又高有效的变量选择方法。进一步考虑它们的多元推广。2)是否能够在非渐进理论的框架下考虑新的稳健性度量,使其能够阐明Quantile回归估计等常用的M-估计的"稳健性"

中文关键词: 稳健;有效性;超高维;变量选择;筛选

英文摘要: It is a challenging work to construct a regression estimate with high robustness and high efficiency simultaneously, especilly for Ultra-high dimensional data. Although most M-estimator used in regression models or for (Ultra-) high dimensional data could be claimed to be robust via simulation studies, but their finite sample breakdown point, as an important measure of robustness, is very low, asympotic 0. The estimators based on the step-by-step M-estimators such as MM-estimator and ARETE can overcome this shortcoming to have high robustness and high efficiency simultaneously, but they all rely on an initial estimator with high robustness. The ARETE is the first variable selection method to be verified its robutness in theory, yet it could not be simiply applied in Ultra-high dimensional setting due to the high robustness of initial estimator. So this research try to answer the following two questions:1) Whether can the estimators be provided without the initial estimator with high robustness? And then such estimator can be applied in Ultra-high dimensional setting, also extended to multivariate regression model.2) whether new measure of robustness could be proposed in the framework of non-asysmtotic theory,make it possible to explain the "robustness" of many common used M-estimators such as quantile regressio

英文关键词: Robust;Efficient;Ultrahigh-dimension;Variable Selection;Screening

成为VIP会员查看完整内容
1

相关内容

时间序列计量经济学
专知会员服务
48+阅读 · 2022年4月8日
专知会员服务
37+阅读 · 2021年6月6日
CVPR 2021 | 时间序列疾病预测的因果隐马尔可夫模型
专知会员服务
63+阅读 · 2021年4月11日
【经典书】数理统计学,142页pdf
专知会员服务
97+阅读 · 2021年3月25日
漫谈统计学习之经验贝叶斯(Empirical Bayes)
PaperWeekly
3+阅读 · 2022年3月23日
谷歌NIPS'21 | 如何让图神经网络更稳健?
图与推荐
1+阅读 · 2022年3月22日
多篇顶会看个体因果推断(ITE)的前世今生
PaperWeekly
3+阅读 · 2021年11月19日
读者来稿 | 有效遮挡检测的鲁棒人脸识别
计算机视觉战队
19+阅读 · 2019年3月28日
数据分析师应该知道的16种回归方法:负二项回归
数萃大数据
74+阅读 · 2018年9月16日
数据分析师应该知道的16种回归技术:分位数回归
数萃大数据
29+阅读 · 2018年8月8日
国家自然科学基金
0+阅读 · 2017年12月31日
国家自然科学基金
3+阅读 · 2015年12月31日
国家自然科学基金
1+阅读 · 2013年12月31日
国家自然科学基金
2+阅读 · 2013年12月31日
国家自然科学基金
0+阅读 · 2013年12月31日
国家自然科学基金
1+阅读 · 2013年12月31日
国家自然科学基金
3+阅读 · 2012年12月31日
国家自然科学基金
3+阅读 · 2012年12月31日
Arxiv
21+阅读 · 2020年10月11日
小贴士
相关基金
国家自然科学基金
0+阅读 · 2017年12月31日
国家自然科学基金
3+阅读 · 2015年12月31日
国家自然科学基金
1+阅读 · 2013年12月31日
国家自然科学基金
2+阅读 · 2013年12月31日
国家自然科学基金
0+阅读 · 2013年12月31日
国家自然科学基金
1+阅读 · 2013年12月31日
国家自然科学基金
3+阅读 · 2012年12月31日
国家自然科学基金
3+阅读 · 2012年12月31日
微信扫码咨询专知VIP会员