项目名称: 广义线性模型的组变量选择及其在信用评分中的应用

项目编号: No.71471152

项目类型: 面上项目

立项/批准年度: 2015

项目学科: 管理科学

项目作者: 方匡南

作者单位: 厦门大学

项目金额: 62万元

中文摘要: 近年来,管理科学、生物信息等领域产生了大量的高维数据,为模型选择带来了更大的挑战,且在某些实际问题中,自变量间由于某种内在关系,存在着自然的分组结构,此时,使用单变量选择方法忽略了分组结构中隐含的信息,可能会降低变量选择的性能,甚至会误选变量。鉴于此,本项目主要系统地研究广义线性模型的组变量选择方法,包括凹q范数组变量选择法、双层变量选择法、稀疏拉普拉斯组变量选择法。首先,研究仅能选择组变量的方法,提出凹q范数组变量选择法,解决其算法问题及证明其一致性;接着,研究既能选择组变量又能选择组内变量的双层变量选择法,解决其算法问题及证明其在单个变量和群组变量层面的Oracle性质;然后,在考虑变量间的网络结构下,提出拉普拉斯组变量选择法,利用扩展的GCD算法解决其计算问题,证明其在稀疏的Rieze条件下的oracle性质。最后,研究这些方法在信用评分中的应用。

中文关键词: 统计学;变量选择;广义线性模型;信用评分

英文摘要: In recent years, a mass of high dimensional data arises in the research fields such as management science, bioinformatics and others. The use of such data creates a big challenge for model selection. For some case, the inherent interconnection among covariates can be described with a grouping structure. In this case, individual variable selection methods, which omit the grouping structure information, may reduce the efficiency of variable selection, even lead to mis-selection. The main goal of this proposal is to systematically develop group variable selection for generalized linear regression, including concave q norm group selection methods, bi-level selection methods, Sparse Laplacian group selection methods. First, we propose new concave q norm group selection methods, which can identify important group covariates. Besides, we will give the algorithm and prove their consistency property. Moreover, we propose bi-level selection methods, which can identify not only important groups but also important covariates within selected groups, as well as give the computation solution and prove their oracle consistency property at both the group and within-group levels. Furthermore, we will propose Laplacian group selection methods, taking network structure among covariates into consideration; then we will extend the GCD algorithm for their computation and show that they have the oracle property under a sparse Rieze condition. Finally, we will apply these methods to credit scoring.

英文关键词: Statistics;Variable Selection;Generalized Linear Regression;Credit Scoring

成为VIP会员查看完整内容
2

相关内容

统计学(Statistics)是研究收集、分析、解读、展示及组织(collection, analysis, interpretation, presentation and organization)数据的学科,通过量化地研究随机性,从而理解数据的产生机制,并进行判别、预测、优化、决策。统计学理论和方法是很多现代科学分支的支柱,其广泛的应用深刻地影响现代生活,具有代表性的应用领域包括: 生物/医学(生物统计学,基因统计学,生物信息学,制药学等)
社会学/环境学(社会统计学,心理学,人口学,空间统计学,环境统计学等)
工业工程学(质量控制,可靠性分析等)
经济学/金融学(精算学,金融统计学等)
工程学/计算机科学(统计学习,数据挖掘,信号/图像采样/处理等)
基础科学(统计物理学,统计化学等)
【新书稿】数据科学的谱方法:统计的视角,168页pdf
专知会员服务
58+阅读 · 2021年10月28日
专知会员服务
78+阅读 · 2021年10月12日
【干货书】R语言探索性数据分析,218页pdf
专知会员服务
62+阅读 · 2021年9月14日
算法分析导论, 593页pdf
专知会员服务
151+阅读 · 2021年8月30日
专知会员服务
105+阅读 · 2021年8月23日
[计算博弈论及其应用],85页ppt
专知会员服务
126+阅读 · 2021年7月21日
【经典书】信息论原理,774页pdf
专知会员服务
257+阅读 · 2021年3月22日
专知会员服务
145+阅读 · 2021年2月3日
【干货书】用Python构建概率图模型,173页pdf
专知会员服务
112+阅读 · 2020年8月23日
周玉驰:因果分析在贝壳的探索实践
专知
0+阅读 · 2022年1月22日
CIKM21 | 图模型在广告检索(Ad Retrieval)中的应用
图与推荐
0+阅读 · 2021年12月16日
KDD'21 | 如何评估GNN的解释性模型?
图与推荐
1+阅读 · 2021年9月30日
【干货书】贝叶斯推断随机过程,449页pdf
专知
29+阅读 · 2020年8月27日
从模型到应用,一文读懂因子分解机
AI100
10+阅读 · 2019年9月6日
基于数据的分布式鲁棒优化算法及其应用【附PPT与视频资料】
人工智能前沿讲习班
26+阅读 · 2018年12月13日
国家自然科学基金
0+阅读 · 2017年12月31日
国家自然科学基金
1+阅读 · 2015年12月31日
国家自然科学基金
2+阅读 · 2013年12月31日
国家自然科学基金
0+阅读 · 2013年12月31日
国家自然科学基金
1+阅读 · 2013年12月31日
国家自然科学基金
1+阅读 · 2013年12月31日
国家自然科学基金
0+阅读 · 2013年12月31日
国家自然科学基金
3+阅读 · 2012年12月31日
国家自然科学基金
0+阅读 · 2012年12月31日
国家自然科学基金
0+阅读 · 2011年12月31日
Chinese Idiom Paraphrasing
Arxiv
0+阅读 · 2022年4月15日
Arxiv
15+阅读 · 2021年2月19日
Arxiv
11+阅读 · 2018年5月21日
小贴士
相关VIP内容
【新书稿】数据科学的谱方法:统计的视角,168页pdf
专知会员服务
58+阅读 · 2021年10月28日
专知会员服务
78+阅读 · 2021年10月12日
【干货书】R语言探索性数据分析,218页pdf
专知会员服务
62+阅读 · 2021年9月14日
算法分析导论, 593页pdf
专知会员服务
151+阅读 · 2021年8月30日
专知会员服务
105+阅读 · 2021年8月23日
[计算博弈论及其应用],85页ppt
专知会员服务
126+阅读 · 2021年7月21日
【经典书】信息论原理,774页pdf
专知会员服务
257+阅读 · 2021年3月22日
专知会员服务
145+阅读 · 2021年2月3日
【干货书】用Python构建概率图模型,173页pdf
专知会员服务
112+阅读 · 2020年8月23日
相关基金
国家自然科学基金
0+阅读 · 2017年12月31日
国家自然科学基金
1+阅读 · 2015年12月31日
国家自然科学基金
2+阅读 · 2013年12月31日
国家自然科学基金
0+阅读 · 2013年12月31日
国家自然科学基金
1+阅读 · 2013年12月31日
国家自然科学基金
1+阅读 · 2013年12月31日
国家自然科学基金
0+阅读 · 2013年12月31日
国家自然科学基金
3+阅读 · 2012年12月31日
国家自然科学基金
0+阅读 · 2012年12月31日
国家自然科学基金
0+阅读 · 2011年12月31日
微信扫码咨询专知VIP会员