项目名称: 整合常见和罕见变异进行肺癌风险预测的统计方法研究
项目编号: No.81373102
项目类型: 面上项目
立项/批准年度: 2013
项目学科: 医药、卫生
项目作者: 赵杨
作者单位: 南京医科大学
项目金额: 70万元
中文摘要: 本研究将整合常见变异和罕见变异等基因组数据,针对肺癌的发病风险,系统地研究构建预测模型时所需的研究设计和统计分析方法。研究将从极端表型抽样法入手,基于残差选择极端样本;考察加权主成分分析和逆Poisson回归用于罕见变异筛选的效率;基于核机器法或主成分分析,采用合适的汇总统计量,在预测模型中引入位点集,以纳入常见位点和罕见变异的作用,并考虑交互作用,以提高模型的预测精度;整合ENCODE计划数据,探讨如何引入这些功能学信息以提高预测精度;研究还将探讨如何在预测模型中合理地纳入环境暴露变量,并在汉族和高加索人群中进行建模,考察人群结构、种族差异与预测模型的关系。取得的结论将用模拟数据和真实资料进行验证。本研究将对基于全基因组关联性研究及下一代测序资料等高维基因组数据进行疾病预测的研究提出分析策略,便于相关基因诊断产品的开发,并开发进行基因组数据预测的软件包。
中文关键词: 肿瘤;预测;随机森林;罕见变异;
英文摘要: The aim of the present study is to develop the research design and statistical methods for the integration of common and rare variants so as to build predictive models for the prediction of lung cancer risk. This study begins with the extreme-phenotype sa
英文关键词: cancer;prediction;random forests;rare variation;