项目名称: 大规模SNP数据挖掘及其在复杂疾病分析中的应用研究
项目编号: No.61370171
项目类型: 面上项目
立项/批准年度: 2013
项目学科: 自动化技术、计算机技术
项目作者: 廖波
作者单位: 湖南大学
项目金额: 79万元
中文摘要: 随着SNP微阵列芯片技术的发展,全基因组关联研究已成为识别复杂疾病致病位点的重要手段,但如何提高关联研究的重复性,增强研究结果的解释力是全基因组关联研究的瓶颈问题。本项研究将利用超算平台的计算优势,以复杂疾病SNP数据分析为基础,融合生物通路、分子作用网络等先验信息开展全基因组上位性研究:结合可靠参考数据的遗传模式,挖掘复杂疾病数据的本质特征,综合利用降维以及聚类方法剔除噪声数据、推测缺失数据以及稀罕SNP基因型;设计具有明确生物意义的多位点关联度量,启发式地构造标签SNP子集,并构建数学模型进行性能评估,有效地从全基因组中选择标签SNP;基于生物通路与分子作用网络构建多层次融合分析模型,并在超算平台下设计并行算法研究多位点高阶上位性,进而识别复杂疾病的多弱效致病位点;综合利用基因本体注释等信息解释研究结果,进一步揭示复杂疾病的致病机理。
中文关键词: 超算平台;复杂疾病;全基因组关联研究;上位性;单核苷酸多态性
英文摘要: With the development of the SNP microarray chip technology, the genome-wide association study has become an important means of identifying complex disease pathogenic sites. However, how to overcome the low reproducibility of positive results and the diffi
英文关键词: Supercomputer Platform;Complex Disease;Genome Wide Association Study;Epistasis;Single Nucleotide Polymorphism