项目名称: 融合多种表型相似性和基因相似性的疾病关联基因预测方法
项目编号: No.61175002
项目类型: 面上项目
立项/批准年度: 2012
项目学科: 自动化学科
项目作者: 江瑞
作者单位: 清华大学
项目金额: 59万元
中文摘要: 疾病关联基因的预测是人类与医学遗传学中的重要科学问题,也是生物信息学和系统生物学的重要研究方向。本项目立足于国际上新近建立的人类表型本体,实现并比较多种基于该本体的表型相似性计算方法,以构建高质量的疾病表型相似性数据。在此基础上,本项目针对基因序列、基因表达、蛋白质相互作用网络等多种基因组数据计算基因之间的相似性,并从非监督学习、监督学习和半监督学习等多个角度研究融合多种表型相似性和多种基因相似性进行疾病关联基因预测的理论模型和计算方法。本项目用信息的、系统的、量化的、整合的观点考查疾病表型和人类基因作为一个整体所遵循的规律,研究内容既在人类与医学遗传学领域具有重要的理论意义,又在复杂疾病防治等公众健康方面具有重大的实际应用价值。项目研究成果将以高质量学术论文、在线数据库、公开软件等形式展现,从而为应用模式识别理论和机器学习方法解决生命科学领域的重要科学问题提供有益的借鉴。
中文关键词: 疾病关联基因;表型相似性;基因相似性;数据融合;回归分析
英文摘要:
英文关键词: disease genes;phenotype similarity;gene similarity;data fusion;regression