项目名称: 生物序列数据的统计模型和算法
项目编号: No.10971097
项目类型: 面上项目
立项/批准年度: 2010
项目学科: 数理科学和化学
项目作者: 刘心声
作者单位: 南京航空航天大学
项目金额: 23万元
中文摘要: 生物序列数据的基本特征决定了生物序列的建模必然是基于数理统计学理论。本项目以大数据统计计算为基础,在贝叶斯统计分析的理论框架之下,系统地研究生物序列数据的统计分析、建模和计算,实现对生物序列信息,特别是蛋白质数据信息的推断。主要内容包括建立针对性的氨基酸替代矩阵,发展更加稳健精确的刻画蛋白质序列相似性的测度,对自然界中蛋白质序列、家族及结构类型的空间分布进行估计,进而对功能蛋白质的序列、结构、功能和进化以及它们之间的关系进行推断和预测,完善或创立针对生物大分子序列数据的统计分析、建模的理论和方法。该研究具有国际先进性,且有重要的理论意义和应用背景。
中文关键词: 生物序列数据;随机过程与演化;密码子置换模型;蛋白质家族和折叠子;统计模型和算法
英文摘要:
英文关键词: Biological sequence data;Random process and evolution;Codon substitution models;Protein families and folds;Statistical model & algorithm