项目名称: 基于数据挖掘技术的信号通路识别模型与算法研究
项目编号: No.60973074
项目类型: 面上项目
立项/批准年度: 2010
项目学科: 自动化技术、计算机技术
项目作者: 陈庆锋
作者单位: 广西大学
项目金额: 27万元
中文摘要: 数据挖掘技术是生物信息学中的重要研究课题之一,研究大规模生物序列分析新算法和复杂的生物模型建模,在提供有商业价值的生物信息,科研启示和生物医学上极为有用。通常的数据挖掘方法不能处理在数据复杂程度,数据量和建模上都要复杂得多的生物数据。因此,发展有效的生物数据挖掘算法有重要的应用意义和理论价值。本项目将研究新陈代谢信号通路相关数据的采集,存储,建模和分析的理论技术和方法。信号通路中的激活跟抑制模式都非常重要,但后者因为较低的支持度易被忽略,因此挖掘算法需要搜索和考虑所有频繁的和非频繁的项集合。其次传统挖掘方法会产生大量规则,需要改进算法分组从中筛选出支持度比较大的频繁模式,避免有用规则丢失或冗余规则产生。该项目的主要目标是发现在外界刺激下蛋白激酶调控的功能和特征,包括研究对外界刺激诱导产生变化的调控机制,研究相关基因表达特征和相关基因结构功能关系。这些结果为疾病诊断和治疗提供了一条有效途径。
中文关键词: 数据挖掘;信号通路;蛋白激酶;关联规则;相似性
英文摘要:
英文关键词: Data mining;signaling pathway;protein kinase;association rule;similarity