项目名称: 基于加权有向多重图的DNA序列比较的非比对方法研究
项目编号: No.61401186
项目类型: 青年科学基金项目
立项/批准年度: 2014
项目学科: 无线电电子学、电信技术
项目作者: 杨希武
作者单位: 辽宁师范大学
项目金额: 24万元
中文摘要: 生物序列比较的非比对方法在处理日益增长的生物序列中发挥着重要作用,是后基因组时代的研究热点。本项目将DNA序列映射到加权有向图中,将k-词间的距离对应为网络中的路径长度,利用图论理论和算法为DNA序列的信息挖掘提供全新的策略。将网络的直径,度序列,各种特性的路径,团的大小及数量,及DNA序列网络的特殊具有的相同k-词间的平均距离,回归距离的特征,组成特征向量,利用该向量进行DNA序列比较。计算有向图中的路径信息,挖掘k-词的位置信息;分析有向图中的模块化特性,挖掘k-词间的关联信息。构造DNA序列在进化过程中(如突变、插入、删除、复制、转移等)的相对不变量。通过SVM分类算法和随机森林方法进行特征选择,建立精准高效的序列非比对方法。本项目的研究将建立若干准确高效的非比对方法,为DNA序列的比较提供工具支持,并将给出非比对方法数据测试集的k-词组成唯一生成的数学指标,推动非比对方法研究。
中文关键词: 序列比较;非比对方法;DNA序列分析;进化分析;图的交叉数
英文摘要: Alignment-free methods play an important role in response to the overwhelming burst in data generated by molecular biology initiatives. It is the focus of Post Genome Era. This project establishes a new method of graphical representation, in which DNA seq
英文关键词: Sequence comparison;Alignment-free method;DNA sequence analysis;Phylogenetic analysis;crossing number