项目名称: 基于近似重复矢量的DNA序列数据压缩算法研究
项目编号: No.60872125
项目类型: 面上项目
立项/批准年度: 2009
项目学科: 金属学与金属工艺
项目作者: 纪震
作者单位: 深圳大学
项目金额: 32万元
中文摘要: 针对DNA序列数据每天以海量速度增长和占用存储空间日益增加的问题,本项目研究基于矢量的DNA序列数据压缩算法。 在DNA序列数据压缩过程中发掘序列的生物学解释,采用生物启发式优化算法实现高效的DNA序列仿生聚类,生成编码性能更高的近似重复矢量,替代传统的重复子串匹配方法是本项目追求的目标。 本项目将利用近似重复矢量编码技术寻求DNA序列数据无损压缩中的最佳码书设计。运用生物学知识构建具有生物信息学知识的DNA序列仿生聚类, 寻找序列的生物特性,提取近似重复矢量,构造DNA序列数据的近似重复矢量的数学模型,认识和掌握其内在机理和本质特性。 ` 本项目将DNA序列数据压缩研究从"精确重复子串匹配"、"最长精确重复子串匹配"、"近似重复子串匹配"拓展到"近似重复矢量"阶段,在国际上属于源头创新,对于提高DNA序列数据编码效率有着重要的理论价值。
中文关键词: DNA序列数据压缩;近似重复矢量;码书设计;生物启发式优化算法;仿生聚类
英文摘要:
英文关键词: