项目名称: 基于高通量测序数据多供体植物基因组结构变异识别方法研究
项目编号: No.61402132
项目类型: 青年科学基金项目
立项/批准年度: 2014
项目学科: 自动化技术、计算机技术
项目作者: 王春宇
作者单位: 哈尔滨工业大学
项目金额: 24万元
中文摘要: 结构变异属于基因组的重排,对生物个体的进化过程和自然选择过程有重要贡献,与生物表型和遗传疾病有关。结构变异的识别方法,与传统基于显微镜和芯片的方法相比,采用高通量测序技术能够更准确和全面的识别全基因组结构变异。目前在大量短序列的高通量序列数据中,识别结构变异的算法设计仍是一种挑战。本项目利用植物多供体的高通量测序数据与单个参考基因组相比较,采用基因组组装、对端读片段定位、读片段分隔和覆盖度分析相结合的技术,设计并实现基于植物基因组特点的结构变异识别方法。在保证结构变异识别种类全面的基础上,提高识别的精确性和特异性。能够为识别出的结构变异预测精确的断点位置,根据断点处微同源性,分析结构变异的形成机制。建立并维护重要植物基因组的结构变异数据库。
中文关键词: 序列聚类;结构变异;拷贝数变异;断点;高通量测序
英文摘要: Structural variations are genomic rearrangements that contribute significantly to evolution, natural variation between organisms, and are often involved in biological phenotypes and genetic disorders. Traditional microscope and array based methods are
英文关键词: sequence clustering;structural variation;CNV;breakpoints;HTS