项目名称: 下一代测序数据自适应错误修正技术的研究

项目编号: No.61472082

项目类型: 面上项目

立项/批准年度: 2015

项目学科: 计算机科学学科

项目作者: 林劼

作者单位: 福建师范大学

项目金额: 63万元

中文摘要: 在下一代测序技术中,错误修正模型是序列拼接的基础,是正确有效测序的重要保证,也是近年生物信息学研究的热点之一。本课题拟通过研究下一代测序数据特征及其错误的分布特点,建立数据质量模型,为错误修正技术提供数据自适应模型。本课题计划对测序数据进行高覆盖细粒度分组聚合,将相似的测序数据聚合在同一组内,应用错误判别模型识别组内错误数据,并进行组内错误修正处理。为了有效利用有限的计算资源来处理海量数据,本课题将采用分布式计算框架,从而达到快速高效的错误修正目的,为测序技术的实际应用提供支持。本课题的研究成果可以结合目前高速发展的下一代测序技术应用在生物科学中的研究和临床疾病的检测,如个性化医疗等领域。

中文关键词: 生物信息处理;下一代测序技术;错误修正;序列分析;聚合模型

英文摘要: In next-generation sequencing(NGS), error correction in short reads is critical in assembly of high quality sequences.In this proposal, we propose to study the characteristic of short reads data generated from NGS and its associated errors,build appropriate quality models to guide error correction process. We will investigate cluster models which have high coverage and fine grain ability to group similar and neigborhood short reads into a cluster. Then errors are corrected in individual cluster separately which is distributed in different computing nodes. In order to utilize limited computing facility to cope with large-scale volume of NGS data, we will study distributed framework which will speed up the computing time, decrease the requirement memory usage,and result in more acurate short reads for assemble. The proposed research will benefit high throughput NGS applications both in research and in practice,ie. personalized medicine.

英文关键词: bioinformaics;NGS;error correction;sequence analysis;cluster model

成为VIP会员查看完整内容
0

相关内容

基于文档的对话技术研究
专知会员服务
19+阅读 · 2022年2月20日
视频隐私保护技术综述
专知会员服务
34+阅读 · 2022年1月19日
专知会员服务
15+阅读 · 2021年8月6日
专知会员服务
64+阅读 · 2021年7月25日
专知会员服务
21+阅读 · 2021年4月20日
人工智能模型数据泄露的攻击与防御研究综述
专知会员服务
70+阅读 · 2021年3月31日
专知会员服务
57+阅读 · 2020年12月6日
专知会员服务
193+阅读 · 2020年10月14日
专知会员服务
50+阅读 · 2020年7月16日
【耶鲁】数据结构与编程技术,638页pdf
专知
2+阅读 · 2021年4月26日
事实抽取与验证研究综述
专知
0+阅读 · 2021年4月20日
【WWW2021】实体自适应语义依赖图立场检测
【大数据】海量数据分析能力形成和大数据关键技术
产业智能官
17+阅读 · 2018年10月29日
【知识图谱】医学知识图谱构建技术与研究进展
产业智能官
44+阅读 · 2017年11月16日
已删除
将门创投
12+阅读 · 2017年10月13日
国家自然科学基金
2+阅读 · 2015年12月31日
国家自然科学基金
0+阅读 · 2014年12月31日
国家自然科学基金
2+阅读 · 2014年12月31日
国家自然科学基金
1+阅读 · 2014年12月31日
国家自然科学基金
0+阅读 · 2013年12月31日
国家自然科学基金
0+阅读 · 2012年12月31日
国家自然科学基金
0+阅读 · 2012年12月31日
国家自然科学基金
1+阅读 · 2011年12月31日
国家自然科学基金
0+阅读 · 2009年12月31日
Arxiv
0+阅读 · 2022年4月16日
小贴士
相关VIP内容
基于文档的对话技术研究
专知会员服务
19+阅读 · 2022年2月20日
视频隐私保护技术综述
专知会员服务
34+阅读 · 2022年1月19日
专知会员服务
15+阅读 · 2021年8月6日
专知会员服务
64+阅读 · 2021年7月25日
专知会员服务
21+阅读 · 2021年4月20日
人工智能模型数据泄露的攻击与防御研究综述
专知会员服务
70+阅读 · 2021年3月31日
专知会员服务
57+阅读 · 2020年12月6日
专知会员服务
193+阅读 · 2020年10月14日
专知会员服务
50+阅读 · 2020年7月16日
相关资讯
【耶鲁】数据结构与编程技术,638页pdf
专知
2+阅读 · 2021年4月26日
事实抽取与验证研究综述
专知
0+阅读 · 2021年4月20日
【WWW2021】实体自适应语义依赖图立场检测
【大数据】海量数据分析能力形成和大数据关键技术
产业智能官
17+阅读 · 2018年10月29日
【知识图谱】医学知识图谱构建技术与研究进展
产业智能官
44+阅读 · 2017年11月16日
已删除
将门创投
12+阅读 · 2017年10月13日
相关基金
国家自然科学基金
2+阅读 · 2015年12月31日
国家自然科学基金
0+阅读 · 2014年12月31日
国家自然科学基金
2+阅读 · 2014年12月31日
国家自然科学基金
1+阅读 · 2014年12月31日
国家自然科学基金
0+阅读 · 2013年12月31日
国家自然科学基金
0+阅读 · 2012年12月31日
国家自然科学基金
0+阅读 · 2012年12月31日
国家自然科学基金
1+阅读 · 2011年12月31日
国家自然科学基金
0+阅读 · 2009年12月31日
微信扫码咨询专知VIP会员