项目名称: 高准度二代测序比对算法

项目编号: No.31501067

项目类型: 青年科学基金项目

立项/批准年度: 2016

项目学科: 生物科学

项目作者: 王一

作者单位: 复旦大学

项目金额: 19万元

中文摘要: 二代测序是未来生命科学领域的基础性技术之一。二代测序的常规分析流程都离不开序列比对这一基础步骤。序列比对步骤的质量对二代测序数据分析结果起着关键性的作用。现有的比对算法存在着一定的比对假阴性率和假阳性率以及系统性偏差,影响了后续分析的可靠性。本课题将自行开发一套序列比对算法,以期达到低比对假阴性率和假阳性率以及系统偏差,同时兼顾比对速度。本课题拟在三方面开展工作:首先系统化回顾前人工作,提炼其共有框架和特色技术,然后充分利用长读长的优点,编写自主的比对算法,最后在模拟数据和真实数据上进行系统化测评,取得对该算法的正确评价以及实际使用经验。目前该课题已有一定基础框架,初步试验表明该算法可以降低比对错误,同时维持较高比对速度。后续研究将集中在算法速度提升和算法成熟化上,以期达到工业级别实际应用能力。

中文关键词: 人;计算模型;模拟;参数优化;软件开发

英文摘要: Second-generation sequencing technology is one of the fundamental technology in future life science. Conventional Second-generation sequencing analysis process is inseparable from the basic read alignment step. The quality of this step plays a key role in the quality of the final analysis results. Existing alignment algorithms have certain false-negative and false-positive rates as well as the systemic bias, compromising the reliability of the subsequent analysis. This study will develop its own sequence alignment algorithm to achieve lower false-negative and false-positive rates as well as lower systematic bias, taking into consideration of the speed. This study proposes to work in three steps: First, a systematic review of previous work and refine their consensus framework and technical features. Make full use of the advantages of a long read length, write its own alignment algorithms. And finally benchmark on the simulated data and real data, to get the proper evaluation of the algorithm and the application experience. At present, there are certain elementary framework of the subject, preliminary experiments show that the algorithm can reduce the error rate, while maintaining a high speed. Follow-up studies will focus on algorithms speed and algorithms maturing, in order to achieve industrial level application.

英文关键词: human;computational model;simulation;parameter optimization;software development

成为VIP会员查看完整内容
2

相关内容

【干货书】《日常算法》,154页pdf
专知会员服务
55+阅读 · 2022年1月22日
算法通关手册(LeetCode)
专知会员服务
156+阅读 · 2022年1月13日
【干货书】概率,统计与数据,513页pdf
专知会员服务
129+阅读 · 2021年11月27日
【干货书】面向工程师的随机过程,448页pdf
专知会员服务
77+阅读 · 2021年11月3日
专知会员服务
111+阅读 · 2021年9月22日
算法分析导论, 593页pdf
专知会员服务
144+阅读 · 2021年8月30日
专知会员服务
18+阅读 · 2020年9月2日
【干货书】《日常算法》,154页pdf
专知
6+阅读 · 2022年1月22日
京东招聘CV算法实习生
CVer
1+阅读 · 2022年1月14日
算法通关手册(LeetCode)
专知
8+阅读 · 2022年1月13日
【干货书】概率,统计与数据,513页pdf
专知
29+阅读 · 2021年11月27日
95后阿里P7晒出工资单:懂点算法,就这么香?
图与推荐
0+阅读 · 2021年11月19日
各厂推荐算法!
程序猿
17+阅读 · 2018年1月13日
国家自然科学基金
1+阅读 · 2014年12月31日
国家自然科学基金
0+阅读 · 2014年12月31日
国家自然科学基金
0+阅读 · 2014年12月31日
国家自然科学基金
0+阅读 · 2014年12月31日
国家自然科学基金
0+阅读 · 2013年12月31日
国家自然科学基金
0+阅读 · 2012年12月31日
国家自然科学基金
0+阅读 · 2012年12月31日
国家自然科学基金
0+阅读 · 2012年12月31日
国家自然科学基金
0+阅读 · 2012年12月31日
国家自然科学基金
0+阅读 · 2011年12月31日
Arxiv
0+阅读 · 2022年4月20日
Arxiv
0+阅读 · 2022年4月19日
Arxiv
17+阅读 · 2022年1月11日
Arxiv
46+阅读 · 2021年10月4日
Meta-Learning to Cluster
Arxiv
17+阅读 · 2019年10月30日
小贴士
相关VIP内容
【干货书】《日常算法》,154页pdf
专知会员服务
55+阅读 · 2022年1月22日
算法通关手册(LeetCode)
专知会员服务
156+阅读 · 2022年1月13日
【干货书】概率,统计与数据,513页pdf
专知会员服务
129+阅读 · 2021年11月27日
【干货书】面向工程师的随机过程,448页pdf
专知会员服务
77+阅读 · 2021年11月3日
专知会员服务
111+阅读 · 2021年9月22日
算法分析导论, 593页pdf
专知会员服务
144+阅读 · 2021年8月30日
专知会员服务
18+阅读 · 2020年9月2日
相关资讯
【干货书】《日常算法》,154页pdf
专知
6+阅读 · 2022年1月22日
京东招聘CV算法实习生
CVer
1+阅读 · 2022年1月14日
算法通关手册(LeetCode)
专知
8+阅读 · 2022年1月13日
【干货书】概率,统计与数据,513页pdf
专知
29+阅读 · 2021年11月27日
95后阿里P7晒出工资单:懂点算法,就这么香?
图与推荐
0+阅读 · 2021年11月19日
各厂推荐算法!
程序猿
17+阅读 · 2018年1月13日
相关基金
国家自然科学基金
1+阅读 · 2014年12月31日
国家自然科学基金
0+阅读 · 2014年12月31日
国家自然科学基金
0+阅读 · 2014年12月31日
国家自然科学基金
0+阅读 · 2014年12月31日
国家自然科学基金
0+阅读 · 2013年12月31日
国家自然科学基金
0+阅读 · 2012年12月31日
国家自然科学基金
0+阅读 · 2012年12月31日
国家自然科学基金
0+阅读 · 2012年12月31日
国家自然科学基金
0+阅读 · 2012年12月31日
国家自然科学基金
0+阅读 · 2011年12月31日
相关论文
Arxiv
0+阅读 · 2022年4月20日
Arxiv
0+阅读 · 2022年4月19日
Arxiv
17+阅读 · 2022年1月11日
Arxiv
46+阅读 · 2021年10月4日
Meta-Learning to Cluster
Arxiv
17+阅读 · 2019年10月30日
微信扫码咨询专知VIP会员