确定人类DNA从端粒到端粒的完整序列的探索始于30年前,最终于2021年完成。这一成就是众多专家的巨大努力的结果,他们设计了各种工具,进行了艰苦的手工检查,以实现第一个无间隙基因组序列。然而,这种方法很难作为一种通用的方法来组装不同的基因组,特别是在数据量很大的情况下,组装速度非常关键。在这项工作中,我们探索了一种不同的方法来解决基因组装配任务的中心部分,包括解开一个需要重建基因组序列的大型装配图。本文的主要动机是减少人工设计的启发式方法,并使用深度学习来开发更通用的重建技术。准确地说,我们引入了一种新的学习框架来训练图卷积网络,通过找到一条正确的路径来解析装配图。训练使用从解析的CHM13人体序列生成的数据集进行监督,并在使用真实人体PacBio HiFi读取构建的装配图上进行测试。实验结果表明,在单一染色体生成的模拟图上训练的模型,能够显著地解析所有其他染色体。此外,在相同的图上,该模型优于由最先进的\textit{de novo}汇编程序手工制作的启发式。使用图网络重建的染色体在核苷酸水平上更准确,报告的contigs数量更低,基因组重建分数更高,以及NG50/NGA50评估指标。

成为VIP会员查看完整内容
12

相关内容

图神经网络 (GNN) 是一种连接模型,它通过图的节点之间的消息传递来捕捉图的依赖关系。与标准神经网络不同的是,图神经网络保留了一种状态,可以表示来自其邻域的具有任意深度的信息。近年来,图神经网络(GNN)在社交网络、知识图、推荐系统、问答系统甚至生命科学等各个领域得到了越来越广泛的应用。

知识荟萃

精品入门和进阶教程、论文和代码整理等

更多

查看相关VIP内容、论文、资讯等
【KDD2021】图神经网络,NUS- Xavier Bresson教授
专知会员服务
62+阅读 · 2021年8月20日
【NeurIPS2020-MIT】子图神经网络,Subgraph Neural Networks
专知会员服务
45+阅读 · 2020年9月28日
专知会员服务
133+阅读 · 2020年8月24日
【ICML2020】图神经网络基准,53页ppt,NUS-Xavier Bresson
专知会员服务
57+阅读 · 2020年7月18日
【NUS-Xavier教授】生成模型VAE与GAN,69页ppt
GNN + Transformer = GraphFormers
图与推荐
6+阅读 · 2021年11月24日
国家自然科学基金
0+阅读 · 2012年12月31日
国家自然科学基金
0+阅读 · 2012年12月31日
国家自然科学基金
0+阅读 · 2012年12月31日
国家自然科学基金
0+阅读 · 2012年12月31日
国家自然科学基金
0+阅读 · 2011年12月31日
国家自然科学基金
0+阅读 · 2011年12月31日
国家自然科学基金
0+阅读 · 2009年12月31日
Arxiv
0+阅读 · 2022年10月25日
Arxiv
10+阅读 · 2017年7月4日
VIP会员
相关基金
国家自然科学基金
0+阅读 · 2012年12月31日
国家自然科学基金
0+阅读 · 2012年12月31日
国家自然科学基金
0+阅读 · 2012年12月31日
国家自然科学基金
0+阅读 · 2012年12月31日
国家自然科学基金
0+阅读 · 2011年12月31日
国家自然科学基金
0+阅读 · 2011年12月31日
国家自然科学基金
0+阅读 · 2009年12月31日
微信扫码咨询专知VIP会员