Sequence alignment supports numerous tasks in bioinformatics, natural language processing, pattern recognition, social sciences, and others fields. While the alignment of two sequences may be performed swiftly in many applications, the simultaneous alignment of multiple sequences proved to be naturally more intricate. Although most multiple sequence alignment (MSA) formulations are NP-hard, several approaches have been developed, as they can outperform pairwise alignment methods or are necessary for some applications. Taking into account not only similarities but also the lengths of the compared sequences (i.e. normalization) can provide better alignment results than both unnormalized or post-normalized approaches. While some normalized methods have been developed for pairwise sequence alignment, none have been proposed for MSA. This work is a first effort towards the development of normalized methods for MSA. We discuss multiple aspects of normalized multiple sequence alignment (NMSA). We define three new criteria for computing normalized scores when aligning multiple sequences, showing the NP-hardness and exact algorithms for solving the NMSA using those criteria. In addition, we provide approximation algorithms for MSA and NMSA for some classes of scoring matrices.


翻译:序列对齐支持生物信息学、自然语言处理、模式识别、社会科学和其他领域的众多任务。虽然在许多应用中可以快速地对齐两个序列,但同时对齐多个序列的配对过程自然比较复杂。虽然大多数多个序列对齐(MSA)的配方是NP-硬的,但已经开发出几种方法,因为它们可以优于双对对齐配方法,或对某些应用来说是必要的。不仅考虑到相似之处,而且比较序列(即正常化)的长度可以提供比非正常或后正常方法更好的对齐结果。虽然已经为对齐顺序对齐制定了一些标准化方法,但没有为管理事务协议提出任何建议。这项工作是为制定正常管理事务协议方法所作的首次努力。我们讨论了标准化多个序列对齐的多个方面(NSA)。我们确定了在对齐多个序列时计算标准化分数的三项新标准,用这些标准显示NP-硬性和精确算法来解决NMSA。此外,我们为某些等级的矩阵提供了特派任务生活津贴和NMSA的近似算法。

0
下载
关闭预览

相关内容

【干货书】面向计算科学和工程的Python导论,167页pdf
专知会员服务
41+阅读 · 2021年4月7日
专知会员服务
124+阅读 · 2020年11月25日
【干货书】机器学习速查手册,135页pdf
专知会员服务
125+阅读 · 2020年11月20日
Stabilizing Transformers for Reinforcement Learning
专知会员服务
59+阅读 · 2019年10月17日
Keras François Chollet 《Deep Learning with Python 》, 386页pdf
专知会员服务
152+阅读 · 2019年10月12日
Transferring Knowledge across Learning Processes
CreateAMind
28+阅读 · 2019年5月18日
已删除
将门创投
11+阅读 · 2019年4月26日
强化学习的Unsupervised Meta-Learning
CreateAMind
17+阅读 · 2019年1月7日
meta learning 17年:MAML SNAIL
CreateAMind
11+阅读 · 2019年1月2日
A Technical Overview of AI & ML in 2018 & Trends for 2019
待字闺中
17+阅读 · 2018年12月24日
利用动态深度学习预测金融时间序列基于Python
量化投资与机器学习
18+阅读 · 2018年10月30日
Machine Learning:十大机器学习算法
开源中国
21+阅读 · 2018年3月1日
Arxiv
57+阅读 · 2021年5月3日
Arxiv
5+阅读 · 2019年4月25日
Arxiv
12+阅读 · 2019年3月14日
Arxiv
17+阅读 · 2018年4月2日
Arxiv
5+阅读 · 2018年1月23日
VIP会员
相关VIP内容
【干货书】面向计算科学和工程的Python导论,167页pdf
专知会员服务
41+阅读 · 2021年4月7日
专知会员服务
124+阅读 · 2020年11月25日
【干货书】机器学习速查手册,135页pdf
专知会员服务
125+阅读 · 2020年11月20日
Stabilizing Transformers for Reinforcement Learning
专知会员服务
59+阅读 · 2019年10月17日
Keras François Chollet 《Deep Learning with Python 》, 386页pdf
专知会员服务
152+阅读 · 2019年10月12日
相关资讯
Transferring Knowledge across Learning Processes
CreateAMind
28+阅读 · 2019年5月18日
已删除
将门创投
11+阅读 · 2019年4月26日
强化学习的Unsupervised Meta-Learning
CreateAMind
17+阅读 · 2019年1月7日
meta learning 17年:MAML SNAIL
CreateAMind
11+阅读 · 2019年1月2日
A Technical Overview of AI & ML in 2018 & Trends for 2019
待字闺中
17+阅读 · 2018年12月24日
利用动态深度学习预测金融时间序列基于Python
量化投资与机器学习
18+阅读 · 2018年10月30日
Machine Learning:十大机器学习算法
开源中国
21+阅读 · 2018年3月1日
Top
微信扫码咨询专知VIP会员