序列比对

✍ dations ◷ 2025-06-07 05:52:39 #序列比对
序列比对指将两个或多个序列排列在一起,标明其相似之处。序列中可以插入间隔(通常用短横线“-”表示)。对应的相同或相似的符号(在核酸中是A, T(或U), C, G,在蛋白质中是氨基酸残基的单字母表示)排列在同一列上。这一方法常用于研究由共同祖先进化而来的序列,特别是如蛋白质序列或DNA序列等生物序列。在比对中,错配与突变相应,而空位与插入或缺失对应。序列比对还可用于语言进化或文本间相似性之类的研究。术语“序列比对”也指构建上述比对或在潜在的不相关序列的数据库中寻找significant alignments。对于很短或非常相似的序列,我们可以人工进行比对。然而,在很多问题中,我们需要对非常长的序列进行比对,这是单靠人类的努力所不能解决的。在这种情况下,我们通过构造算法来进行高效的序列比对,有时还需要对最终结果进行调整,因为有些结果难以通过算法表达出来(特别是核苷酸序列)。序列比对的计算方法一般分为两类:全局性比对(global alignments)和局部比对(local alignments)。计算一个全局性的路线,是一个全局优化的形式,其强制按照整个长度的所有查询序列对齐。与此相反,局部比对只确定局部的相似而整个长序列却往往大相径庭。局部比对往往是可取的,但可能更难以计算的,因为还有来自确定其他相似区域的挑战。各种计算算法已应用于序列比对的问题,包括缓慢,但正规的像动态规划的优化方法和高效率,但不彻底的启发式算法,或大型数据库搜索设计的概率方法。双序列比对方法涉及寻找(局部)最优匹配片断或蛋白质(氨基酸)或DNA(核酸)全局比对。全局比对是指将参与比对的两条序列里面的所有字符进行比对。 全局比对主要被用来寻找关系密切的序列。由于这些序列也都很易通过本地比对方法找到,现在全局比对也有些被认为只是一种技巧。另外,全局比对在应用于分子进化时也有些问题(比如domain shuffling -见下),这也限制了这种方法的可用性。多序列比对是成对比对的延伸,是为了在一次比对里面处理多于两条的的序列。多序列比对方法试图比对一个指定序列集合里面的所有序列,这可以帮助确定这些序列的共同区段。进行多序列比对有几种方法,最常用的一种是Clustal程序集,它使用渐进多序列比对算法。Clustal在cladistics中被用来建立进化树,在PSI-BLAST和Hidden Markov model- (HMM-)中用来建立序列档案以在序列数据库中搜索更远的同源序列。多序列比对编程实现困难。被归为NP难题的一种。这一方法利用一个预先计算的哈西表作为短序列的索引。给定一个被查询序列,将根据索引来查询子序列,从而减少查询次数和时间。提供一些参数将使该方法更快或更准确。检索到与检索序列匹配的模式后,需要进一步使用更加准确和深入的算法。BLAST利用成对的本地检索和许多其他方法来提高Smith-Waterman算法的速度。

相关

  • 坟场坟场(cemetery、graveyard)是死者遗体以及火葬遗物如骨灰所埋葬的地方。英文中的“cemetery”来源于希腊文κοιμητήριον,意为“睡觉的场所”。该词暗示此地块专用作
  • 必理痛7.21 g/kg (0 °C) 8.21 g/kg (5 °C) 9.44 g/kg (10 °C) 10.97 g/kg (15 °C) 12.78 g/kg (20 °C) ~14 mg/mL (20 °C)对乙酰氨基酚(英语:Acetaminophen),又称
  • 南极洲/南极地方南极洲(英语:Antarctica)是地球最南端的洲,位于南半球的南极区,是地理南极的所在地。南极洲大部分区域都在南极圈内,四周被南冰洋环绕。南极洲是世界上的第五大洲,其面积约为1400万
  • 变形虫门变形虫门是一类似变形虫的(amoeboid)原生生物。变形虫门的多数物种靠细胞内原生质的流动而移动。伪足类似于手指形状、边缘是钝的,所以称作lobopodia,直译为钝的伪足. 大多数是
  • 国家药品监督管理局国家药品监督管理局(官方英语译名:National Medical Products Administration,缩写为NMPA),是中华人民共和国国务院负责药品监管的国家局,由国家市场监督管理总局管理。2018年3月1
  • 依附依附理论(英语:attachment theory)是一种心理学、演化、动物行为学理论,旨在探讨“人际关系”:二或多个个体间的感情纽带。依附理论最重要的原则是,幼童因为社会与情感需求,而至少
  • 胶子在粒子物理学中,胶子(gluon)是负责在两个夸克之间传递强作用力的基本粒子,类似光子负责在两个带电粒子之间传递电磁力一般。用科学术语来说明,胶子是量子色动力学用来在两个夸克
  • 情绪不稳假性延髓效应(英语:PseudoBulbar affect,缩写 PBA),或称情绪调节障碍(日语:情動調節障害),俗称强哭强笑,或啼笑皆非。是一种神经系统的病,多半源于脑部受伤。例如头部撞到,或中风等里外
  • 水经注《水经注》是古代中国地理名著,共四十卷。作者是北魏晚期的郦道元。《水经注》因注《水经》而得名,《水经》一书约一万余字,《唐六典·注》说其“引天下之水,百三十七”。《水经
  • 锡耶纳锡耶纳(意大利语:Siena,意大利语发音: 聆听)是意大利托斯卡纳大区的一座城市,也是锡耶纳省的首府。其老城中心区1995年被联合国教科文组织列为世界文化遗产。锡耶纳是意大利著名