首页 >
比对
✍ dations ◷ 2025-05-16 05:29:49 #比对
序列比对指将两个或多个序列排列在一起,标明其相似之处。序列中可以插入间隔(通常用短横线“-”表示)。对应的相同或相似的符号(在核酸中是A, T(或U), C, G,在蛋白质中是氨基酸残基的单字母表示)排列在同一列上。这一方法常用于研究由共同祖先进化而来的序列,特别是如蛋白质序列或DNA序列等生物序列。在比对中,错配与突变相应,而空位与插入或缺失对应。序列比对还可用于语言进化或文本间相似性之类的研究。术语“序列比对”也指构建上述比对或在潜在的不相关序列的数据库中寻找significant alignments。对于很短或非常相似的序列,我们可以人工进行比对。然而,在很多问题中,我们需要对非常长的序列进行比对,这是单靠人类的努力所不能解决的。在这种情况下,我们通过构造算法来进行高效的序列比对,有时还需要对最终结果进行调整,因为有些结果难以通过算法表达出来(特别是核苷酸序列)。序列比对的计算方法一般分为两类:全局性比对(global alignments)和局部比对(local alignments)。计算一个全局性的路线,是一个全局优化的形式,其强制按照整个长度的所有查询序列对齐。与此相反,局部比对只确定局部的相似而整个长序列却往往大相径庭。局部比对往往是可取的,但可能更难以计算的,因为还有来自确定其他相似区域的挑战。各种计算算法已应用于序列比对的问题,包括缓慢,但正规的像动态规划的优化方法和高效率,但不彻底的启发式算法,或大型数据库搜索设计的概率方法。双序列比对方法涉及寻找(局部)最优匹配片断或蛋白质(氨基酸)或DNA(核酸)全局比对。全局比对是指将参与比对的两条序列里面的所有字符进行比对。
全局比对主要被用来寻找关系密切的序列。由于这些序列也都很易通过本地比对方法找到,现在全局比对也有些被认为只是一种技巧。另外,全局比对在应用于分子进化时也有些问题(比如domain shuffling -见下),这也限制了这种方法的可用性。多序列比对是成对比对的延伸,是为了在一次比对里面处理多于两条的的序列。多序列比对方法试图比对一个指定序列集合里面的所有序列,这可以帮助确定这些序列的共同区段。进行多序列比对有几种方法,最常用的一种是Clustal程序集,它使用渐进多序列比对算法。Clustal在cladistics中被用来建立进化树,在PSI-BLAST和Hidden Markov model- (HMM-)中用来建立序列档案以在序列数据库中搜索更远的同源序列。多序列比对编程实现困难。被归为NP难题的一种。这一方法利用一个预先计算的哈西表作为短序列的索引。给定一个被查询序列,将根据索引来查询子序列,从而减少查询次数和时间。提供一些参数将使该方法更快或更准确。检索到与检索序列匹配的模式后,需要进一步使用更加准确和深入的算法。BLAST利用成对的本地检索和许多其他方法来提高Smith-Waterman算法的速度。
相关
- 酗酒酗酒(英语:alcoholism),又称酒精使用疾患(alcohol use disorder, AUD)或酒精依赖症候群(alcohol dependence syndrome),其为饮用酒精所致相关问题的广义用语,过去将之分成酒精滥用(英语
- ADP-核糖基化二磷酸腺苷核糖基化(英语:ADP-ribosylation,ADP-核糖基化)是将额外的单个或多个二磷酸腺苷核糖(ADP核糖)基团添加到蛋白质的氨基酸残基上的转译后修饰过程。这一过程可逆,涉及许多
- 肌红蛋白3RGK· oxygen binding · heme binding· transport · heart development · response to hormone stimulus · slow-twitch skeletal muscle fiber contraction ·
- ACal2glh· extracellular space · soluble fraction· G-protein signaling, coupled to cAMP nucleotide second messenger · adenylate cyclase activation · phosphol
- 董奉董奉(200-280,一说220-280)字君异,号拔墘,又号杏林,侯官县董墘村(今福建省福州市长乐区古槐镇青山村)人。东汉末年及三国时代著名医师,与华佗、张仲景并称为“建安三神医”,医术记载较少
- 自由落体定律自由落体运动是指只受重力作用(不存在空气阻力的理想状态)的均匀加速度运动过程。运动过程中重力势能与动能之和遵守机械能守恒定律。在地球上相同位置与相同高度,自由落体的加
- 早雨海世早雨海纪指从距今约38亿5千万年到38亿年前,长达5千万年的一段时间。紧随它之后的是晚雨海世。该时期的上下界限标志是以二座最年青的大型月球撞击盆地的出现而确定:雨海盆地的
- 伞形花序伞形花序(Umbel)为一种花序,属于无限花序(Indeterminate inflorescence),由从一点上发出的许多花梗组成,其形状有如伞骨。此一称呼可追溯至1590年,来自拉丁文的umbella,意指遮阳用的
- 衰变能量放射性或辐射性是指某元素的放射性同位素从不稳定的原子核自发地放出射线(如α射线、β射线、γ射线等)而衰变形成另一种同位素(衰变产物),这种现象称为放射性。衰变时放出的能量
- 亚化石亚化石,亦作半化石或准化石,泛指所有因时间不足或其他未能满足化石化的条件而形成的生物残骸,例如:骨块、巢穴或排泄物。常见于数千年前的生物出土物,存在于岩洞或其他遮蔽物。来