序列比对

✍ dations ◷ 2025-10-10 17:42:23 #序列比对
序列比对指将两个或多个序列排列在一起,标明其相似之处。序列中可以插入间隔(通常用短横线“-”表示)。对应的相同或相似的符号(在核酸中是A, T(或U), C, G,在蛋白质中是氨基酸残基的单字母表示)排列在同一列上。这一方法常用于研究由共同祖先进化而来的序列,特别是如蛋白质序列或DNA序列等生物序列。在比对中,错配与突变相应,而空位与插入或缺失对应。序列比对还可用于语言进化或文本间相似性之类的研究。术语“序列比对”也指构建上述比对或在潜在的不相关序列的数据库中寻找significant alignments。对于很短或非常相似的序列,我们可以人工进行比对。然而,在很多问题中,我们需要对非常长的序列进行比对,这是单靠人类的努力所不能解决的。在这种情况下,我们通过构造算法来进行高效的序列比对,有时还需要对最终结果进行调整,因为有些结果难以通过算法表达出来(特别是核苷酸序列)。序列比对的计算方法一般分为两类:全局性比对(global alignments)和局部比对(local alignments)。计算一个全局性的路线,是一个全局优化的形式,其强制按照整个长度的所有查询序列对齐。与此相反,局部比对只确定局部的相似而整个长序列却往往大相径庭。局部比对往往是可取的,但可能更难以计算的,因为还有来自确定其他相似区域的挑战。各种计算算法已应用于序列比对的问题,包括缓慢,但正规的像动态规划的优化方法和高效率,但不彻底的启发式算法,或大型数据库搜索设计的概率方法。双序列比对方法涉及寻找(局部)最优匹配片断或蛋白质(氨基酸)或DNA(核酸)全局比对。全局比对是指将参与比对的两条序列里面的所有字符进行比对。 全局比对主要被用来寻找关系密切的序列。由于这些序列也都很易通过本地比对方法找到,现在全局比对也有些被认为只是一种技巧。另外,全局比对在应用于分子进化时也有些问题(比如domain shuffling -见下),这也限制了这种方法的可用性。多序列比对是成对比对的延伸,是为了在一次比对里面处理多于两条的的序列。多序列比对方法试图比对一个指定序列集合里面的所有序列,这可以帮助确定这些序列的共同区段。进行多序列比对有几种方法,最常用的一种是Clustal程序集,它使用渐进多序列比对算法。Clustal在cladistics中被用来建立进化树,在PSI-BLAST和Hidden Markov model- (HMM-)中用来建立序列档案以在序列数据库中搜索更远的同源序列。多序列比对编程实现困难。被归为NP难题的一种。这一方法利用一个预先计算的哈西表作为短序列的索引。给定一个被查询序列,将根据索引来查询子序列,从而减少查询次数和时间。提供一些参数将使该方法更快或更准确。检索到与检索序列匹配的模式后,需要进一步使用更加准确和深入的算法。BLAST利用成对的本地检索和许多其他方法来提高Smith-Waterman算法的速度。

相关

  • 酶(英语:Enzyme(/ˈɛnzaɪm/ )),是一类大分子生物催化剂。酶能加快化学反应的速度(即具有催化作用)。由酶催化的反应中,反应物称为底物,生成的物质称为产物。几乎所有细胞内的代谢过
  • 大英百科第11版《大英百科全书第十一版》(英语:Encyclopædia Britannica Eleventh Edition),或作《1911年版大英百科全书》,是《大英百科全书》最经典的一个版本,共29卷。它的出版也反映出美国
  • 国会议会是立法机关的一种型态,由人民中选出一定数量的代表者组成以执行立法权;这些代表者称为议员,可以透过直接选举或间接选举产生、也可能是委任的。议会常用来指称民主国家的立
  • 支链氨基酸支链氨基酸(英语:Branched-chain amino acid)是指亮氨酸、异亮氨酸和缬氨酸三种分子结构中侧链具有分支结构的氨基酸。在运动界常作为增强肌肉力量的补充剂。
  • 化疗脑化疗脑,在学界又称化疗后认知异常(Post-chemotherapy cognitive impairment,简称PCCI)或化疗相关认知异常(Chemotherapy-Related Cognitive Impairments,简称CRCIs)等,所指的是因为
  • 王冰王冰,号启玄子,唐代人。曾任唐代太仆令,又称“王太仆”。生平好养生之术,潜心研究《素问》,尊崇为“至道之宗、奉生之始”,汲历12年,“凡所加字,皆朱书其文,使今古必分、字不杂糅。”
  • 美洛昔康美洛昔康(Meloxicam),商品名莫比可(Mobic),是一种昔康(oxicam)类非甾体抗炎药,可抑制环氧酶的活性,从而阻断前列腺素的合成。主要用于缓解骨关节炎、类风湿性关节炎及关节强硬性脊椎炎
  • HSsub2/sub二硫化一氢是一种短寿命的自由基,化学式为HS2,最初于1950年在光谱中检测到。HS2可以在纯H2S或H2S/Ar混合物的气相脉冲辐射分解中产生,而H2S/H2体系中无法观测到HS2。在H2S和氟
  • 社区农圃社区农圃亦称社区花园或社区园圃,为让社区居民进行园艺与农事耕作的场地。社区农圃鼓励了城市社区的食品安全,让居民们可以种植作物供自己或捐给他人食用。农圃还可以避免人们
  • 醋酸根乙酸盐 (英文: Acetate),俗称醋酸盐,是乙酸所成的盐,含有乙酸根离子CH3COO−,即乙酸去掉羧基质子后形成的阴离子。乙酸根离子的化学式是−,它是一种羧酸根离子,并且是乙酸的共轭碱