首页 >
比对
✍ dations ◷ 2025-02-23 20:10:24 #比对
序列比对指将两个或多个序列排列在一起,标明其相似之处。序列中可以插入间隔(通常用短横线“-”表示)。对应的相同或相似的符号(在核酸中是A, T(或U), C, G,在蛋白质中是氨基酸残基的单字母表示)排列在同一列上。这一方法常用于研究由共同祖先进化而来的序列,特别是如蛋白质序列或DNA序列等生物序列。在比对中,错配与突变相应,而空位与插入或缺失对应。序列比对还可用于语言进化或文本间相似性之类的研究。术语“序列比对”也指构建上述比对或在潜在的不相关序列的数据库中寻找significant alignments。对于很短或非常相似的序列,我们可以人工进行比对。然而,在很多问题中,我们需要对非常长的序列进行比对,这是单靠人类的努力所不能解决的。在这种情况下,我们通过构造算法来进行高效的序列比对,有时还需要对最终结果进行调整,因为有些结果难以通过算法表达出来(特别是核苷酸序列)。序列比对的计算方法一般分为两类:全局性比对(global alignments)和局部比对(local alignments)。计算一个全局性的路线,是一个全局优化的形式,其强制按照整个长度的所有查询序列对齐。与此相反,局部比对只确定局部的相似而整个长序列却往往大相径庭。局部比对往往是可取的,但可能更难以计算的,因为还有来自确定其他相似区域的挑战。各种计算算法已应用于序列比对的问题,包括缓慢,但正规的像动态规划的优化方法和高效率,但不彻底的启发式算法,或大型数据库搜索设计的概率方法。双序列比对方法涉及寻找(局部)最优匹配片断或蛋白质(氨基酸)或DNA(核酸)全局比对。全局比对是指将参与比对的两条序列里面的所有字符进行比对。
全局比对主要被用来寻找关系密切的序列。由于这些序列也都很易通过本地比对方法找到,现在全局比对也有些被认为只是一种技巧。另外,全局比对在应用于分子进化时也有些问题(比如domain shuffling -见下),这也限制了这种方法的可用性。多序列比对是成对比对的延伸,是为了在一次比对里面处理多于两条的的序列。多序列比对方法试图比对一个指定序列集合里面的所有序列,这可以帮助确定这些序列的共同区段。进行多序列比对有几种方法,最常用的一种是Clustal程序集,它使用渐进多序列比对算法。Clustal在cladistics中被用来建立进化树,在PSI-BLAST和Hidden Markov model- (HMM-)中用来建立序列档案以在序列数据库中搜索更远的同源序列。多序列比对编程实现困难。被归为NP难题的一种。这一方法利用一个预先计算的哈西表作为短序列的索引。给定一个被查询序列,将根据索引来查询子序列,从而减少查询次数和时间。提供一些参数将使该方法更快或更准确。检索到与检索序列匹配的模式后,需要进一步使用更加准确和深入的算法。BLAST利用成对的本地检索和许多其他方法来提高Smith-Waterman算法的速度。
相关
- 扫墓扫墓,是中国人的传统习俗,闽南人称扫墓(sàu-bōng)、挂纸(kuì-tsuá)、探墓厝(thàm-bōng-tshù),如有携带三牲等供品,才称作“培墓”(puē-bōng)。客家人则呼为挂纸(koa-chṳ́)、福
- 棘红细胞棘红细胞(英语:Acanthocyte、spur cell,字源來自希臘文acantha,意為「刺」)是细胞膜有针状突起的异常红血球。棘红细胞外表粗糙而不规则,且具有许多星状的圆锯齿突起。可在无β脂
- 萨克逊人撒克逊人(英语:Saxons,德语:Sachsen),日耳曼蛮族之一,早年分布在德国境内的下萨克森一带,公元5世纪入侵不列颠岛。中文史学界以“撒克逊人”指登陆不列颠岛的部分,也就是盎格鲁撒克逊
- 髋部在脊椎动物解剖学中,髋关节(英语:hip,拉丁语:coxa)既可指代一个解剖学区域,亦可指代一个关节。髋关节区位于臀部外前侧,髂嵴(英语:iliac crest)内侧,覆盖了股骨大转子(英语:greater trocha
- 农业史农业史记录了人类驯化植物和动物、发展以及传播技术用来提高生产力的历史。农业起源于地球不同的地方,农业的起源中心包括旧大陆和新大陆的至少11个独立的区域。早在公元前2
- 竞争竞争是生物或物种之间的一种关系,在竞争中,生物或物种都会受到伤害。如果至少有一种资源(英语:Resource (biology))(例如食物、水或地盘),双方都要使用,而其供给又是有限的(英语:Limiti
- 叠层岩叠层石(英语:Stromatolite,或称层叠石,源自希腊文strōma与lithos)可定义为“从某一点或有限的表面开始增生,并聚集石化,形成逐渐增大的沉淀物生成构造”。自然界中有许多不同型态
- 北达科他北达科他州(英语:State of North Dakota),简称北达州,是美国中西部的一州。它是大草原里最北的一州,包含达科他地区的北半部。19世纪时,北达科塔被认为是美国旧西部的一部分。北达
- 所罗门·格伦布所罗门·沃尔夫·格伦布(英语:Solomon Wolf Golomb,1932年5月30日-2016年5月1日),美国数学家。在南加州大学任职工程师及电力工程教授一职。最出名的是他所写的数学游戏。最引人注
- 屠宰场屠房是屠宰动物的设施。据统计,平均每只动物的40-45%可供食用,10-15%会被弃置,剩余的40-45%会被制成副产品,例如:皮革、肥皂、蜡烛、明胶等。20世纪后期,美国屠房的设计很大程度受