首页 >
序列比对
✍ dations ◷ 2025-07-13 15:01:52 #序列比对
序列比对指将两个或多个序列排列在一起,标明其相似之处。序列中可以插入间隔(通常用短横线“-”表示)。对应的相同或相似的符号(在核酸中是A, T(或U), C, G,在蛋白质中是氨基酸残基的单字母表示)排列在同一列上。这一方法常用于研究由共同祖先进化而来的序列,特别是如蛋白质序列或DNA序列等生物序列。在比对中,错配与突变相应,而空位与插入或缺失对应。序列比对还可用于语言进化或文本间相似性之类的研究。术语“序列比对”也指构建上述比对或在潜在的不相关序列的数据库中寻找significant alignments。对于很短或非常相似的序列,我们可以人工进行比对。然而,在很多问题中,我们需要对非常长的序列进行比对,这是单靠人类的努力所不能解决的。在这种情况下,我们通过构造算法来进行高效的序列比对,有时还需要对最终结果进行调整,因为有些结果难以通过算法表达出来(特别是核苷酸序列)。序列比对的计算方法一般分为两类:全局性比对(global alignments)和局部比对(local alignments)。计算一个全局性的路线,是一个全局优化的形式,其强制按照整个长度的所有查询序列对齐。与此相反,局部比对只确定局部的相似而整个长序列却往往大相径庭。局部比对往往是可取的,但可能更难以计算的,因为还有来自确定其他相似区域的挑战。各种计算算法已应用于序列比对的问题,包括缓慢,但正规的像动态规划的优化方法和高效率,但不彻底的启发式算法,或大型数据库搜索设计的概率方法。双序列比对方法涉及寻找(局部)最优匹配片断或蛋白质(氨基酸)或DNA(核酸)全局比对。全局比对是指将参与比对的两条序列里面的所有字符进行比对。
全局比对主要被用来寻找关系密切的序列。由于这些序列也都很易通过本地比对方法找到,现在全局比对也有些被认为只是一种技巧。另外,全局比对在应用于分子进化时也有些问题(比如domain shuffling -见下),这也限制了这种方法的可用性。多序列比对是成对比对的延伸,是为了在一次比对里面处理多于两条的的序列。多序列比对方法试图比对一个指定序列集合里面的所有序列,这可以帮助确定这些序列的共同区段。进行多序列比对有几种方法,最常用的一种是Clustal程序集,它使用渐进多序列比对算法。Clustal在cladistics中被用来建立进化树,在PSI-BLAST和Hidden Markov model- (HMM-)中用来建立序列档案以在序列数据库中搜索更远的同源序列。多序列比对编程实现困难。被归为NP难题的一种。这一方法利用一个预先计算的哈西表作为短序列的索引。给定一个被查询序列,将根据索引来查询子序列,从而减少查询次数和时间。提供一些参数将使该方法更快或更准确。检索到与检索序列匹配的模式后,需要进一步使用更加准确和深入的算法。BLAST利用成对的本地检索和许多其他方法来提高Smith-Waterman算法的速度。
相关
- ε详见细菌分类表ε-变形菌要么厄氏杆菌是变形菌中的一类,与δ-变形菌关系最近。医学导航:病菌细菌(分类)gr+f/gr+a(t)/gr-p(c/gr-o药物(J1p、w、n、m、疫苗)
- NLM美国国家医学图书馆(英语:The United States National Library of Medicine,NLM),由美国联邦政府经营管理,是世界上最大的医学图书馆,并设有研究中心。其前身为成立于1836年的美国
- 内吞作用内吞作用(Endocytosis)是大分子物质(如糖类、脂质、蛋白质等)或其他细胞(如细菌)进入细胞内部的方式。它区别于小分子物质(如水、无机盐、氨基酸等)进入细胞的方式(自由扩散或主动
- 心内膜心内膜(英语:endocardium)是位于心腔中的最深层的组织。其细胞在胚胎学与生物学观点上与位于血管的内皮细胞极为相似。
- 萨兰达萨兰达(阿尔巴尼亚语:Sarandë)是位于阿尔巴尼亚南部的一个沿海城市,属夫罗勒州萨兰达区一部分。萨兰达是阿尔巴尼亚全国最重要的旅游城市之一,其附近的文化古城布特林特被列入世
- 科摩罗面积以下资讯是以2010年估计家用电源国家领袖国内生产总值(购买力平价) 以下资讯是以2016年估计国内生产总值(国际汇率) 以下资讯是以2016年估计人类发展指数 以下资讯是以2018
- 裸猿《裸猿》(The Naked Ape: A Zoologist's Study of the Human Animal;ISBN 0-385-33430-3)是英国科学家德斯蒙德·莫利斯(Desmond Morris)在1967年所写的一本探讨人类行为的科学著
- 次水杨酸铋次水杨酸铋为一种实验式为C7H5BiO4的胶状物,可通过水解水杨酸铋(Bi{C6H4(OH)CO2}3)得到。此物质实际结构未知,而化学式仅仅是近似推算出来的。近年来的研究显示,它是由水杨酸离子
- 斗兽场圆形剧场(拉丁语:amphitheatrum),又称圆形竞技场,是一种中间露天、四周则被圆形或椭圆形的建筑所环绕的表演场地。场地的中央为进行表演的地方,座位则沿四周排列。这种建筑起源于
- 非洲苏铁非州苏铁是非洲苏铁属(Encephalartos)的苏铁,原产于非洲,但却处于濒危。它们是最原始的裸子植物之一。非洲苏铁是由德国植物学家Johann Georg Christian Lehmann于1834年描述的