比对

✍ dations ◷ 2025-07-18 00:40:30 #比对
序列比对指将两个或多个序列排列在一起,标明其相似之处。序列中可以插入间隔(通常用短横线“-”表示)。对应的相同或相似的符号(在核酸中是A, T(或U), C, G,在蛋白质中是氨基酸残基的单字母表示)排列在同一列上。这一方法常用于研究由共同祖先进化而来的序列,特别是如蛋白质序列或DNA序列等生物序列。在比对中,错配与突变相应,而空位与插入或缺失对应。序列比对还可用于语言进化或文本间相似性之类的研究。术语“序列比对”也指构建上述比对或在潜在的不相关序列的数据库中寻找significant alignments。对于很短或非常相似的序列,我们可以人工进行比对。然而,在很多问题中,我们需要对非常长的序列进行比对,这是单靠人类的努力所不能解决的。在这种情况下,我们通过构造算法来进行高效的序列比对,有时还需要对最终结果进行调整,因为有些结果难以通过算法表达出来(特别是核苷酸序列)。序列比对的计算方法一般分为两类:全局性比对(global alignments)和局部比对(local alignments)。计算一个全局性的路线,是一个全局优化的形式,其强制按照整个长度的所有查询序列对齐。与此相反,局部比对只确定局部的相似而整个长序列却往往大相径庭。局部比对往往是可取的,但可能更难以计算的,因为还有来自确定其他相似区域的挑战。各种计算算法已应用于序列比对的问题,包括缓慢,但正规的像动态规划的优化方法和高效率,但不彻底的启发式算法,或大型数据库搜索设计的概率方法。双序列比对方法涉及寻找(局部)最优匹配片断或蛋白质(氨基酸)或DNA(核酸)全局比对。全局比对是指将参与比对的两条序列里面的所有字符进行比对。 全局比对主要被用来寻找关系密切的序列。由于这些序列也都很易通过本地比对方法找到,现在全局比对也有些被认为只是一种技巧。另外,全局比对在应用于分子进化时也有些问题(比如domain shuffling -见下),这也限制了这种方法的可用性。多序列比对是成对比对的延伸,是为了在一次比对里面处理多于两条的的序列。多序列比对方法试图比对一个指定序列集合里面的所有序列,这可以帮助确定这些序列的共同区段。进行多序列比对有几种方法,最常用的一种是Clustal程序集,它使用渐进多序列比对算法。Clustal在cladistics中被用来建立进化树,在PSI-BLAST和Hidden Markov model- (HMM-)中用来建立序列档案以在序列数据库中搜索更远的同源序列。多序列比对编程实现困难。被归为NP难题的一种。这一方法利用一个预先计算的哈西表作为短序列的索引。给定一个被查询序列,将根据索引来查询子序列,从而减少查询次数和时间。提供一些参数将使该方法更快或更准确。检索到与检索序列匹配的模式后,需要进一步使用更加准确和深入的算法。BLAST利用成对的本地检索和许多其他方法来提高Smith-Waterman算法的速度。

相关

  • 盘嵴亚界古虫界(学名:Excavata)是单细胞生物的一个主要超级群组,属于真核生物域,由汤玛斯·卡弗利尔-史密斯于2002年引入的一个新的支序亲缘学分类。古虫界包含了许多自由生存或共生的原
  • 食物链食物链是表示物种之间的食物组成关系,在生态学中能代表物质和能量在物种之间转移流动的情况。虽然生态系统中的生物种类众多,亦于生态系统分别扮演着不同的角色,但根据它们在能
  • 腓骨腓骨(拉丁语:Fibula)是人和脊椎动物(四足类)小腿上的两块长骨之一,位于小腿外侧,较细;某些动物(如蛙和蟾蜍等)腓骨与其内侧的胫骨融合成胫腓骨。腓骨比胫骨细;腓骨上端称作腓骨小头,可以
  • 南荷兰省南荷兰(荷兰语:  Zuid-Holland 帮助·信息)是荷兰的一个省,省会城市是海牙。南荷兰省位于该国的西部,西临北海,与之毗邻的省份有北荷兰省、西兰省、乌特勒支省、北布拉班特省和
  • 高加索诸语言高加索语言泛指来源于高加索地区的语言,共同结合为高加索语系,其归属及分类均存争议。一般来说,高加索语言分为2或3种语系或语族,包括西北高加索语系、东北高加索语系和南高加索
  • 回复青春回复青春是一种假设中通过逆转老化的过程,使老人变回年轻人一样。在历史上很多人都希望可以回复青春。回复青春也就是要改变了人的年纪越老,健康会转坏的自然现象。依目前认知
  • 多潘立酮多潘立酮(Domperidone),商品名为吗丁啉(Motilium),是一种口服和静脉注射用的抗多巴胺类药物,一般用以抑制恶心和呕吐,有时也用于促进乳汁分泌。多潘立酮的抗催吐作用主要是由于其对
  • 碳酸盐碳酸盐是指含CO32-的盐。碳酸盐遇酸能发生复分解反应产生CO2(碱式碳酸盐还能产生水),实验室通常利用这一原理检验某固体含碳酸盐及制取CO2。碳酸盐通常不如其他常见盐(如硫酸盐,
  • Da原子质量单位(Atomic mass unit,amu),现称统一原子质量单位(Unified atomic mass unit,u)或道尔顿(dalton,Da),是用来衡量原子质量的单位,定义为静止未键结且处于基态碳12原子质量的1/12
  • 丽纹双门齿兽双门齿兽属(学名:Diprotodon),又名古草食有袋属,是最大的有袋类。它于160万年前出现,并于4万年前的更新世消失。双门齿兽的化石在澳洲很多地方都有发现,当中包括完整的骨骼及头颅骨