序列比对

✍ dations ◷ 2025-11-07 14:15:04 #序列比对
序列比对指将两个或多个序列排列在一起,标明其相似之处。序列中可以插入间隔(通常用短横线“-”表示)。对应的相同或相似的符号(在核酸中是A, T(或U), C, G,在蛋白质中是氨基酸残基的单字母表示)排列在同一列上。这一方法常用于研究由共同祖先进化而来的序列,特别是如蛋白质序列或DNA序列等生物序列。在比对中,错配与突变相应,而空位与插入或缺失对应。序列比对还可用于语言进化或文本间相似性之类的研究。术语“序列比对”也指构建上述比对或在潜在的不相关序列的数据库中寻找significant alignments。对于很短或非常相似的序列,我们可以人工进行比对。然而,在很多问题中,我们需要对非常长的序列进行比对,这是单靠人类的努力所不能解决的。在这种情况下,我们通过构造算法来进行高效的序列比对,有时还需要对最终结果进行调整,因为有些结果难以通过算法表达出来(特别是核苷酸序列)。序列比对的计算方法一般分为两类:全局性比对(global alignments)和局部比对(local alignments)。计算一个全局性的路线,是一个全局优化的形式,其强制按照整个长度的所有查询序列对齐。与此相反,局部比对只确定局部的相似而整个长序列却往往大相径庭。局部比对往往是可取的,但可能更难以计算的,因为还有来自确定其他相似区域的挑战。各种计算算法已应用于序列比对的问题,包括缓慢,但正规的像动态规划的优化方法和高效率,但不彻底的启发式算法,或大型数据库搜索设计的概率方法。双序列比对方法涉及寻找(局部)最优匹配片断或蛋白质(氨基酸)或DNA(核酸)全局比对。全局比对是指将参与比对的两条序列里面的所有字符进行比对。 全局比对主要被用来寻找关系密切的序列。由于这些序列也都很易通过本地比对方法找到,现在全局比对也有些被认为只是一种技巧。另外,全局比对在应用于分子进化时也有些问题(比如domain shuffling -见下),这也限制了这种方法的可用性。多序列比对是成对比对的延伸,是为了在一次比对里面处理多于两条的的序列。多序列比对方法试图比对一个指定序列集合里面的所有序列,这可以帮助确定这些序列的共同区段。进行多序列比对有几种方法,最常用的一种是Clustal程序集,它使用渐进多序列比对算法。Clustal在cladistics中被用来建立进化树,在PSI-BLAST和Hidden Markov model- (HMM-)中用来建立序列档案以在序列数据库中搜索更远的同源序列。多序列比对编程实现困难。被归为NP难题的一种。这一方法利用一个预先计算的哈西表作为短序列的索引。给定一个被查询序列,将根据索引来查询子序列,从而减少查询次数和时间。提供一些参数将使该方法更快或更准确。检索到与检索序列匹配的模式后,需要进一步使用更加准确和深入的算法。BLAST利用成对的本地检索和许多其他方法来提高Smith-Waterman算法的速度。

相关

  • 戊二醛戊二醛,结构式OHC(CH2)3CHO。无色透明有刺鼻气味的油状液体。不易溶于水,与热水互溶,易溶于乙醇和乙醚等有机溶剂。易聚合,必要时可加甲醇或脂肪醇聚乙二醇醚型非离子型表面活性
  • 毒瘾物质依赖(英语:Substance dependence)或称药物成瘾(drug addiction),指需要服用药物才能使日常生活表现正常的强迫行为。出现物质依赖状况后,若突然停止服用药物,可能出现药物戒断症
  • 英国皇家精神科医学院英国皇家精神科医学院 (Royal College of Psychiatrists) 是一所位于英国的精神科医学院。此医学院成立于一八四一年,位于英国伦敦。此医学院与其他不同专科的皇家医学院一样
  • object relations客体关系理论是一种精神分析理论,于1940至1950年代由英国心理学家罗纳德·费尔贝恩和梅兰妮·克莱因等人所开拓。不同于弗洛伊德理论,客体关系理论认为人并非寻求“驱力”的满
  • 体能锻炼体能锻炼,又称体能训练、体适能训练,泛指所有通过运动方式,来达到维持与发展适当体能、增进身体健康的身体活动。它的目标有许多种,包括:增强肌肉与循环系统、增进运动技能与身体
  • 低温物理学低温物理学 (Cryogenics),又称低温学,是物理学的分支,主要研究物质在低温状况下的物理性质的科学,有时也包括低温下获得的生成物和它的测量技术。而低温物理学中的低温定义为−1
  • Angewandte Chemie International Edition《应用化学》(德语:Angewandte Chemie)是一本涵盖化学所有方面的同行评审科学期刊,每周出版一期。2011年,该刊的影响因子为13.455,它是发表原创研究的化学期刊中影响因子最高的;201
  • 选择性剪接选择性剪接(英语:Alternative splicing;又称“可变剪接”)是基因表达的方式,在复杂的动物例如人类细胞是非常普遍的。真核细胞的基因序列中,包含了内含子(intron)与外显子(exon),两者交
  • 亚界在很长一段时间里,界(Kingdom)是生物科学分类法中最高的类别。一开始人只将生物分为动物和植物两界,微生物被发现后,也长时期被分入动物或植物界:好动的微生物被分入动物界,有色素
  • 卢齐欧·封塔纳卢齐欧·封塔纳(Lucio Fontana,1899年2月19日-1968年9月7日)阿根廷/意大利艺术家。生于阿根廷圣塔非省的罗萨里奥,其父为意大利人,其母为阿根廷人。早年在意大利度过。1905年,他返