序列比对

✍ dations ◷ 2024-07-05 13:49:03 #序列比对
序列比对指将两个或多个序列排列在一起,标明其相似之处。序列中可以插入间隔(通常用短横线“-”表示)。对应的相同或相似的符号(在核酸中是A, T(或U), C, G,在蛋白质中是氨基酸残基的单字母表示)排列在同一列上。这一方法常用于研究由共同祖先进化而来的序列,特别是如蛋白质序列或DNA序列等生物序列。在比对中,错配与突变相应,而空位与插入或缺失对应。序列比对还可用于语言进化或文本间相似性之类的研究。术语“序列比对”也指构建上述比对或在潜在的不相关序列的数据库中寻找significant alignments。对于很短或非常相似的序列,我们可以人工进行比对。然而,在很多问题中,我们需要对非常长的序列进行比对,这是单靠人类的努力所不能解决的。在这种情况下,我们通过构造算法来进行高效的序列比对,有时还需要对最终结果进行调整,因为有些结果难以通过算法表达出来(特别是核苷酸序列)。序列比对的计算方法一般分为两类:全局性比对(global alignments)和局部比对(local alignments)。计算一个全局性的路线,是一个全局优化的形式,其强制按照整个长度的所有查询序列对齐。与此相反,局部比对只确定局部的相似而整个长序列却往往大相径庭。局部比对往往是可取的,但可能更难以计算的,因为还有来自确定其他相似区域的挑战。各种计算算法已应用于序列比对的问题,包括缓慢,但正规的像动态规划的优化方法和高效率,但不彻底的启发式算法,或大型数据库搜索设计的概率方法。双序列比对方法涉及寻找(局部)最优匹配片断或蛋白质(氨基酸)或DNA(核酸)全局比对。全局比对是指将参与比对的两条序列里面的所有字符进行比对。 全局比对主要被用来寻找关系密切的序列。由于这些序列也都很易通过本地比对方法找到,现在全局比对也有些被认为只是一种技巧。另外,全局比对在应用于分子进化时也有些问题(比如domain shuffling -见下),这也限制了这种方法的可用性。多序列比对是成对比对的延伸,是为了在一次比对里面处理多于两条的的序列。多序列比对方法试图比对一个指定序列集合里面的所有序列,这可以帮助确定这些序列的共同区段。进行多序列比对有几种方法,最常用的一种是Clustal程序集,它使用渐进多序列比对算法。Clustal在cladistics中被用来建立进化树,在PSI-BLAST和Hidden Markov model- (HMM-)中用来建立序列档案以在序列数据库中搜索更远的同源序列。多序列比对编程实现困难。被归为NP难题的一种。这一方法利用一个预先计算的哈西表作为短序列的索引。给定一个被查询序列,将根据索引来查询子序列,从而减少查询次数和时间。提供一些参数将使该方法更快或更准确。检索到与检索序列匹配的模式后,需要进一步使用更加准确和深入的算法。BLAST利用成对的本地检索和许多其他方法来提高Smith-Waterman算法的速度。

相关

  • 呕血呕血(hematemesis)是指患者呕吐出血液的症状,血液的来源为上消化道(即屈氏韧带以上的消化道,包括食管、胃、十二指肠或胰胆等的出血,胃空肠吻合术后的空肠出血也属于上消化道)。呕
  • LOINC观测指标标识符逻辑命名与编码系统(Logical Observation Identifiers Names and Codes,LOINC) 是一部数据库和通用标准,用于标识检验医学及临床观测指标。LOINC数据库旨在促进临
  • 臭气气味是人类嗅觉系统对散布于空气中的某些特定分子的感应。人们把使人愉快的气味称为香味,把使人不快的气味称为臭味。人类大概能识别1000种不同的气味。气味分子进入鼻孔后,会
  • 刚果红刚果红是一种酸碱指示剂,当pH低于3.0时呈蓝色,高于5.2时呈红色。化学式为C32H22N6Na2O6S2;分子量696.66 g/mol。在生物学上可用刚果红筛选纤维素分解菌。原理如下:刚果红可与纤
  • 解离性失忆症分离性遗忘症或游离性遗忘症(英语:Dissociative amnesia),又称为心因性失忆症(英语:Psychogenic amnesia),是一种心理疾病。患者会遗忘个人记忆中的重要资料,通常不是由生理因素(如脑
  • 肠扭转肠扭转(volvulus)是指人体内环形消化道沿着本身及固定大小肠的肠系膜打结,最后会导致肠阻塞(英语:Bowel obstruction)。症状包括腹痛、腹胀、呕吐、便秘以及血便(英语:Blood in stoo
  • 汉藏语系汉藏语系(英语:Sino-Tibetan languages),或称泛喜马拉雅语系、藏缅语系,是语言学家按照谱系分类法划分的一组语群,但是划分的形式很多。这个语系至少包含汉语族和藏缅语族,共计约40
  • 问卷调查问卷调查是有目标对象的意见调查的其中一个方法,问卷调查的形式是由一连串写好的小问题组成,然后去访问,收集被访问者的意见、感受、反应及对知识的认识等。可以在很短的时间内
  • 诱发电位测试事件相关电位(英语:event-related potential,ERP)是一项基于脑电图技术的,在神经科学领域中有广泛应用的研究手段。在国际心理生理学研究学会(Society for Psychophysiological Re
  • 甲芬那酸甲芬那酸(英文:Mefenamic acid、或称为甲灭酸与扑湿痛、莫炎500毫克膜衣锭),是一种非类固醇消炎止痛药,用途是用来治疗包括经痛等的疼痛。这种药物在美国的上市商品名称为“Ponst