首页 >
序列比对
✍ dations ◷ 2025-04-04 19:20:05 #序列比对
序列比对指将两个或多个序列排列在一起,标明其相似之处。序列中可以插入间隔(通常用短横线“-”表示)。对应的相同或相似的符号(在核酸中是A, T(或U), C, G,在蛋白质中是氨基酸残基的单字母表示)排列在同一列上。这一方法常用于研究由共同祖先进化而来的序列,特别是如蛋白质序列或DNA序列等生物序列。在比对中,错配与突变相应,而空位与插入或缺失对应。序列比对还可用于语言进化或文本间相似性之类的研究。术语“序列比对”也指构建上述比对或在潜在的不相关序列的数据库中寻找significant alignments。对于很短或非常相似的序列,我们可以人工进行比对。然而,在很多问题中,我们需要对非常长的序列进行比对,这是单靠人类的努力所不能解决的。在这种情况下,我们通过构造算法来进行高效的序列比对,有时还需要对最终结果进行调整,因为有些结果难以通过算法表达出来(特别是核苷酸序列)。序列比对的计算方法一般分为两类:全局性比对(global alignments)和局部比对(local alignments)。计算一个全局性的路线,是一个全局优化的形式,其强制按照整个长度的所有查询序列对齐。与此相反,局部比对只确定局部的相似而整个长序列却往往大相径庭。局部比对往往是可取的,但可能更难以计算的,因为还有来自确定其他相似区域的挑战。各种计算算法已应用于序列比对的问题,包括缓慢,但正规的像动态规划的优化方法和高效率,但不彻底的启发式算法,或大型数据库搜索设计的概率方法。双序列比对方法涉及寻找(局部)最优匹配片断或蛋白质(氨基酸)或DNA(核酸)全局比对。全局比对是指将参与比对的两条序列里面的所有字符进行比对。
全局比对主要被用来寻找关系密切的序列。由于这些序列也都很易通过本地比对方法找到,现在全局比对也有些被认为只是一种技巧。另外,全局比对在应用于分子进化时也有些问题(比如domain shuffling -见下),这也限制了这种方法的可用性。多序列比对是成对比对的延伸,是为了在一次比对里面处理多于两条的的序列。多序列比对方法试图比对一个指定序列集合里面的所有序列,这可以帮助确定这些序列的共同区段。进行多序列比对有几种方法,最常用的一种是Clustal程序集,它使用渐进多序列比对算法。Clustal在cladistics中被用来建立进化树,在PSI-BLAST和Hidden Markov model- (HMM-)中用来建立序列档案以在序列数据库中搜索更远的同源序列。多序列比对编程实现困难。被归为NP难题的一种。这一方法利用一个预先计算的哈西表作为短序列的索引。给定一个被查询序列,将根据索引来查询子序列,从而减少查询次数和时间。提供一些参数将使该方法更快或更准确。检索到与检索序列匹配的模式后,需要进一步使用更加准确和深入的算法。BLAST利用成对的本地检索和许多其他方法来提高Smith-Waterman算法的速度。
相关
- 查理斯·尚柏朗查理斯·尚柏朗(Charles Chamberland,1851年3月12日-1908年5月2日)是一位法国微生物学家。1884年,他发明了现在称作尚柏朗滤器的过滤设备。 该滤器有比细菌直径还小的孔洞,这样便
- 人类嗜T淋巴球病毒一型Human T-lymphotropic virus人类嗜T淋巴球病毒一型(Human T-lymphotropic virus 1, HTLV-1)是一种感染后可导致血癌或其他转移癌的病毒,由输血、针头、性行为、母子传染。该
- 联合国系统联合国系统是对联合国及其关联机构的总称,其中部分机构在联合国成立前就已存在。包括:联合国主要基于6个主要组成部分:除了独立的组织外,联合国的各机构还经常下设机构负责专门
- 失明失明,俗称盲或者瞎,是指由生理或心理原因引发的人体视知觉缺陷。目前对于视觉丧失的程度有多种度量标准,而失明也有许多种定义。完全失明是指人体彻底丧失对于形状和可见光的感
- 牙釉质牙釉质,也称为珐琅质,是牙齿最外层的组织,为哺乳动物体内最坚硬的组织,成熟的牙釉质96-99%由无机物(主要为钙和磷)组成,其他为水及有机物。牙釉质内部并不具神经与血管。它的功用除
- 常识常识(英语:Common knowledge)、普遍知识(General knowledge)或基本知识(Essential knowledge)是指普通社会上智力正常的人皆有或普遍拥有的知识。
- 正义正义或公平正义(英语:justice;德语:Gerechtigkeit)是关于适当安排社会内的东西和人民的概念,此概念是哲学、法学和神学历史上不断思考和辩论的话题。公平正义的研讨可大略分为两类
- 渐br /新br /世渐新世(Oligocene)是地质时代中古近纪的最后一个主要分期,大约开始于3400万年前,终于2300万年前,介于始新世(Eocene)与新近纪的中新世(Miocene)之间。比起其他比较古老的地质时期,用岩
- 得特宫得特宫(意大利语:Palazzo del Te)是位于意大利曼托瓦的一座宫殿建筑。得特宫修建于1524年至1534年期间,由拉斐尔的门徒朱利奥·罗马诺设计。1630年时,宫殿曾遭到洗劫。现在得特宫
- 二硫硫有着大量的同素异形体,其数量只是仅次于碳。 硫在自然界中最常见的形式是黄色的正交晶系α-硫,其中包含S8的皱褶环。二硫为硫的双原子分子。在720°C,硫主要以二硫存在。在53