首页 >
序列比对
✍ dations ◷ 2025-08-04 08:18:43 #序列比对
序列比对指将两个或多个序列排列在一起,标明其相似之处。序列中可以插入间隔(通常用短横线“-”表示)。对应的相同或相似的符号(在核酸中是A, T(或U), C, G,在蛋白质中是氨基酸残基的单字母表示)排列在同一列上。这一方法常用于研究由共同祖先进化而来的序列,特别是如蛋白质序列或DNA序列等生物序列。在比对中,错配与突变相应,而空位与插入或缺失对应。序列比对还可用于语言进化或文本间相似性之类的研究。术语“序列比对”也指构建上述比对或在潜在的不相关序列的数据库中寻找significant alignments。对于很短或非常相似的序列,我们可以人工进行比对。然而,在很多问题中,我们需要对非常长的序列进行比对,这是单靠人类的努力所不能解决的。在这种情况下,我们通过构造算法来进行高效的序列比对,有时还需要对最终结果进行调整,因为有些结果难以通过算法表达出来(特别是核苷酸序列)。序列比对的计算方法一般分为两类:全局性比对(global alignments)和局部比对(local alignments)。计算一个全局性的路线,是一个全局优化的形式,其强制按照整个长度的所有查询序列对齐。与此相反,局部比对只确定局部的相似而整个长序列却往往大相径庭。局部比对往往是可取的,但可能更难以计算的,因为还有来自确定其他相似区域的挑战。各种计算算法已应用于序列比对的问题,包括缓慢,但正规的像动态规划的优化方法和高效率,但不彻底的启发式算法,或大型数据库搜索设计的概率方法。双序列比对方法涉及寻找(局部)最优匹配片断或蛋白质(氨基酸)或DNA(核酸)全局比对。全局比对是指将参与比对的两条序列里面的所有字符进行比对。
全局比对主要被用来寻找关系密切的序列。由于这些序列也都很易通过本地比对方法找到,现在全局比对也有些被认为只是一种技巧。另外,全局比对在应用于分子进化时也有些问题(比如domain shuffling -见下),这也限制了这种方法的可用性。多序列比对是成对比对的延伸,是为了在一次比对里面处理多于两条的的序列。多序列比对方法试图比对一个指定序列集合里面的所有序列,这可以帮助确定这些序列的共同区段。进行多序列比对有几种方法,最常用的一种是Clustal程序集,它使用渐进多序列比对算法。Clustal在cladistics中被用来建立进化树,在PSI-BLAST和Hidden Markov model- (HMM-)中用来建立序列档案以在序列数据库中搜索更远的同源序列。多序列比对编程实现困难。被归为NP难题的一种。这一方法利用一个预先计算的哈西表作为短序列的索引。给定一个被查询序列,将根据索引来查询子序列,从而减少查询次数和时间。提供一些参数将使该方法更快或更准确。检索到与检索序列匹配的模式后,需要进一步使用更加准确和深入的算法。BLAST利用成对的本地检索和许多其他方法来提高Smith-Waterman算法的速度。
相关
- 口吃口吃(俗称“结巴”、“磕巴”、“漏口”,在台湾,国语念作“kǒu jí”;中国大陆普通话与新马两地则念作“kǒu chī”;古汉语中叫謇。),是一种言语障碍,表现为言语频繁地与正常流利
- 红细胞生成红细胞生成(英语:erythropoiesis)是指红细胞的生成过程。缺氧时,会促进肾脏产生促红细胞生成素。这种激素可以刺激红细胞前体细胞的增殖分化,并最终在造血组织中发育成为成熟的红
- 生物大分子生物大分子指的是作为生物体内主要活性成分的各种分子量达到上万或更多的有机分子。常见的生物大分子包括蛋白质、核酸 (DNA、RNA等)、糖类。这只是一个概念性定义,与生物大
- 雅司病热带肉芽肿(Yaws)也称为雅司病,是发生在皮肤、骨骼及关节的热带感染病,病原是螺旋体门的细菌梅毒螺旋体(英语:Treponema pallidum)。热带肉芽肿一开始会在皮肤产生圆形的硬肿,直径约
- 阿瓦尔人阿瓦尔人在古代是欧亚大陆的一个游牧民族的名称。他们约在6世纪时迁徙到欧洲中部和东部。到9世纪初以前,一直统治潘诺尼亚平原。因与高加索地区的阿瓦尔人进行区别也称潘诺尼
- 英国历史联合王国(英语:United Kingdom,缩写:UK,全名:大不列颠与北爱尔兰联合王国)历史,其发展以英格兰王国为核心,逐次并入威尔士公国、苏格兰王国和爱尔兰王国。目前联合王国的领土包含英格
- 中国工程院中国工程院院徽中国科学院 中国社会科学院中国工程院,简称工程院、中工院,是中华人民共和国工程科学技术界的最高荣誉性、咨询性学术机构,为正部级国务院直属事业单位。中国工
- 迎宾馆坐标:35°40′48″N 139°43′43″E / 35.68000°N 139.72861°E / 35.68000; 139.72861迎宾馆赤坂离宫(日语:迎賓館赤坂離宮/げいひんかんあかさかりきゅう Geihinkan Akasaka
- 入球小动脉入球小动脉(afferent arterioles)是人体的小动脉,是肾动脉的分支,供应肾脏中肾元的养份,进入鲍氏囊后再分支而形成一团微血管网,即为肾丝球,肾丝球会将血液过滤生成原尿。肾小体
- 卢西亚诺·贝里奥卢西亚诺·贝里奥(意大利语:Luciano Berio,1925年10月24日-2003年5月27日),意大利作曲家。曾与马代尔纳共建电子音乐实验室。后来应米约之邀赴美国加州任教。返欧后在巴黎等地从事