首页 >
序列比对
✍ dations ◷ 2024-11-05 18:38:28 #序列比对
序列比对指将两个或多个序列排列在一起,标明其相似之处。序列中可以插入间隔(通常用短横线“-”表示)。对应的相同或相似的符号(在核酸中是A, T(或U), C, G,在蛋白质中是氨基酸残基的单字母表示)排列在同一列上。这一方法常用于研究由共同祖先进化而来的序列,特别是如蛋白质序列或DNA序列等生物序列。在比对中,错配与突变相应,而空位与插入或缺失对应。序列比对还可用于语言进化或文本间相似性之类的研究。术语“序列比对”也指构建上述比对或在潜在的不相关序列的数据库中寻找significant alignments。对于很短或非常相似的序列,我们可以人工进行比对。然而,在很多问题中,我们需要对非常长的序列进行比对,这是单靠人类的努力所不能解决的。在这种情况下,我们通过构造算法来进行高效的序列比对,有时还需要对最终结果进行调整,因为有些结果难以通过算法表达出来(特别是核苷酸序列)。序列比对的计算方法一般分为两类:全局性比对(global alignments)和局部比对(local alignments)。计算一个全局性的路线,是一个全局优化的形式,其强制按照整个长度的所有查询序列对齐。与此相反,局部比对只确定局部的相似而整个长序列却往往大相径庭。局部比对往往是可取的,但可能更难以计算的,因为还有来自确定其他相似区域的挑战。各种计算算法已应用于序列比对的问题,包括缓慢,但正规的像动态规划的优化方法和高效率,但不彻底的启发式算法,或大型数据库搜索设计的概率方法。双序列比对方法涉及寻找(局部)最优匹配片断或蛋白质(氨基酸)或DNA(核酸)全局比对。全局比对是指将参与比对的两条序列里面的所有字符进行比对。
全局比对主要被用来寻找关系密切的序列。由于这些序列也都很易通过本地比对方法找到,现在全局比对也有些被认为只是一种技巧。另外,全局比对在应用于分子进化时也有些问题(比如domain shuffling -见下),这也限制了这种方法的可用性。多序列比对是成对比对的延伸,是为了在一次比对里面处理多于两条的的序列。多序列比对方法试图比对一个指定序列集合里面的所有序列,这可以帮助确定这些序列的共同区段。进行多序列比对有几种方法,最常用的一种是Clustal程序集,它使用渐进多序列比对算法。Clustal在cladistics中被用来建立进化树,在PSI-BLAST和Hidden Markov model- (HMM-)中用来建立序列档案以在序列数据库中搜索更远的同源序列。多序列比对编程实现困难。被归为NP难题的一种。这一方法利用一个预先计算的哈西表作为短序列的索引。给定一个被查询序列,将根据索引来查询子序列,从而减少查询次数和时间。提供一些参数将使该方法更快或更准确。检索到与检索序列匹配的模式后,需要进一步使用更加准确和深入的算法。BLAST利用成对的本地检索和许多其他方法来提高Smith-Waterman算法的速度。
相关
- β受体阻断剂β受体阻断药(英语:Beta blockers),又称Beta受体阻断药、β受体阻断剂、β受体阻滞剂、β受体拮抗剂或β阻断药、乙型阻断剂,是一类用来治疗心律不齐、防止心脏病发作后的二次心
- 精神病学人体解剖学 - 人体生理学 组织学 - 胚胎学 人体寄生虫学 - 免疫学 病理学 - 病理生理学 细胞学 - 营养学 流行病学 - 药理学 - 毒理学精神病学目前是一门医学专科,内容是关
- 虚弱虚弱、无力、乏力(英语:weakness或asthenia)是一种症状的统称,有着多种不同的用法。该症状的成因多种多样,可细分为真性肌无力(true muscle weakness),或者体感肌无力。真性肌无力是
- 好氧菌好氧生物(英语:Aerobic organism,或 aerobe),又译为好气生物、耗氧生物、需氧生物,是能在有氧的环境中生存及生长的生物。好氧生物利用氧的化学反应来分解糖及脂肪,以获得能量。几
- 粒子加速器粒子加速器(英语:particle accelerator)是利用电场来推动带电粒子使之获得高能量。日常生活中常见的粒子加速器有用于电视的阴极射线管及X光管等设施。只有当被加速的粒子置于
- 低频低频(LF, Low frequency)是指频带由30 KHz到300 KHz的无线电电波。LF多用作卫星导航系统(差分全球定位系统)、国际广播以及AM广播等,另外亦可用作电波时计(授时)。一些无线电频率识
- 葡萄糖醛酸葡糖醛酸(Glucuronic acid),又称葡萄糖醛酸,是葡萄糖的 C-6 羟基被氧化为羧基形成的糖醛酸。D-葡糖醛酸一般不以游离的形式存在,因为该形式不稳定,而是以更稳定的呋喃环的 3,6-内
- 达尔文奖达尔文奖(Darwin Awards)是一个带半开玩笑性质的奖项,由美国斯坦福大学神经学研究实验室工作人员温蒂·诺斯卡特(Wendy Northcutt)创立,透过网友投票,以平均得分最高的事件为该年度
- 正四面体正四面体是由四个等边三角形组成的正多面体,是一种锥体,有4个顶点、6条边和4个正三角形面。将立方体的其中四个顶点两两相连,而这四个顶点任何两条都没有落在立方体同一条的边
- 托阿尔阶灭绝事件托阿尔阶灭绝事件(Toarcian extinction)又名普林斯巴赫阶-托阿尔阶灭绝事件(Pliensbachian-Toarcian extinction)、早侏罗纪灭绝事件(Early Jurassic extinction),发生于侏罗纪早期