首页 >
序列比对
✍ dations ◷ 2025-09-19 02:30:25 #序列比对
序列比对指将两个或多个序列排列在一起,标明其相似之处。序列中可以插入间隔(通常用短横线“-”表示)。对应的相同或相似的符号(在核酸中是A, T(或U), C, G,在蛋白质中是氨基酸残基的单字母表示)排列在同一列上。这一方法常用于研究由共同祖先进化而来的序列,特别是如蛋白质序列或DNA序列等生物序列。在比对中,错配与突变相应,而空位与插入或缺失对应。序列比对还可用于语言进化或文本间相似性之类的研究。术语“序列比对”也指构建上述比对或在潜在的不相关序列的数据库中寻找significant alignments。对于很短或非常相似的序列,我们可以人工进行比对。然而,在很多问题中,我们需要对非常长的序列进行比对,这是单靠人类的努力所不能解决的。在这种情况下,我们通过构造算法来进行高效的序列比对,有时还需要对最终结果进行调整,因为有些结果难以通过算法表达出来(特别是核苷酸序列)。序列比对的计算方法一般分为两类:全局性比对(global alignments)和局部比对(local alignments)。计算一个全局性的路线,是一个全局优化的形式,其强制按照整个长度的所有查询序列对齐。与此相反,局部比对只确定局部的相似而整个长序列却往往大相径庭。局部比对往往是可取的,但可能更难以计算的,因为还有来自确定其他相似区域的挑战。各种计算算法已应用于序列比对的问题,包括缓慢,但正规的像动态规划的优化方法和高效率,但不彻底的启发式算法,或大型数据库搜索设计的概率方法。双序列比对方法涉及寻找(局部)最优匹配片断或蛋白质(氨基酸)或DNA(核酸)全局比对。全局比对是指将参与比对的两条序列里面的所有字符进行比对。
全局比对主要被用来寻找关系密切的序列。由于这些序列也都很易通过本地比对方法找到,现在全局比对也有些被认为只是一种技巧。另外,全局比对在应用于分子进化时也有些问题(比如domain shuffling -见下),这也限制了这种方法的可用性。多序列比对是成对比对的延伸,是为了在一次比对里面处理多于两条的的序列。多序列比对方法试图比对一个指定序列集合里面的所有序列,这可以帮助确定这些序列的共同区段。进行多序列比对有几种方法,最常用的一种是Clustal程序集,它使用渐进多序列比对算法。Clustal在cladistics中被用来建立进化树,在PSI-BLAST和Hidden Markov model- (HMM-)中用来建立序列档案以在序列数据库中搜索更远的同源序列。多序列比对编程实现困难。被归为NP难题的一种。这一方法利用一个预先计算的哈西表作为短序列的索引。给定一个被查询序列,将根据索引来查询子序列,从而减少查询次数和时间。提供一些参数将使该方法更快或更准确。检索到与检索序列匹配的模式后,需要进一步使用更加准确和深入的算法。BLAST利用成对的本地检索和许多其他方法来提高Smith-Waterman算法的速度。
相关
- 定鞭藻门Class PavlovophyceaeClass Prymnesiophyceae定鞭藻门(学名:Haptophyta)是一类真核生物,属于多貌生物定鞭隐藻类,曾被归类于囊泡藻界。1955年Parke等引入了"定鞭"(Haptonema)来描
- 赭曲霉毒素赭曲霉毒素(英语:Ochratoxin)是一类由部分曲霉菌和青霉菌分泌的霉菌毒素(mycotoxins),常见于已霉变的饲料、咖啡豆中。可毒害家禽的内脏,使其死亡。赭曲霉毒素包括了7种结构类似的
- 各国家或地区比例本列表根据美国中央情报局所出版之《世界概况》,列出世界各国家与地区中,成年人感染人类免疫缺乏病毒(HIV)的人口数量。表格数据都来源于《世界概况》。标注星号*意味世界概况无
- 过重超重的定义通常是比标准身形有更多的身体脂肪。肥胖是常见的疾病,特别是在粮食供应充足,且民众生活方式流于久坐不立的地方。美国成年人口中,高达64%被认为超重或肥胖,而且这一比
- 未知的南方大陆未知的南方大陆(拉丁语:Terra Australis Incognita)是15世纪至18世纪时,于欧洲地图上出现的假想大陆。又称为“麦哲伦洲”(拉丁语:Magallanica / Magellanica)。明代《坤舆万国全图
- 让·布里丹让·布里丹(Jean Buridan,拉丁文写法为Joannes Buridanus;1292年-1363年),法国哲学家,经院哲学博士,欧洲宗教怀疑主义倡导者。在西方1340年,再造了冲力说理论。思想实验布里丹之驴就
- 性特征第二性征是指动物在性趋于成熟时身体上出现的变化。男性的睾丸酮直接导致阴茎的成长。睾丸酮亦使肌肉的大小和质量增加,喉结变大,声音变得沙哑低沉。骨架变得宽大,身体脂肪量减
- 萤光荧光(fluorescence)是一种光致冷发光现象。当某种常温物质经某种波长的入射光(通常是紫外线或X射线)照射,吸收光能后进入激发态,并且立即退激发并发出出射光(通常波长比入射光的的
- 机器机器是一件利用能量达到一特定目的的工具、装置或者设备,一般用来变换或传递能量,物料和信息,执行机械运动。机器的动力来源会是机械能、热能(热机)、电能(电机)、磁能或是化学能等
- 动作电位动作电位(英文:action potential),指的是静止膜电位状态的细胞膜受到适当刺激而产生的,短暂而有特殊波形的跨膜电位搏动。细胞产生动作电位的能力被称为兴奋性,有这种能力的细胞如