BLAST (生物信息学)

✍ dations ◷ 2025-12-07 17:44:05 #生物信息学算法,计算系统发生学,生物信息学软件,实验室软件,公有领域软件

生物信息学中,BLAST(英语:Basic Local Alignment Search Tool)它是一个用来比对生物序列的一级结构(如不同蛋白质的氨酸序列或不同基因的DNA序列)的算法。 已知一个包含若干序列的数据库,BLAST可以让研究者在其中寻找与其感兴趣的序列相同或类似的序列。 例如如果某种非人动物的一个以前未知的基因被发现,研究者一般会在人类基因组中做一个BLAST搜索来确认人类是否包含类似的基因(通过序列的相似性)。BLAST算法以及实现它的程序由美国国家生物技术信息中心(NCBI)的Eugene Myers(英语:Eugene Myers)、Stephen Altschul(英语:Stephen Altschul)、Warren Gish(英语:Warren Gish)、David J. Lipman(英语:David J. Lipman)及Webb Miller(英语:Webb Miller)博士开发的。

研究者利用BLAST来解决的其他问题有:

……等等。

BLAST是一个被广泛使用于分析生物信息的程序,因为它可以兼顾我们在做搜索时的速度以及搜索结果的精确度。因为当我们所要搜索的目标数据库非常庞大的时候,速度就变成一项很需要考量的因素。在像BLAST和FASTA(英语:FASTA)这些快速算法被开发之前,我们是使用动态规划算法来作数据库的序列搜索,这真的非常的耗时。BLAST使用启发式搜索来找出相关的序列,在速度上比完全只使用动态规划大约快上50倍左右,不过它不像动态规划能够保证搜索到的序列(Database sequence)和所要找的序列(Query sequence)之间的相关性,BLAST的工作就是尽可能找出数据库中和所要查询的序列相关的信息而已,精确度稍微低一点。此外,BLAST比FASTA更快速,因为BLAST只对比较少出现或是较重要的一些关键字作更进一步的分析,而FASTA是考虑所有共同出现在所要搜索的序列和目标序列的字。从下面介绍的算法可以更进一步的了解。

这边我们以蛋白质对蛋白质序列搜索所用的程序BLASTP之实做的步骤,来了解BLAST这程序的主要思想。

由NCBI管理的BLAST网站允许任何人使用浏览器来在包含大部分新测序的物种的不停更新的DNA或蛋白质数据库中进行相似性搜索。这个服务器包含很多程序,最重要的几个如下:

已知一个蛋白的氨酸序列,通过这个程序可以找出在用户选择的蛋白质数据库中与其最相似的序列。

已知一段已经转录的序列,借由这个程序对这段序列的6个ORF对上用户所选择的蛋白质数据库,比对最相似的序列。其功用可以找出在基因体DNA(genomic DNA)上翻译出蛋白质的序列。

已知一段蛋白质的氨酸序列,借由这个程序可将此序列,对用户所选择的已转录序列数据库(包含这个数据库的6个ORF),比对出最相似的序列。

已知一段已转录的序列,借由这个程序对这已知序列的6个ORF,对上用户所选择的已转录序列数据库(亦包含6个ORF),比对出最相似的序列,因为这个程序比对来源的6个ORF,与数据库的6个ORF,所以会执行相当久。

这个程序用来搜索蛋白质的"远亲".首先,一个用户提交的蛋白质序列的所有"近亲"的列表被建立起来,然后这些蛋白质被结合在一个作为对序列的某种平均的"特征序列"当中。再然后用这个特征序列在蛋白质数据库中进行搜索,就会找出更大的一组蛋白质的列表。这个蛋白质列表有一个不同的特征序列,这个序列被用来迭代地运行上述过程。

通过在搜索中包含相关的蛋白质,PSI-BLAST对于寻找已知蛋白进化上的"远亲"的灵敏度要比一般的blastp高很多。

Focuses search around pattern (motif)

相关

  • 满文满文(满语:ᠮᠠᠨᠵᡠᡥᡝᡵᡤᡝᠨ,穆麟德:Manju hergen,太清:Manju hergen,大词典:Manzhu hergen)是满语的文字,1600年前后由蒙古文改造而成,是全音素文字。由上至下竖写,各列由左至右
  • 文理学院多伦多大学文理学院是多伦多大学的一个学术学院,它提供大部分文科及理科的教授项目及研究机构。因拥有近三万名本科生和四千名研究生,文理学院是多伦多大学圣乔治校区内最大的
  • HBP12E6O, 3QVE· regulation of transcription, DNA-dependent · cell cycle arrest · Wnt receptor signaling pathwayHMG盒转录因子1(英语:HMG-box transcription factor 1
  • 拳击袋鼠拳击袋鼠是澳大利亚的国家化身,常见于流行文化,尤其在澳大利亚运动员参与板球、网球和澳式足球等体育竞赛,近年来亦伴随澳大利亚国家足球队屡次出现在世界杯足球赛以及亚洲杯足
  • enzyme酶(英语:Enzyme(/ˈɛnzaɪm/ )),是一类大分子生物催化剂。酶能加快化学反应的速度(即具有催化作用)。由酶催化的反应中,反应物称为底物,生成的物质称为产物。几乎所有细胞内的代谢过
  • 温州话温州话(,Wenzhounese),为中国东南沿海城市温州市住民所讲的一种南部吴语。无论是发音、词汇、还是句法上都与现代标准汉语有着较大的差别。甚至,温州吴语在这些方面与北部吴语以
  • 抗霉药剂抗真菌药(英语:antifungal drugs),泛指一些能抑制或灭杀真菌的药物。抗真菌药中效果显著的主要由抗生素和合成药构成。常用的抗真菌药根据作用部位大致分为抗浅表真菌感染药和抗
  • 哥斯达黎加总统哥斯达黎加总统是哥斯达黎加的国家元首和政府首脑,为人民直选,任期四年,不能连任。总统任命和主持部长会议。政府还设有两名副总统。哥斯达黎加总统不是武装部队总司令,这点与其
  • 曹靖华曹靖华(1897年8月11日-1987年9月8日),原名曹联亚,河南卢氏人,中国翻译家、散文家、教育家,北京大学教授。曹靖华是河南卢氏县五里川路沟口村人。1919年在开封省立第二中学求学时,投
  • 托马斯·萨金特托马斯·约翰·“汤姆”·萨金特(英语:Thomas John "Tom" Sargent,1943年7月19日-),美国经济学家,擅长于宏观经济学、货币经济学、时间序列等领域。他和小罗伯特·卢卡斯、尼尔·华