BLAST

✍ dations ◷ 2025-09-13 22:06:42 #BLAST
生物信息学中,BLAST(英语:Basic Local Alignment Search Tool)它是一个用来比对生物序列的一级结构(如不同蛋白质的氨基酸序列或不同基因的DNA序列)的算法。 已知一个包含若干序列的数据库,BLAST可以让研究者在其中寻找与其感兴趣的序列相同或类似的序列。 例如如果某种非人动物的一个以前未知的基因被发现,研究者一般会在人类基因组中做一个BLAST搜索来确认人类是否包含类似的基因(通过序列的相似性)。BLAST算法以及实现它的程序由美国国家生物技术信息中心(NCBI)的Eugene Myers(英语:Eugene Myers)、Stephen Altschul(英语:Stephen Altschul)、Warren Gish(英语:Warren Gish)、David J. Lipman(英语:David J. Lipman)及Webb Miller(英语:Webb Miller)博士开发的。研究者利用BLAST来解决的其他问题有:……等等。BLAST是一个被广泛使用于分析生物信息的程序,因为它可以兼顾我们在做搜索时的速度以及搜索结果的精确度。因为当我们所要搜索的目标数据库非常庞大的时候,速度就变成一项很需要考量的因素。在像BLAST和FASTA(英语:FASTA)这些快速算法被开发之前,我们是使用动态规划算法来作数据库的序列搜索,这真的非常的耗时。BLAST使用启发式搜索来找出相关的序列,在速度上比完全只使用动态规划大约快上50倍左右,不过它不像动态规划能够保证搜索到的序列(Database sequence)和所要找的序列(Query sequence)之间的相关性,BLAST的工作就是尽可能找出数据库中和所要查询的序列相关的信息而已,精确度稍微低一点。此外,BLAST比FASTA更快速,因为BLAST只对比较少出现或是较重要的一些关键字作更进一步的分析,而FASTA是考虑所有共同出现在所要搜索的序列和目标序列的字。从下面介绍的算法可以更进一步的了解。这边我们以蛋白质对蛋白质序列搜索所用的程序BLASTP之实做的步骤,来了解BLAST这程序的主要思想。由NCBI管理的BLAST网站允许任何人使用浏览器来在包含大部分新测序的物种的不停更新的DNA或蛋白质数据库中进行相似性搜索。这个服务器包含很多程序,最重要的几个如下:已知一个蛋白的氨基酸序列,通过这个程序可以找出在用户选择的蛋白质数据库中与其最相似的序列。已知一段已经转录的序列,借由这个程序对这段序列的6个ORF对上用户所选择的蛋白质数据库, 比对最相似的序列。其功用可以找出在基因体DNA(genomic DNA)上翻译出蛋白质的序列。已知一段蛋白质的氨基酸序列,借由这个程序可将此序列,对用户所选择的已转录序列数据库(包含这个数据库的6个ORF),比对出最相似的序列。已知一段已转录的序列,借由这个程序对这已知序列的6个ORF,对上用户所选择的已转录序列数据库(亦包含6个ORF),比对出最相似的序列,因为这个程序比对来源的6个ORF,与数据库的6个ORF,所以会执行相当久。这个程序用来搜索蛋白质的"远亲".首先,一个用户提交的蛋白质序列的所有"近亲"的列表被建立起来,然后这些蛋白质被结合在一个作为对序列的某种平均的"特征序列"当中。再然后用这个特征序列在蛋白质数据库中进行搜索,就会找出更大的一组蛋白质的列表。这个蛋白质列表有一个不同的特征序列,这个序列被用来迭代地运行上述过程。通过在搜索中包含相关的蛋白质,PSI-BLAST对于寻找已知蛋白进化上的"远亲"的灵敏度要比一般的blastp高很多。Focuses search around pattern (motif)

相关

  • 巨人症巨人症,亦称为巨大症,是一种疾病,表现为过度生长且其身高明显高于人类平均身高。该疾病是由于人类在童年时期生产过多的生长激素,使得患者身高异于常人,达2.13米(7.0英尺)至2.74米(9
  • 房室结房室结 (Atrioventricular node,A-V node)是正常情况下兴奋(神经电讯)由心房传至心室的唯一途径。它位于右心房科赫三角(triangle of Koch)的心内膜深面,其前端发出房室束。其主
  • 克利福德威廉·金顿·克利福德(William Kingdon Clifford,1845年5月4日-1879年3月3日),英国数学家兼科学哲学家。他和赫尔曼·格拉斯曼发明了现在称为几何代数的范畴。数学物理上的克利福
  • 突伦王朝突伦王朝(868年-905年),或译图伦王朝。是阿拔斯王朝时期在埃及、叙利亚的地方割据王朝。由突厥人艾哈迈德·伊本·突伦建立,王朝名称即来源于其名,亦译“伊本·突伦王朝”。之
  • 药事管理学药事管理学(英语:The discipline of pharmacy administration)是药学科学的一个分支学科,它的研究和教育集中于应用社会、行为、管理和法律科学,去研究药学实践中完成专业服务的
  • 量子声学量子声学(quantum acoustics)是研究微观量子力学效应不可忽略时声现象的一个声学分支,属于声学和凝聚体物理学的交叉领域。量子声学最初是在20世纪30年代研究声光效应时开始的
  • 迷幻音乐迷幻音乐 是一种音乐流派,有着丰富的流行音乐风格。上世纪60年代兴起了一种叫作迷幻文化的亚文化,人们沉迷于各类迷幻药物,如迷幻剂,迷幻蘑菇,麦司卡林和DMT等,以此引起幻觉,扭曲正
  • 忘怀洞“忘怀洞”(英语:Memory hole,又译:思旧穴)是出现在英国著名作家乔治·欧威尔所创作的小说《一九八四》(Nineteen Eighty-Four)中,真理部中温斯顿·史密斯使用的一种文件销毁工具。
  • 三氧化氮三氧化氮是一种不稳定的氮氧化物,化学式为NO3。它是五氧化二氮气相分解的中间产物:该物质存在时间很短,但吸收光谱能检测到它的存在。实验证明它具有顺磁性。它还与五氧化二氮
  • span class=chemf style=white-space:nowrap;Csub12/sub十二烷,或称十二碳烷,是化学式为CH3(CH2)10CH3的烷烃。十二烷是粘稠的油状液体,为石蜡油组分之一。它有355个同分异构体。高纯度的单体十二烷含量可以达到98%以上甚至更高。十