首页 >
BLAST
✍ dations ◷ 2025-01-23 04:56:24 #BLAST
生物信息学中,BLAST(英语:Basic Local Alignment Search Tool)它是一个用来比对生物序列的一级结构(如不同蛋白质的氨基酸序列或不同基因的DNA序列)的算法。 已知一个包含若干序列的数据库,BLAST可以让研究者在其中寻找与其感兴趣的序列相同或类似的序列。 例如如果某种非人动物的一个以前未知的基因被发现,研究者一般会在人类基因组中做一个BLAST搜索来确认人类是否包含类似的基因(通过序列的相似性)。BLAST算法以及实现它的程序由美国国家生物技术信息中心(NCBI)的Eugene Myers(英语:Eugene Myers)、Stephen Altschul(英语:Stephen Altschul)、Warren Gish(英语:Warren Gish)、David J. Lipman(英语:David J. Lipman)及Webb Miller(英语:Webb Miller)博士开发的。研究者利用BLAST来解决的其他问题有:……等等。BLAST是一个被广泛使用于分析生物信息的程序,因为它可以兼顾我们在做搜索时的速度以及搜索结果的精确度。因为当我们所要搜索的目标数据库非常庞大的时候,速度就变成一项很需要考量的因素。在像BLAST和FASTA(英语:FASTA)这些快速算法被开发之前,我们是使用动态规划算法来作数据库的序列搜索,这真的非常的耗时。BLAST使用启发式搜索来找出相关的序列,在速度上比完全只使用动态规划大约快上50倍左右,不过它不像动态规划能够保证搜索到的序列(Database sequence)和所要找的序列(Query sequence)之间的相关性,BLAST的工作就是尽可能找出数据库中和所要查询的序列相关的信息而已,精确度稍微低一点。此外,BLAST比FASTA更快速,因为BLAST只对比较少出现或是较重要的一些关键字作更进一步的分析,而FASTA是考虑所有共同出现在所要搜索的序列和目标序列的字。从下面介绍的算法可以更进一步的了解。这边我们以蛋白质对蛋白质序列搜索所用的程序BLASTP之实做的步骤,来了解BLAST这程序的主要思想。由NCBI管理的BLAST网站允许任何人使用浏览器来在包含大部分新测序的物种的不停更新的DNA或蛋白质数据库中进行相似性搜索。这个服务器包含很多程序,最重要的几个如下:已知一个蛋白的氨基酸序列,通过这个程序可以找出在用户选择的蛋白质数据库中与其最相似的序列。已知一段已经转录的序列,借由这个程序对这段序列的6个ORF对上用户所选择的蛋白质数据库,
比对最相似的序列。其功用可以找出在基因体DNA(genomic DNA)上翻译出蛋白质的序列。已知一段蛋白质的氨基酸序列,借由这个程序可将此序列,对用户所选择的已转录序列数据库(包含这个数据库的6个ORF),比对出最相似的序列。已知一段已转录的序列,借由这个程序对这已知序列的6个ORF,对上用户所选择的已转录序列数据库(亦包含6个ORF),比对出最相似的序列,因为这个程序比对来源的6个ORF,与数据库的6个ORF,所以会执行相当久。这个程序用来搜索蛋白质的"远亲".首先,一个用户提交的蛋白质序列的所有"近亲"的列表被建立起来,然后这些蛋白质被结合在一个作为对序列的某种平均的"特征序列"当中。再然后用这个特征序列在蛋白质数据库中进行搜索,就会找出更大的一组蛋白质的列表。这个蛋白质列表有一个不同的特征序列,这个序列被用来迭代地运行上述过程。通过在搜索中包含相关的蛋白质,PSI-BLAST对于寻找已知蛋白进化上的"远亲"的灵敏度要比一般的blastp高很多。Focuses search around pattern (motif)
相关
- 气胸气胸(英语:pneumothorax),又称肺膜穿、爆肺,系指空气不正常地积聚在肺部与胸壁(英语:chest wall)之间的胸膜腔,典型症状有突发性单边胸部刺痛发作和呼吸困难,少部分案例中,受损的组织区
- 嗜二氧化碳菌嗜二氧化碳菌(英语:Capnophiles)是一类适合在高浓度二氧化碳下生存的微生物。“嗜二氧化碳菌”只是一个对这类生物进行大致描述的术语,对其所描述生物的分类和进化关系的建立贡
- 腹腔积液腹水(ascites、hydroperitoneum)是指腹腔内有液体积聚,超过正常量的症状。腹水最常见的病因是肝硬化和其他严重的肝脏疾病,但它的出现也可以是其他重大疾病的征象,如肝癌末期。腹
- 委内瑞拉委内瑞拉玻利瓦尔共和国(西班牙语:República Bolivariana de Venezuela),通称委内瑞拉,是一个位于南美洲北部的热带国家,为南美洲国家联盟的成员国。首都为加拉加斯。西与哥伦比
- 气传统宗教仪式:神明秘密社会:气是中国哲学、道教和中医学中常见的概念。中国历史春秋战国时代的思想家,将气的概念抽象化,成为天地一切事物组成的基本元素,有着像气体般的流动特性
- 托马斯·亨特·摩尔根托马斯·亨特·摩尔根(英语:Thomas Hunt Morgan,1866年9月25日-1945年12月4日),美国遗传学家、现代遗传学之父,约翰霍普金斯大学博士。他在对黑腹果蝇遗传突变的研究中,首次确认了染
- 交通心理学异常心理学 行为遗传学 生物心理学 心理药物学 认知心理学 比较心理学 跨文化心理学 文化心理学 差异心理学(英语:Differential psychology) 发展心理学 演化心理学 实验心理学
- 低密度脂蛋白受体1AJJ, 1D2J, 1F5Y, 1F8Z, 1HJ7, 1HZ8, 1I0U, 1IJQ, 1LDL, 1LDR, 1LRX, 1N7D, 1XFE, 2FCW, 2KRI, 2LGP, 2M7P, 2MG9, 2W2M, 2W2N, 2W2O, 2W2P, 2W2Q, 3BPS, 3GCW, 3GCX, 3M0C
- 延胡索酸酶结构 / ECOD延胡索酸酶(或称延胡索酸水合酶)是一种催化延胡索酸(即反丁烯二酸)以及苹果酸之间水合/脱水的可逆反应。延胡索酸酶可分为线粒体内以及细胞质中两种,其中线粒体延
- 色藻界色藻界(学名:Chromista),其中文名称还有杂色生物界、假菌界(因包含"假的真菌"——卵菌)、藻菌界、原藻界、色素界、藻物界、藻界、色虫界等等,尚无统一译名。色藻界细胞的色素体具