序列组装

✍ dations ◷ 2025-10-27 04:08:23 #生物信息学

序列组装(Sequence assembly)是生物资讯学中的一种分析方法。此方法通过序列比对和序列合并等演算,将短片段的DNA建构成为较长的连续序列。此技术的创立,是因为被测序的核酸分子通常长度都远大于目前存在的DNA测序技术。而此分析能试图从有限长度的DNA测序结果,重建出原本被测序分子的样貌。

序列组装最常被使用在高通量测序资料的分析上(例如基因组霰弹枪定序,或者RNA转录体测序)。这一类的测序技术会产生大量的测序片段(read,复数reads),而这些片段的长度依照不同的技术,短为数十,长可至上万个碱基对(前者如Illumina的定序平台,后者如太平洋生物科学公司(英语:Pacific Biosciences)的SMRT-测序(英语:Single molecule real time sequencing)或奈米孔洞测序)。而序列组装旨在合并这些短片段来重建原本的分子序列。

我们可将序列组装想像成从大量片段的文字中拼凑出一整篇文章的过程:被测序的分子就是那篇文章,而测序片段就是那段文章中,随机切取出来的句子。其中一种重建出这段文章的方式,就是找到句子中重叠的部分,因为一旦找到够多重叠的部分,我们就有机会将每个句子连接到一起,进而得到原始的文章。不难想像,此过程的困难不仅仅在于需要进行大量的片段比对,还会因原本文章的复杂度而制造更多问题:例如原本的文章可能有许多重复的段落,而带有这些重复段落的文句可能会重叠在一起;又或者我们所拿到的句子中若有错别字,亦会增加寻找重叠片段的难度。同样的问题也同样存在于生物资讯的序列组装分析里。

依照参考序列的有无,序列组装可分为:

举例来说,在进行全基因组测序分析(英语:whole genome sequencing)时,de-novo组装可能被使用在非模式物种基因组的分析上,因为其没有临进物种的基因组提供参考。相反的,如果有有邻近或相同物种的基因组可做参考,则可使用mapping组装或引导式组装(genome guided assembly)。

De-novo 组装又可分为三种算法:

最早的序列组装程式大约在1980至1990年代初期被发明。其雏形是序列比对分析的程式。随着定序技术的进步以及被定序生物复杂度的增加(从小的病毒在质体至细菌和最后真核生物),序列组装程式所采用的算法也越趋复杂。基本上,组装程式都至少要能应付下面三大问题:

基因组组装程式Celera 和Arachne 在2000年被研发出来——当时科学家试着组装第一个较大型真核生物的基因组(果蝇),紧接着是隔年的人类基因组计划。这两个程式能处理约100至300亿个碱基对的基因组。随后,更大更复杂的组装程式也被发明,例如阿莫斯组装程式(AMOS, A Modular Open-source Assembler) 等。

下表列出了部分能够进行 de-novo 组装的程式。

相关

  • 联合国教育、科学及文化组织联合国教育、科学与文化组织(法语:Organisation des Nations unies pour l'éducation, la science et la culture,缩写作 ONUÉSC ; 英语:United Nations Educational, Scient
  • 光栅光栅(Grating)是一种非常重要的光学元件。广义的光栅定义为:可以使入射光的振幅或相位(或两者同时)受到周期性空间调制的光学元件。只能使光受到振幅调制或相位调制的光栅,分别称
  • 塔斯马尼亚坐标:42°10′46.88″S 146°38′43.83″E / 42.1796889°S 146.6455083°E / -42.1796889; 146.6455083塔斯马尼亚州(英语:Tasmania,缩写为TAS),简称塔州,是澳大利亚唯一的岛州,原
  • 孤电子对孤电子对(英语:lone pair,或称孤对电子)是不与其他原子结合或共享的成对价电子。存在于原子的最外围电子壳层。 孤对电子在分子中的存在和分配影响分子的形状等,对轻原子组成的分
  • 冈比西斯二世冈比西斯二世(古波斯楔形文字:
  • 凯鲁比尼马里亚·路易吉·卡洛·泽诺比奥·萨尔瓦多·凯鲁比尼(意大利语:Maria Luigi Carlo Zenobio Salvatore Cherubini,1760年9月8日-1842年3月15日) 是一位出生于意大利、在法国渡过
  • 目镜目镜,又称接目镜,通常是一个透镜组,可以连接在各种不同光学设备,像是望远镜和显微镜,的后端。所以如此命名,是因为当设备被使用时,它常是最接近使用者眼睛的透镜。物镜的透镜和面镜
  • 姚鸿泽姚鸿泽(1959年6月29日-),美国华裔数学家。出生于台湾。1981年姚鸿泽在国立台湾大学数学系获学士学位,1987年于普林斯顿大学获博士学位。1988年加入纽约大学任教授,1994年在该校库
  • 杨霞杨霞(1977年1月8日-)是中国一位女子举重运动员,出生于湖南省保靖县,土家族。1988年,杨霞入选湘西自治州业余体校女子举重班成为首批队员。1989年11月人选湖南省女子举重队。1997年
  • 克莱夫·格兰杰克莱夫·威廉·约翰·格兰杰爵士(Sir Clive William John Granger,1934年9月4日-2009年5月27日),是一位出生于威尔士的经济学家,美国圣地牙哥加利福尼亚大学退休教授。1967年发明