序列组装

✍ dations ◷ 2025-12-07 00:02:58 #生物信息学

序列组装（Sequence assembly）是生物资讯学中的一种分析方法。此方法通过序列比对和序列合并等演算，将短片段的DNA建构成为较长的连续序列。此技术的创立，是因为被测序的核酸分子通常长度都远大于目前存在的DNA测序技术。而此分析能试图从有限长度的DNA测序结果，重建出原本被测序分子的样貌。

序列组装最常被使用在高通量测序资料的分析上（例如基因组霰弹枪定序，或者RNA转录体测序）。这一类的测序技术会产生大量的测序片段（read，复数reads），而这些片段的长度依照不同的技术，短为数十，长可至上万个碱基对（前者如Illumina的定序平台，后者如太平洋生物科学公司（英语：Pacific Biosciences）的SMRT-测序（英语：Single molecule real time sequencing）或奈米孔洞测序）。而序列组装旨在合并这些短片段来重建原本的分子序列。

我们可将序列组装想像成从大量片段的文字中拼凑出一整篇文章的过程：被测序的分子就是那篇文章，而测序片段就是那段文章中，随机切取出来的句子。其中一种重建出这段文章的方式，就是找到句子中重叠的部分，因为一旦找到够多重叠的部分，我们就有机会将每个句子连接到一起，进而得到原始的文章。不难想像，此过程的困难不仅仅在于需要进行大量的片段比对，还会因原本文章的复杂度而制造更多问题：例如原本的文章可能有许多重复的段落，而带有这些重复段落的文句可能会重叠在一起；又或者我们所拿到的句子中若有错别字，亦会增加寻找重叠片段的难度。同样的问题也同样存在于生物资讯的序列组装分析里。

依照参考序列的有无，序列组装可分为：

举例来说，在进行全基因组测序分析（英语：whole genome sequencing）时，de-novo组装可能被使用在非模式物种基因组的分析上，因为其没有临进物种的基因组提供参考。相反的，如果有有邻近或相同物种的基因组可做参考，则可使用mapping组装或引导式组装（genome guided assembly）。

De-novo 组装又可分为三种算法：

最早的序列组装程式大约在1980至1990年代初期被发明。其雏形是序列比对分析的程式。随着定序技术的进步以及被定序生物复杂度的增加（从小的病毒在质体至细菌和最后真核生物），序列组装程式所采用的算法也越趋复杂。基本上，组装程式都至少要能应付下面三大问题：

基因组组装程式Celera 和Arachne 在2000年被研发出来——当时科学家试着组装第一个较大型真核生物的基因组（果蝇），紧接着是隔年的人类基因组计划。这两个程式能处理约100至300亿个碱基对的基因组。随后，更大更复杂的组装程式也被发明，例如阿莫斯组装程式（AMOS, A Modular Open-source Assembler）等。

下表列出了部分能够进行 de-novo 组装的程式。

相关

多发性大动脉炎大动脉炎（Takayasu arteritis，TA）是一种累及主动脉及其主要分支以及肺动脉的慢性进行性非特异炎性疾病:841。疾病由日本医生高安右人（Mikito Takayasu）在1908年首次报告，因此又被
桶孔隔膜桶孔隔膜（Dolipore septum）是担子菌门伞菌纲真菌菌丝中的一种隔膜（英语：septa），为真菌最复杂的一种隔膜，最早于1962年由美国真菌学家罗耶·摩尔（英语：Royall Moore）与詹姆士·麦卡利尔
7-脱氢胆固醇7-脱氢胆固醇（英语：7-Dehydrocholesterol，缩写7-DHC）是一种胆固醇合成的前体，同时也是维生素D3（胆钙化醇）合成的中间产物，会在光照下开环转化为维生素D3。羊毛甾醇 · 7-烯胆甾烷
上海博物馆上海博物馆是一座位于中国上海市的大型中国古代艺术博物馆，馆藏文物近102万件，其中珍贵文物14万件，尤以青铜器、陶器、瓷器、书法与绘画为特色。上海博物馆1950年筹建。1952年1
克雅二氏症克罗伊茨费尔特-雅各布病（英语：Creutzfeldt-Jakob disease，简称CJD），或称克-雅氏症、克-雅氏病、克雅二氏症、克雅二氏病、库雅氏症、库贾氏症、克雅氏症、克雅氏病，是一种发生在
中提琴中提琴（英语：Viola）是一种弓弦乐器，其音域比小提琴低完全五度。其空弦从粗到细依序是c3-g3-d4-a4。音色相较于小提琴、大提琴显得相对隐晦。平时使用中音谱记号（alto clef）记谱，高
马钱子马钱子（学名：Strychnos nuxvomica）也称番木鳖，苦实把豆儿，火失刻把都，苦实，马前，牛眼，大方八，马钱树，是马钱科马钱属的一种落叶乔木。产于南亚和东南亚等地，喜热带湿润性气候，怕霜冻。模
浅蓝浅蓝色，是一种颜色，又称淡蓝色，是蓝色颜色之一，介乎蓝色和白色之间，为人所知的一种浅色。在西方文化经常被使用为衣物、装饰颜色，和包裹男婴的亚麻布。浅蓝色一般被认为男孩的颜色
蕾切尔·薇兹蕾切尔·汉娜·薇兹（英语：Rachel Hannah Weisz，/ˈvaɪs/，VYS；1970年3月7日－），英国女演员，曾经以电影《不朽的园丁》和《宠儿》入围奥斯卡最佳女配角奖及金球奖，并凭前者夺得第78届奥
北票市北票市是辽宁省朝阳市下辖的一个县级市。面积4583平方千米，人口62万。邮政编码122100。市人民政府驻市府街3号。其在历史上为土默特右翼旗。下辖（7）个街道办事处（18）个乡（2）个民