首页 >
泛基因组学
✍ dations ◷ 2025-10-08 18:13:05 #泛基因组学
泛基因组是为描述一个物种基因组而提出的概念,指同一细菌物种中所有菌株中所有基因的集合,而不单纯以某个菌株为一个物种的全基因组。会需要使用泛基因组的原因是水平基因转移造成不同菌株之间所拥有的基因相差甚大。泛基因组的英文是Pan-genome, Pan- 来自希腊语词汇 παν,意思是“全部的”。在1987年,细菌物种的概念是大于70%的DNA相关联,并具有相同的表型性。但是随着对大量细菌基因组测序的完成,这种概念区分方法变得模糊、不确定——测定同一物种的不同菌株,常会有新的基因出现。这个概念常被用于总体基因体学、演化生物学,应用的物种也有被延伸到植物或古菌。泛基因组包含核心基因和附加基因。核心基因是所有个体都拥有的基因,附加基因则为非核心基因的基因。在附加基因组中,若仅有一个个体具有该基因,则可称之为独特基因(英语:unique gene)。为了允许注解及基因序列组装的错误,对核心基因组较为宽松的定义可称之为软核心基因(soft core gene),其定义为于 95%以上的个体具有此基因。各物种有两种泛基因组,分别为开放型泛基因组和闭合型泛基因组。闭合型泛基因组的物种随着被定序的个体数量增加,泛基因组的大小增加有限,使得完整的泛基因组大小是在数学上可以预测的。相反地,开放型基因组的物种随着定序的个体增加,其泛基因组的大小并未收敛。影响物种是为何种泛基因组,受到族群大小、水平基因转移等影响。最早的泛基因组概念是由Tettelin等人在研究六株B型链球菌的菌株时提出的 ,最主要的概念就是找出所有菌株共有的核心基因(约占每只菌株基因体的80%),以及非必须的附加基因(有可能只存在于一小部分的菌株中,或甚至只出现在单一菌株的基因体中),并透过核心基因与附加基因的组合来描述B型链球菌。外推法模型预测这只细菌的基因库会持续增长,且即使在加入数百只细菌后,新的基因将会不断加入,显示这只细菌的总基因库相当庞大。44株肺炎链球菌菌株的泛基因体分析与B型链球菌有着不同的特征形态—虽然每这44株细菌的基因体都会贡献新的基因给肺炎链球菌的基因库,但是基因增长速度会随着细菌数量的增加而明显变慢。事实上,外推法预测在50只细菌加入后,新基因的数量将会降到零。显而易见的是这个特征并非所有细菌共有的。对肺炎链球菌来说,新基因最主要的来源是和缓链球菌的水平基因转移。肺炎链球菌的泛基因大小将会与菌株数量成对数级增加,而与新加入基因体的核苷酸多形位点数量形成线性关系,显示年纪越大的菌株将会越有可能得到新基因。最后一个例子是原绿球藻的核心基因体与完整的泛基因体大小比对。 在这个例子中,核心基因体明显地比泛基因体小很多,而不同生态型的原绿球藻会有着不同的基因组合。另一篇2015年的研究也在从人类身上不同部位分离普雷沃氏菌属,并重建泛基因体后,发现这只细菌有着庞大基因库,且属于开放式泛基因组类型。随着越来越多人关注泛基因体学,有更多的软件可以用来建立与分析泛基因体、绘图、注解。2014 年底最高引用数的的软件为 Panseq 以及 pan-genome analysis pipeline(PGAP)。其他的选择包含 BPGA - A Pan-Genome Analysis Pipepline for prokaryotic genomes、GET_HOMOLOGUES、Roary 与 CD-HIT
GET_HOMOLOGUES
or Roary.
。针对各家软件的比较,可以参照 2015 年的一篇文章。针对植物泛基因体的软件有 GET-HOMOLOGUES-EST
。有关植物泛基因体可以参照 2015 的一篇文章。
相关
- 盖伦克劳狄乌斯·盖伦(129年-200年)是一位古罗马的医学家及哲学家。他的见解和理论在他身后的一千多年里是欧洲起支配性的医学理论。出生于别迦摩,逝世于罗马。盖伦出生于一个建筑师
- 原子原子是元素能保持其化学性质的最小单位。一个正原子包含有一个致密的原子核及若干围绕在原子核周围带负电的电子。而负原子的原子核带负电,周围的负电子带“正电”。正原子的
- 闭锁不全二尖瓣闭锁不全(Mitral insufficiency,或mitral regurgitation,简称MR或MI),是描述心脏二尖瓣在心室收缩期间无法完全闭合的现象。此疾病会导致左心室的血液经二尖瓣逆流(英语:Regu
- 用户界面用户界面(User Interface,简称UI,亦称使用者界面)是系统和用户之间进行交互和信息交换的介质,它实现信息的内部形式与人类可以接受形式之间的转换。用户界面是介于用户与硬件而设
- 哥伦比亚大陆哥伦比亚大陆(Columbia supercontinent,或称为Nuna、Hudsonland)是地球历史上最古老的几个超大陆。2002年由约翰·罗杰斯和Santosh Madhava Warrier 提出。一般认为哥伦比亚大
- 通用通用希腊语(希腊语:Κοινὴ Ἑλληνική;通用希腊语: ἡ κοινὴ διάλεκτος,“通用语”),又译民间希腊语、共通希腊语、科伊内希腊语,或作希利尼话(Hellenisti
- 2B类致癌物2B类致癌物(英语:Group 2B carcinogens),为国际癌症研究机构(International Agency for Research on Cancer,IARC)对致癌物质的分类,此类物质(或其混合物)可能对人类致癌。现有236类物
- 幼淋巴细胞幼淋巴细胞系一类在淋巴细胞产生(英语:lymphocytopoiesis)过程中产生的细胞。它们产生自淋巴母细胞,是各种淋巴细胞的直接前体。其大小通常介于10-18微米之间。
- 单位笛卡尔坐标系(英语:Cartesian coordinate system,也称直角坐标系)在数学中是一种正交坐标系,由法国数学家勒内·笛卡尔引入而有此名。二维的直角坐标系是由两条相互垂直、相交于
- 坩埚坩埚(英语:Crucible)是实验室中使用的一种杯状器皿,最早使用于炼金术实验。用途是盛液体或固体进行高温加热。另外,冶金学中用来融化金属的容器也被称作坩埚。坩埚的材料要求耐热