泛基因组学

✍ dations ◷ 2025-05-16 01:12:52 #泛基因组学
泛基因组是为描述一个物种基因组而提出的概念,指同一细菌物种中所有菌株中所有基因的集合,而不单纯以某个菌株为一个物种的全基因组。会需要使用泛基因组的原因是水平基因转移造成不同菌株之间所拥有的基因相差甚大。泛基因组的英文是Pan-genome, Pan- 来自希腊语词汇 παν,意思是“全部的”。在1987年,细菌物种的概念是大于70%的DNA相关联,并具有相同的表型性。但是随着对大量细菌基因组测序的完成,这种概念区分方法变得模糊、不确定——测定同一物种的不同菌株,常会有新的基因出现。这个概念常被用于总体基因体学、演化生物学,应用的物种也有被延伸到植物或古菌。泛基因组包含核心基因和附加基因。核心基因是所有个体都拥有的基因,附加基因则为非核心基因的基因。在附加基因组中,若仅有一个个体具有该基因,则可称之为独特基因(英语:unique gene)。为了允许注解及基因序列组装的错误,对核心基因组较为宽松的定义可称之为软核心基因(soft core gene),其定义为于 95%以上的个体具有此基因。各物种有两种泛基因组,分别为开放型泛基因组和闭合型泛基因组。闭合型泛基因组的物种随着被定序的个体数量增加,泛基因组的大小增加有限,使得完整的泛基因组大小是在数学上可以预测的。相反地,开放型基因组的物种随着定序的个体增加,其泛基因组的大小并未收敛。影响物种是为何种泛基因组,受到族群大小、水平基因转移等影响。最早的泛基因组概念是由Tettelin等人在研究六株B型链球菌的菌株时提出的 ,最主要的概念就是找出所有菌株共有的核心基因(约占每只菌株基因体的80%),以及非必须的附加基因(有可能只存在于一小部分的菌株中,或甚至只出现在单一菌株的基因体中),并透过核心基因与附加基因的组合来描述B型链球菌。外推法模型预测这只细菌的基因库会持续增长,且即使在加入数百只细菌后,新的基因将会不断加入,显示这只细菌的总基因库相当庞大。44株肺炎链球菌菌株的泛基因体分析与B型链球菌有着不同的特征形态—虽然每这44株细菌的基因体都会贡献新的基因给肺炎链球菌的基因库,但是基因增长速度会随着细菌数量的增加而明显变慢。事实上,外推法预测在50只细菌加入后,新基因的数量将会降到零。显而易见的是这个特征并非所有细菌共有的。对肺炎链球菌来说,新基因最主要的来源是和缓链球菌的水平基因转移。肺炎链球菌的泛基因大小将会与菌株数量成对数级增加,而与新加入基因体的核苷酸多形位点数量形成线性关系,显示年纪越大的菌株将会越有可能得到新基因。最后一个例子是原绿球藻的核心基因体与完整的泛基因体大小比对。 在这个例子中,核心基因体明显地比泛基因体小很多,而不同生态型的原绿球藻会有着不同的基因组合。另一篇2015年的研究也在从人类身上不同部位分离普雷沃氏菌属,并重建泛基因体后,发现这只细菌有着庞大基因库,且属于开放式泛基因组类型。随着越来越多人关注泛基因体学,有更多的软件可以用来建立与分析泛基因体、绘图、注解。2014 年底最高引用数的的软件为 Panseq 以及 pan-genome analysis pipeline(PGAP)。其他的选择包含 BPGA - A Pan-Genome Analysis Pipepline for prokaryotic genomes、GET_HOMOLOGUES、Roary 与 CD-HIT GET_HOMOLOGUES or Roary. 。针对各家软件的比较,可以参照 2015 年的一篇文章。针对植物泛基因体的软件有 GET-HOMOLOGUES-EST 。有关植物泛基因体可以参照 2015 的一篇文章。

相关

  • Mayo Clinic坐标:44°1′20″N 92°28′0″W / 44.02222°N 92.46667°W / 44.02222; -92.46667梅奥诊所医学中心(英语:Mayo Clinic),又译为梅奥诊所、梅约诊所、马约诊所,是世界最著名的医疗
  • H6N1亚型H6N1(英语:Influenza A virus subtype H6N1,记作A(H6N1)或H6N1)是一种甲型流感病毒,是禽流感病毒或禽流感病毒的一个亚型。H6N1最初于2013年6月21日在台湾发现,首例患者是一名住在
  • 吕根岛吕根岛(德语:Rügen;拉丁语:Rugia)是德国最大的岛屿,位于德国东北部的波罗的海,属于梅克伦堡-前波美拉尼亚州。吕根岛南北最长处为52千米,东西最宽处为41千米,总面积926平方千米,海岸
  • 贝叶斯数学模型贝叶斯推断(英语:Bayesian inference)是推论统计的一种方法。这种方法使用贝叶斯定理,在有更多证据及信息时,更新特定假设的概率。贝叶斯推断是统计学(特别是数理统计学)中很重要的
  • 非对称性二甲基精氨酸非对称性二甲基精氨酸(英文:Asymmetric dimethylarginine,简称ADMA)是一种自然存在于血浆内的化合物。它是在人体细胞内细胞质中发生的蛋白质修饰过程产生的代谢副产物,与精氨酸
  • 肠粘连沾黏(英语:Adhesion)是组织或器官间所发生的纤维性组织,常见于手术区域。沾黏的纤维组织可以视为是体内的疤痕。如同疤痕,沾黏是手术后人体修复过程中会发生的一种自然现象。造成
  • 阿拉瓦克语系阿拉瓦克语系(Arawak),是南美洲和加勒比海的阿拉瓦克族的语言。牙买加的国名来自于此语,是“泉水之岛”的意思。
  • 人类语言学家人类语言学是通过人类遗传学和人的发展来研究语言和文化间的关系,通常指对无文字记载的语言研究。这跟语言人类学有很大重叠的部分,因为它通过他们所使用的语言来研究人类的文
  • 谢尔盖·维诺格拉茨基谢尔盖·尼古拉耶维奇·维诺格拉茨基(俄语:Сергей Николаевич Виноградский,1856年9月1日-1953年2月25日),俄国微生物学家,生态学家,和土壤科学家。他
  • 喂乳母乳哺育(Breastfeeding),亦称哺乳、授乳或母乳喂养,指的是女性以乳房喂食婴儿母乳的行为。婴儿有吮吸反射,因此可以吮吸乳房并吞咽母乳,专家建议在出生后一小时即可哺喂母乳,之后