蛋白质一级结构(英语:Protein primary structure)是肽或蛋白质中氨基酸的线性序列。按照惯例,蛋白质的一级结构被报道从氨基末端(N)端到羧基末端(C)端。蛋白质生物合成最通常由细胞中的核糖体进行。肽也可以在实验室中合成。蛋白质一级结构可以被直接蛋白质序列(英语:Protein sequencing)测序,或从DNA序列推断。
在生物化学里,生物分子的一级结构是其分子组成和分子间化学键结的精确模样。对于一典型的无分支、无交叉的生物聚合物(如DNA、RNA或典型的细胞内蛋白质等分子),其第一结构等同于描述其单体单位的序列,即如DNA序列和肽序列。“一级结构”这一名词在Linderstrom-Lang于1951年的Lane Medical Lectures上首次被提到。一级结构和一级序列有一点相似,即使在二级或三级结构中并没有平行的概念。
氨基酸通过肽键聚合形成长骨架主链,不同的氨基酸侧链沿其突出。在生物系统中,蛋白质在细胞的核糖体翻译过程中产生。一些生物体还可以通过非核糖体肽(英语:Nonribosomal peptide)合成制备短肽,其通常使用除了标准的20个之外的氨基酸,并且可以被环化,修饰和交联。
肽可以通过一系列实验室方法化学合成。化学方法通常以与生物蛋白质合成相反的顺序(从C-末端开始)合成肽。
蛋白质序列通常表示为字母串,列出了氨基末端开始至羧基末端的氨基酸。三个字母代码或单个字母代码可以用于表示20种天然存在的氨基酸,以及混合物或不确定的氨基酸(类似于核酸符号(英语:Nucleic acid notation))。
肽可以直接蛋白质序列(英语:Protein sequencing)测序,或从DNA序列推断。大型序列数据库(英语:Sequence database)现在已经存在,整理已知的蛋白质序列。
通常,多肽是非支化聚合物,因此它们的一级结构通常可以通过沿其主链的氨基酸序列来指定。然而,蛋白质可以变得交叉联接,最常见地通过二硫键,并且一级结构也需要指定交联原子,例如,指定参与蛋白质二硫键的半胱氨酸。其他交联包括锁链素。
多肽链的手性中心可以进行消旋。 虽然它不会改变序列,但它确实会影响序列的化学性质。 特别是,蛋白质中常见的L-氨基酸可以在原子中自发异构化,形成D-氨基酸 ,大多数蛋白酶不能切割。 另外,脯氨酸可在肽键处形成稳定的顺反异构物。
最后,蛋白质可以进行各种翻译后修饰,这里简要总结。
多肽的N-末端氨基可以共价修饰,例如,
多肽的C-末端羧酸酯基团也可以被修饰,例如,
糖磷脂酰肌醇(GPI)是一种大的疏水性磷脂修复基团,可将蛋白质转移到细胞膜上。 它通过酰胺键连接到多肽C-末端,然后连接到乙醇胺,然后连接到各种各样的糖,最后连接到磷脂酰肌醇脂质部分。
最后,肽侧链也可以共价修饰,例如,
上面列出的大多数多肽修饰发生在翻译后,即在核糖体上合成蛋白质后,通常发生在真核细胞的亚细胞内质网中。
化学家已将许多其他化学反应(例如,氰基化)应用于蛋白质,尽管它们未在生物系统中被发现。
除了上面列出的那些之外,一级结构的最重要的修饰是肽切割(通过化学水解或通过蛋白酶)。 蛋白质通常以无活性的前体形式合成; 通常,N-末端或C-末端区段阻断蛋白质的活性位点,抑制其功能。 通过切割抑制肽来激活蛋白质。
生物聚合物的一级结构在很大程度上决定了三维形状(蛋白质三级结构)。蛋白质序列可用于预测局部特征,例如二级结构的区段或跨膜区域。然而,蛋白质折叠的复杂性目前禁止仅从其序列预测蛋白质的三级结构。了解相似同源序列(英语:Sequence homology)(例如相同蛋白质家族的成员)的结构允许通过同源性建模高度准确地预测三级结构。如果可获得全长蛋白质序列,则可以估计其一般生物物理学特性,例如其等电点。
序列家族通常通过序列聚类确定,并且结构基因组学项目旨在产生一组代表性结构以覆盖可能的非冗余序列的序列空间。
任何线性链杂聚物可以被称为具有类似于该术语对于蛋白质的使用的“一级结构”,但是与参考蛋白质的极其常用的用法相比,这种用法是罕见的。在也具有广泛二级结构的RNA中,碱基的直链通常仅称为“序列”,如同它在DNA中被称为的(其通常形成具有很少二级结构的线性双螺旋)。 其他生物聚合物如多糖也可以被认为具有一级结构,尽管这样使用不是标准的。
←氨基酸
二级结构→