定量构效关系

✍ dations ◷ 2024-11-05 16:31:48 #定量构效关系
定量构效关系(QSAR)是一种借助分子的理化性质参数或结构参数,以数学和统计学手段定量研究有机小分子与生物大分子相互作用、有机小分子在生物体内吸收、分布、代谢、排泄等生理相关性质的方法。这种方法广泛应用于药物、农药、化学毒剂等生物活性分子的合理设计,在早期的药物设计中,定量构效关系方法占据主导地位,1990年代以来随着计算机计算能力的提高和众多生物大分子三维结构的准确测定,基于结构的药物设计逐渐取代了定量构效关系在药物设计领域的主导地位,但是QSAR在药学研究中仍然发挥着非常重要的作用。定量构效关系是在传统构效关系的基础上,结合物理化学中常用的经验方程的数学方法出现的,其理论历史可以追溯到1868年提出的Crum-Brown方程,该方程认为化合物的生理活性可以用化学结构的函数来表示,但是并未建立明确的函数模型。最早的可以实施的定量构效关系方法是美国波蒙拿学院的Hansch在1962年提出的Hansch方程。Hansch方程脱胎于1935年英国物理化学家哈密顿提出的哈密顿方程以及改进的塔夫托方程。哈密顿方程是一个计算取代苯甲酸解离常数的经验方程,这个方程将取代苯甲酸解离常数的对数值与取代基团的电性参数建立了线性关系,塔夫托方程是在哈密顿方程的基础上改进形成的计算脂肪族酯类化合物水解反应速率常数的经验方程,它将速率常数的对数与电性参数和立体参数建立了线性关系。Hansch方程在形式上与哈密顿方程和塔夫托方程非常接近,以生理活性物质的半数有效量作为活性参数,以分子的电性参数、立体参数和疏水参数作为线性回归分析的变量,随后,Hansch和日本访问学者藤田稔夫等人一道改进了Hansch方程的数学模型,引入了指示变量、抛物线模型和双线性模型等修正,使得方程的预测能力有所提高。几乎在Hansch方法发表的同时,Free等人发表了Free-Wilson方法,这种方法直接以分子结构作为变量对生理活性进行回归分析。其在药物化学中的应用范围远不如Hansch方法广泛。Hansch方法、Free-Wilson方法等方法均是将分子作为一个整体考虑其性质,并不能细致地反应分子的三维结构与生理活性之间的关系,因而又被称作二维定量构效关系二维定量构效关系出现之后,在药物化学领域产生了很大影响,人们对构效关系的认识从传统的定性水平上升到定量水平。定量的结构活性关系也在一定程度上揭示了药物分子与生物大分子结合的模式。在Hansch方法的指导下,人们成功地设计了诺氟沙星等喹诺酮类抗菌药。由于二维定量不能精确描述分子三维结构与生理活性之间的关系,1980年代前后人们开始探讨基于分子构象的三维定量构效关系的可行性。1979年,Crippen提出“距离几何学的3D-QSAR”;1980年Hopfinger等人提出“分子形状分析方法”;1988年Cramer等人提出了“比较分子场方法”(CoMFA)。比较分子场方法一经提出便席卷药物设计领域,成为应用最广泛的基于定量构效关系的药物设计方法;1990年代,又出现了在比较分子场方法基础上改进的“比较分子相似性方法”以及在“距离几何学的3D-QSAR”基础上发展的“虚拟受体方法”等新的三维定量构效关系方法,但是老牌的CoMFA依然是使用最广泛的定量构效关系方法。二维定量构效关系方法是将分子整体的结构性质作为参数,对分子生理活性进行回归分析,建立化学结构与生理活性相关性模型的一种药物设计方法,常见的二维定量构效关系方法有Hansch方法、Free-wilson方法、分子连接性方法等,最为著名和应用最广泛的是Hansch方法活性参数是构成二维定量构效关系的要素之一,人们根据研究的体系选择不同的活性参数,常见的活性参数有:半数有效量、半数有效浓度、半数抑菌浓度、半数致死量、最小抑菌浓度等,所有活性参数均必须采用物质的量作为计量单位,以便消除分子量的影响,从而真实地反应分子水平的生理活性。为了获得较好的数学模型,活性参数在二维定量构效关系中一般取负对数后进行统计分析。结构参数是构成定量构效关系的另一大要素,常见的结构参数有:疏水参数、电性参数、立体参数、几何参数、拓扑参数、理化性质参数以及纯粹的结构参数等二维定量构效关系中最常见的数学模型是线性回归分析,Hansch方程和Free-Wilson方法均采用回归分析。经典的Hansch方程形式为:l g ( 1 C ) = a π + b σ + c E s + k {displaystyle lgleft({frac {1}{C}}right)=api +bsigma +cE_{s}+k} 其中 π {displaystyle pi } 为分子的疏水参数,其与分子脂水分配系数 P X {displaystyle P_{X}} 的关系为: π = l g ( P x P H ) {displaystyle pi =lgleft({frac {P_{x}}{P_{H}}}right)} , σ {displaystyle sigma } 为哈密顿电性参数, E s {displaystyle E_{s}} 为塔夫托立体参数,其中a,b,c,k均为回归系数。日本学者藤田稔夫对经典的Hansch方程作出一定改进,用抛物线模型描述疏水性与活性的关系:l g ( 1 C ) = a π + b π 2 + c σ + d E s + k {displaystyle lgleft({frac {1}{C}}right)=api +b{pi }^{2}+csigma +dE_{s}+k} 这一模型拟合效果更好。Hansch方程进一步,以双直线模型描述疏水性与活性的关系:l g ( 1 C ) = a l g P − b l g ( β P + 1 ) + D {displaystyle lgleft({frac {1}{C}}right)=algP-blg(beta P+1)+D} 其中的P为分子的脂水分配系数, a , b , β {displaystyle a,b,beta } 为回归系数,D代表方程的其他部分。双直线模型的预测能力比抛物线模型进一步加强。Free-Wilson方法的方程形式为:l g ( 1 C ) = ∑ i ∑ j G i j X i j + μ {displaystyle lgleft({frac {1}{C}}right)=sum _{i}sum _{j}G_{ij}X_{ij}+mu } 其中 X i j {displaystyle X_{ij}} 为结构参数,若结构母环中第i个位置有第j类取代基则结构参数取值为1否则为0, μ {displaystyle mu } 为参照分子的活性参数, G i j {displaystyle G_{ij}} 为回归系数。除了回归分析,遗传算法、人工神经网络、偏最小二乘分析、模式识别、单纯形方法等统计分析方法也会应用于二维定量构效关系数学模型的建立目前,二维定量构效关系的研究集中在两个方向:结构数据的改良和统计方法的优化。传统的二维定量构效关系使用的结构数据常仅能反应分子整体的性质,通过改良结构参数,使得二维结构参数能够在一定程度上反应分子在三维空间内的伸展状况,成为二维定量构效关系的一个发展方向。引入新的统计方法,如遗传算法、人工神经网络、偏最小二乘回归等,扩展二维定量构效关系能够模拟的数据结构的范围,提高QSAR模型的预测能力是2D-QSAR的主要发展方向。三维定量构效关系是引入了药物分子三维结构信息进行定量构效关系研究的方法,这种方法间接地反映了药物分子与大分子相互作用过程中两者之间的非键相互作用特征,相对于二维定量构效关系有更加明确的物理意义和更丰富的信息量,因而1980年代以来,三维定量构效关系逐渐取代了二维定量构效关系的地位,成为基于机理的合理药物设计的主要方法之一。目前应用最广泛的三维定量构效关系方法是CoMFA和CoMSIA即比较分子场方法和比较分子相似性方法,除了上述两种方法,3D-QSAR还有DG 3D-QSAR、MSA、GERM等众多方法。CoMFA和CoMISA是应用最广泛的合理药物设计方法之一,这种方法认为,药物分子与受体间的相互作用取决于化合物周围分子场的差别,以定量化的分子场参数作为变量,对药物活性进行回归分析便可以反应药物与生物大分子之间的相互作用模式进而有选择地设计新药。比较分子场方法将具有相同结构母环的分子在空间中叠合,使其空间取向尽量一致,然后用一个探针粒子在分子周围的空间中游走,计算探针粒子与分子之间的相互作用,并记录下空间不同坐标中相互作用的能量值,从而获得分子场数据。不同的探针粒子可以探测分子周围不同性质的分子场,甲烷分子作为探针可以探测立体场,水分子作为探针可以探测疏水场,氢离子作为探针可以探测静电场等等,一些成熟的比较分子场程序可以提供数十种探针粒子供用户选择。探针粒子探测得到的大量分子场信息作为自变量参与对分子生理活性数据的回归分析,由于分子场信息数据量很大,属于高维化学数据,因而在回归分析过程中必须采取数据降维措施,最常用的方式是偏最小二乘回归,此外主成分分析也用于数据的分析。统计分析的结果可以图形化地输出在分子表面,用以提示研究者如何有选择地对先导化合物进行结构改造。右图为一CoMFIA计算的结果输出,图中蓝色区域若以负电性基团取代则会提高药物的活性,红色区域则提示正电性基团更有利于活性。除了直观的图形化结果,CoMFA还能获得回归方程,以定量描述分子场与活性的关系。CoMSIA是对CoMFA方法的改进,他改变了探针粒子与药物分子相互作用能量的计算公式,从而获得更好的分子场参数。除了比较分子场方法,三维定量构效关系还有距离几何学三位定量构效关系(DG 3D-QSAR)、分子形状分析(MSA)、虚拟受体等方法(FR)等距离几何学三维定量构效关系严格来讲是一种介于二维和三维之间的QSAR方法。这种方法将药物分子划分为若干功能区块定义药物分子活性位点,计算低能构象时各个活性位点之间的距离,形成距离矩阵;同时定义受体分子的结合位点,获得结合位点的距离矩阵,通过活性位点和结合位点的匹配为每个分子生成结构参数,对生理活性数据进行统计分析。分子形状分析认为药物分子的药效构象是决定药物活性的关键,比较作用机理相同的药物分子的形状,以各分子间重叠体积等数据作为结构参数进行统计分析获得构效关系模型。虚拟受体方法是DG 3D-QSAR和CoMFA方法的延伸与发展,其基本思路是采用多种探针粒子在药物分子周围建立一个虚拟的受体环境,以此研究不同药物分子之间活性与结构的相关性。其原理较之CoMFA方法更加合理,是目前定量构效关系研究的热点之一。定量构效关系研究是人类最早的合理药物设计方法之一,具有计算量小,预测能力好等优点。在受体结构未知的情况下,定量构效关系方法是最准确和有效地进行药物设计的方法,根据QSAR计算结果的指导药物化学家可以更有目的性地对生理活性物质进行结构改造。在1980年代计算机技术爆炸式发展之前,QSAR是应用最广泛也几乎是唯一的合理药物设计手段。但是QSAR方法不能明确给出回归方程的物理意义以及药物-受体间的作用模式,物理意义模糊是对QSAR方法最主要的置疑之一。另外在定量构效关系研究中大量使用了实验数据和统计分析方法,因而QSAR方法的预测能力很大程度上受到试验数据精度的限制,同时时常要面对“统计方法欺诈”的置疑。

相关

  • 迈蒙尼德迈蒙尼德为摩西·本·迈蒙(希伯来语:משה בן מימון;阿拉伯语:أبو عمران موسى بن ميمون بن عبد الله القرطبي الإسرائيل
  • 老化人体解剖学 - 人体生理学 组织学 - 胚胎学 人体寄生虫学 - 免疫学 病理学 - 病理生理学 细胞学 - 营养学 流行病学 - 药理学 - 毒理学在生物学及医学上,老化是生理状态随时
  • 同音词同音词(Homonym)是指语言中读音相同,但是意义不同的词汇。汉语中,由于习惯上用一个汉字记录一个单音节语素,因此,汉语中除同音词外,还有同音字的概念,也就是读音相同,但是意义不同的
  • 实词实词是语文词类中的一种,是指词语中含有实际意义的词语。实词能单独充当句子成分,一般包含名词、动词、形容词、数词、量词、代词及副词等。根据组合能力的不同可以把实词分为
  • 基因重排基因重复或称复制基因(英语:Gene duplication (or chromosomal duplication or gene amplification))是指含有基因的DNA片段发生重复,可能因同源重组作用出错而发生,或是因为反转
  • 肌中央轴空病肌中央轴空病(central core disease (CCD)、central core myopathy)是一种遗传病,其会导致先天性肌肉病变,病理学上肌肉纤维中可发现有肌原纤维(英语:Myofibril)结构破坏的组成。
  • 胃食道逆流胃食道逆流(英文:Gastroesophageal reflux disease、heartburn reflux,缩写:GERD),或称作胃食管反流病、胃酸倒流等,是指胃酸(有时加上十二指肠液)长期不正常地向上反流进入食道甚至
  • 胆囊炎胆囊炎(Cholecystitis)是指发生于胆囊的炎症,症状包括右上腹部疼痛、恶心、呕吐、偶有发烧。多半在急性胆囊炎之前会有胆绞痛(英语:Biliary colic)的症状。但胆囊炎造成的疼痛会比
  • 轮藻门有胚植物 Embryophyta轮藻门是藻类的一门,包含了最亲近有胚植物的亲戚。因为排除了有胚植物,轮藻门是个并系群(然而有时会限定成单纯只有轮藻目,其为单系群)。藻体构造较复杂,有类
  • 毛细血管内增生性肾小球肾炎毛细血管内增生性肾小球肾炎(Endocapillary proliferative glomerulonephritis)是肾小球肾炎(Glomerulonephritis)的一种形式,它可以与肾炎有关。这可能与细小病毒B19(Parvov