非线性回归

✍ dations ◷ 2025-06-07 11:36:51 #非线性回归
在统计学中, 非线性回归是回归分析的一种形式,其中观测数据由函数建模,该函数是模型参数的非线性组合并且取决于一个或多个独立变量。 通过逐次逼近的方法拟合数据。在非线性回归中,形式的统计模型 ,关联自变量 x的向量及其相关的观察到的因变量 y 。函数f在参数β的矢量的分量中是非线性的,但在其他方面是任意的。例如,酶动力学的米-门二氏动力学模型有两个参数和一个独立变量,由f相关:此函数是非线性的,因为它不能表示为两个 β {displaystyle beta } 的线性组合。系统误差可能存在于自变量中,但其处理不在回归分析的范围内。 如果自变量不是无差错的,那么这是一个变量误差模型 ,也在此范围之外。非线性函数的其他示例包括指数函数 , 对数函数 , 三角函数 , 幂函数 , 高斯函数和洛伦兹曲线 。 某些函数(如指数函数或对数函数)可以进行转换,以使它们是线性的。 如此转换,可以执行标准线性回归,但必须谨慎应用。 有关详细信息,请参阅下面的线性化§Transformation 。通常,对于最佳拟合参数,没有闭合形式表达式,如线性回归 中所示。 通常应用数值优化算法来确定最佳拟合参数。 与线性回归相比,可能存在要优化的函数的许多局部最小值 ,甚至全局最小值也可能产生偏差估计。 在实践中,结合优化算法使用参数的估计值来尝试找到平方和的全局最小值。这个过程的基本假设是模型可以用线性函数近似,即一阶泰勒级数 :其中 J i j = ∂ f ( x i , β ) ∂ β j {displaystyle J_{ij}={frac {partial f(x_{i},{boldsymbol {beta }})}{partial beta _{j}}}} ,由此得出最小二乘估计量由下式给出 .计算非线性回归统计量并将其用作线性回归统计量,但在公式中使用J代替X. 线性近似将偏差引入统计中。 因此,在解释从非线性模型得到的统计数据时,需要比平常更多的谨慎。最佳拟合曲线通常假定应该看起来平方的总和最小化残差 。 这是普通的最小二乘 (OLS)方法。 然而,在因变量不具有恒定方差的情况下,可以最小化加权平方残差的总和;看加权最小二乘法 。 理想情况下,每个权重应等于观察方差的倒数,但是在迭代加权最小二乘算法中,可以在每次迭代时重新计算权重。通过模型公式的适当变换,可以将一些非线性回归问题移动到线性域。例如,考虑非线性回归问题带有参数a和b以及乘法误差项U.如果我们采用双方的对数,那就变成了其中u = ln( U ),建议通过x上的ln( y )的线性回归估计未知参数,该计算不需要迭代优化。 但是,使用非线性变换需要谨慎。 数据值的影响将发生变化,模型的误差结构和任何推论结果的解释也将发生变化。 这些可能不是期望的效果。 另一方面,取决于最大误差源是什么,非线性变换可以以高斯方式分布误差,因此必须通过建模考虑来选择执行非线性变换。对于米-门二氏动力学 ,线性双倒数图1 / v对1 / 已被大量使用。 但是,由于它对数据错误非常敏感,并且强烈偏向于将数据拟合到自变量的特定范围内,因此强烈建议不要使用它。对于属于指数族的误差分布,可以使用链接函数来变换广义线性模型框架下的参数。独立或解释变量 (比如X)可以分成类或段,并且可以对每个段执行线性回归 。 具有置信度分析的分段回归可以产生依赖或响应变量 (假设Y)在各个段中表现不同的结果。该图显示土壤盐度 (X)最初对芥菜的作物产量 (Y)没有影响,直到临界 值或阈值( 断点 ),之后产量受到负面影响。

相关

  • 耳鼻喉科学耳鼻喉科学(Otorhinolaryngology /oʊtoʊˌraɪnoʊˌlærənˈɡɒlədʒi/;亦称为:otolaryngology-head and neck surgery)是一门医学专科,专门研究耳、鼻、喉病变的诊断及治
  • 细菌分类表本表以LPSN网站的分类为基础(当前版本2008年1月7日),本分类代表原核生物分类的权威杂志IJSEM的分类系统,同时参考NCBI Taxonomy,但目前其它中文维基分类表可能依照其它标准,请注意
  • 耳部耳部,为汉字索引中的部首之一,康熙字典214个部首中的第一百二十八个(六划的则为第十一个)。就繁体和简体中文中,耳部归于六划部首。耳部以左、下方为部字。且无其他部首可用者将
  • 洛美洛美(法语:Lomé),濒临几内亚湾,是多哥首都,也是该国主要港口,多哥行政和工业中心。市区人口837,437,总人口1,570,283(2012年)。洛美最早在18世纪是一个埃维族的城镇,后来由德国于1897
  • CD-ROM只读光盘(Compact Disc Read-Only Memory,缩写:CD-ROM),是一种在电脑上使用的光盘。这种光盘只能写入数据一次,信息将永久保存在光盘上,使用时通过光盘驱动器读出信息。CD的格式最
  • 唯象专家理论粒子物理中的粒子物理现象学(英文:particle physics phenomenology)处理有关理论物理在高能粒子实验中的应用。在标准模型的框架内,现象学家为实验计算详细的预测结果,通常要
  • 柠檬酸合成酶柠檬酸合成酶(英语:Citrate synthase,EC 2.3.3.1)几乎存在于所有活细胞中并且是催化三羧酸循环第一步的一个限速酶。此酶存在于真核细胞的线粒体中,但它是由细胞核DNA而非线粒体D
  • 蛋白激酶A蛋白激酶A(英语:Protein kinase A,简称为PKA)在细胞生物学中是指其活性取决于细胞环腺苷酸(cAMP)水平的一家族酶类。蛋白激酶A也被称为环腺苷酸依赖性蛋白激酶(EC 2.7.11.11)。蛋白
  • 正丁硒醇正丁硒醇,又称1-丁硒醇,是一种硒醇类的有机化合物,亦属于有机硒化合物,其化学式为C4H10Se,示性式为C4H9SeH,对应的醇为正丁醇、对应的硫醇为正丁硫醇。正丁硒醇是一个极其恶臭的液
  • 碎纸片彩色纸屑(意大利语:Coriandoli),指以聚脂薄膜或金属材料为原料的多种色彩的纸片碎屑,通常用于巡游,运动会等庆祝活动,特别是婚礼庆祝上。早期的纸屑源于意大利。现代意义上的彩色纸