非线性回归

✍ dations ◷ 2025-04-03 10:37:17 #非线性回归
在统计学中, 非线性回归是回归分析的一种形式,其中观测数据由函数建模,该函数是模型参数的非线性组合并且取决于一个或多个独立变量。 通过逐次逼近的方法拟合数据。在非线性回归中,形式的统计模型 ,关联自变量 x的向量及其相关的观察到的因变量 y 。函数f在参数β的矢量的分量中是非线性的,但在其他方面是任意的。例如,酶动力学的米-门二氏动力学模型有两个参数和一个独立变量,由f相关:此函数是非线性的,因为它不能表示为两个 β {displaystyle beta } 的线性组合。系统误差可能存在于自变量中,但其处理不在回归分析的范围内。 如果自变量不是无差错的,那么这是一个变量误差模型 ,也在此范围之外。非线性函数的其他示例包括指数函数 , 对数函数 , 三角函数 , 幂函数 , 高斯函数和洛伦兹曲线 。 某些函数(如指数函数或对数函数)可以进行转换,以使它们是线性的。 如此转换,可以执行标准线性回归,但必须谨慎应用。 有关详细信息,请参阅下面的线性化§Transformation 。通常,对于最佳拟合参数,没有闭合形式表达式,如线性回归 中所示。 通常应用数值优化算法来确定最佳拟合参数。 与线性回归相比,可能存在要优化的函数的许多局部最小值 ,甚至全局最小值也可能产生偏差估计。 在实践中,结合优化算法使用参数的估计值来尝试找到平方和的全局最小值。这个过程的基本假设是模型可以用线性函数近似,即一阶泰勒级数 :其中 J i j = ∂ f ( x i , β ) ∂ β j {displaystyle J_{ij}={frac {partial f(x_{i},{boldsymbol {beta }})}{partial beta _{j}}}} ,由此得出最小二乘估计量由下式给出 .计算非线性回归统计量并将其用作线性回归统计量,但在公式中使用J代替X. 线性近似将偏差引入统计中。 因此,在解释从非线性模型得到的统计数据时,需要比平常更多的谨慎。最佳拟合曲线通常假定应该看起来平方的总和最小化残差 。 这是普通的最小二乘 (OLS)方法。 然而,在因变量不具有恒定方差的情况下,可以最小化加权平方残差的总和;看加权最小二乘法 。 理想情况下,每个权重应等于观察方差的倒数,但是在迭代加权最小二乘算法中,可以在每次迭代时重新计算权重。通过模型公式的适当变换,可以将一些非线性回归问题移动到线性域。例如,考虑非线性回归问题带有参数a和b以及乘法误差项U.如果我们采用双方的对数,那就变成了其中u = ln( U ),建议通过x上的ln( y )的线性回归估计未知参数,该计算不需要迭代优化。 但是,使用非线性变换需要谨慎。 数据值的影响将发生变化,模型的误差结构和任何推论结果的解释也将发生变化。 这些可能不是期望的效果。 另一方面,取决于最大误差源是什么,非线性变换可以以高斯方式分布误差,因此必须通过建模考虑来选择执行非线性变换。对于米-门二氏动力学 ,线性双倒数图1 / v对1 / 已被大量使用。 但是,由于它对数据错误非常敏感,并且强烈偏向于将数据拟合到自变量的特定范围内,因此强烈建议不要使用它。对于属于指数族的误差分布,可以使用链接函数来变换广义线性模型框架下的参数。独立或解释变量 (比如X)可以分成类或段,并且可以对每个段执行线性回归 。 具有置信度分析的分段回归可以产生依赖或响应变量 (假设Y)在各个段中表现不同的结果。该图显示土壤盐度 (X)最初对芥菜的作物产量 (Y)没有影响,直到临界 值或阈值( 断点 ),之后产量受到负面影响。

相关

  • 工程图工程图(英语:engineering drawing)是技术制图(technical drawing)的一种,是一种2D图表或图画来描述建筑图、结构图、机械制图、电气图纸、和管路图纸的制图方式。用工程制图的方法
  • 突厥语族突厥语系(Turkic languages)或突厥语族内部包括40多种语言。突厥语系语言简称突厥语,突厥语的使用人口约1.65亿至2亿人,主要分布在欧亚大陆上。东起中国东北,西至东欧,北自西伯利
  • 扳机指板机指(英语:Trigger finger)也称为扳机指,又称为狭窄性腱鞘炎(英语:Stenosing tenosynovitis),是一种会出现手指活动受限或卡住的疾患。疼痛可出现在手掌或手指关节。这个命名是由
  • 分子生物学的中心法则分子生物学的中心法则(英语:The central dogma of molecular biology,又译分子生物学的中心教条),首先由佛朗西斯·克里克于1958年提出,并于1970年在《自然》上的一篇文章中重申:中
  • 约塞米蒂国家公园约塞米蒂国家公园(英语:Yosemite National Park、/joʊˈsɛmᵻti/ yoh-SEM-it-ee)是美国加州中东部横跨图奥勒米县、马里波萨县和马德拉县东部部分地区的国家公园。该公园占地
  • 布洛克县布洛克县(Bulloch County)是位于美国佐治亚州东部的一个县,面积1,754平方公里,县治斯泰茨伯勒。根据2000年美国人口普查,共有人口61,457。布洛克县成立于1796年2月8日,县名源自佐
  • 角抵角抵是一种中国古代的角力游戏,又称相扑。它们主要是通过力量型的较量,用非常简单的人体相搏的方式来决出胜负。角抵是上古时代的战争搏斗的一种手段,后来逐渐演变为一种带有一
  • BkOsub2/sub二氧化锫是锫已知的两种氧化物之一,化学式为BkO2。它是浅棕黄色至棕褐色固体,属正交晶系(萤石结构),晶胞参数a=5.334±0.005。它可由三氧化二锫在空气中加热至600°C得到。
  • 四因说四因说(four causes),由古希腊哲学家亚里士多德提出,将世界上事物的变化与运动的背后原因(古希腊语:αἴτιον)归纳为四大类。四因包括:亚里士多德认为,凡感性实体,包括自然物和人
  • 蒙古标准时间克拉斯诺亚尔斯克时间(俄语:красноярское время,简称KRAT)是俄罗斯的一个时区,以克拉斯诺亚尔斯克边疆区首府克拉斯诺亚尔斯克命名。克拉斯诺亚尔斯克时间比UTC