首页 >
非线性回归
✍ dations ◷ 2025-10-19 08:55:29 #非线性回归
在统计学中, 非线性回归是回归分析的一种形式,其中观测数据由函数建模,该函数是模型参数的非线性组合并且取决于一个或多个独立变量。 通过逐次逼近的方法拟合数据。在非线性回归中,形式的统计模型 ,关联自变量 x的向量及其相关的观察到的因变量 y 。函数f在参数β的矢量的分量中是非线性的,但在其他方面是任意的。例如,酶动力学的米-门二氏动力学模型有两个参数和一个独立变量,由f相关:此函数是非线性的,因为它不能表示为两个
β
{displaystyle beta }
的线性组合。系统误差可能存在于自变量中,但其处理不在回归分析的范围内。 如果自变量不是无差错的,那么这是一个变量误差模型 ,也在此范围之外。非线性函数的其他示例包括指数函数 , 对数函数 , 三角函数 , 幂函数 , 高斯函数和洛伦兹曲线 。 某些函数(如指数函数或对数函数)可以进行转换,以使它们是线性的。 如此转换,可以执行标准线性回归,但必须谨慎应用。 有关详细信息,请参阅下面的线性化§Transformation 。通常,对于最佳拟合参数,没有闭合形式表达式,如线性回归 中所示。 通常应用数值优化算法来确定最佳拟合参数。 与线性回归相比,可能存在要优化的函数的许多局部最小值 ,甚至全局最小值也可能产生偏差估计。 在实践中,结合优化算法使用参数的估计值来尝试找到平方和的全局最小值。这个过程的基本假设是模型可以用线性函数近似,即一阶泰勒级数 :其中
J
i
j
=
∂
f
(
x
i
,
β
)
∂
β
j
{displaystyle J_{ij}={frac {partial f(x_{i},{boldsymbol {beta }})}{partial beta _{j}}}}
,由此得出最小二乘估计量由下式给出 .计算非线性回归统计量并将其用作线性回归统计量,但在公式中使用J代替X. 线性近似将偏差引入统计中。 因此,在解释从非线性模型得到的统计数据时,需要比平常更多的谨慎。最佳拟合曲线通常假定应该看起来平方的总和最小化残差 。 这是普通的最小二乘 (OLS)方法。 然而,在因变量不具有恒定方差的情况下,可以最小化加权平方残差的总和;看加权最小二乘法 。 理想情况下,每个权重应等于观察方差的倒数,但是在迭代加权最小二乘算法中,可以在每次迭代时重新计算权重。通过模型公式的适当变换,可以将一些非线性回归问题移动到线性域。例如,考虑非线性回归问题带有参数a和b以及乘法误差项U.如果我们采用双方的对数,那就变成了其中u = ln( U ),建议通过x上的ln( y )的线性回归估计未知参数,该计算不需要迭代优化。 但是,使用非线性变换需要谨慎。 数据值的影响将发生变化,模型的误差结构和任何推论结果的解释也将发生变化。 这些可能不是期望的效果。 另一方面,取决于最大误差源是什么,非线性变换可以以高斯方式分布误差,因此必须通过建模考虑来选择执行非线性变换。对于米-门二氏动力学 ,线性双倒数图1 / v对1 / 已被大量使用。 但是,由于它对数据错误非常敏感,并且强烈偏向于将数据拟合到自变量的特定范围内,因此强烈建议不要使用它。对于属于指数族的误差分布,可以使用链接函数来变换广义线性模型框架下的参数。独立或解释变量 (比如X)可以分成类或段,并且可以对每个段执行线性回归 。 具有置信度分析的分段回归可以产生依赖或响应变量 (假设Y)在各个段中表现不同的结果。该图显示土壤盐度 (X)最初对芥菜的作物产量 (Y)没有影响,直到临界 值或阈值( 断点 ),之后产量受到负面影响。
相关
- 计算生物学计算生物学(Computational Biology)是生物学的一个分支。根据美国国家卫生研究所(NIH)的定义,它是指开发和应用数据分析及理论的方法、数学建模和计算机仿真技术,用于生物学、行为
- 白俄罗斯欧洲(深灰色) —白俄罗斯共和国(白俄罗斯语:Беларусь,转写:Biełaruś;IPA:.mw-parser-output .IPA{font-family:"Charis SIL","Doulos SIL","Linux Libertine","Segoe UI
- 医疗差错医疗疏失,又称医疗过失、医疗错误、医疗失误,通常指可以被避免的医疗照护不良反应,无论它是否明显的被证明对病人有危害。它可能是源自于不精确或错误的诊断、或疗法。造成严重
- 人 (消歧义)人可以指:
- 毫克毫克或称公丝,符号为mg(法语:milligramme → 英式英文:milligramme, 美式英文:milligram),质量单位,是克的1/1000,是一种国际通用的质量单位。
- 扫描探针显微镜扫描探针显微镜(Scanning probe microscopy,SPM)是所有机械式地用物理探针在样本上扫描移动以探测样本影像的显微镜的统称。其影像分辨率主要取决于探针的大小〔通常在纳米的范
- 色调明色调(Tint)与暗色调(Shade)。明色调,也有人称为含白度。暗色调,也有人称为含黑度。在色彩理论中,明色调是一种与白色颜色的混合,这减少了暗度。而暗色调是与黑色的混合,这增加
- 奇异物质奇异物质(英语:strange matter)是夸克物质(英语:QCD matter)的一种特例,通常认为是包含上夸克、下夸克和奇夸克的流体。这是与核物质(英语:nuclear matter)(质子、中子等构成的普通物质
- 市域市域(city proper)是指市界(英语:City limits)(city limits)内包含的区域。市域并不只限于地理意义上的都市,它描述的区域可以是符合定义的任何地方。联合国将术语“city proper”定
- 再城市化再城市化(英语:Reurbanization),也称为再城镇化,是城市化发展进程的一个阶段,是针对逆城市化而言的一个应对过程,使得城市因发生逆城市化而衰败的城市中心区再度城市化的过程,是城市