首页 >
非线性回归
✍ dations ◷ 2025-12-09 18:33:03 #非线性回归
在统计学中, 非线性回归是回归分析的一种形式,其中观测数据由函数建模,该函数是模型参数的非线性组合并且取决于一个或多个独立变量。 通过逐次逼近的方法拟合数据。在非线性回归中,形式的统计模型 ,关联自变量 x的向量及其相关的观察到的因变量 y 。函数f在参数β的矢量的分量中是非线性的,但在其他方面是任意的。例如,酶动力学的米-门二氏动力学模型有两个参数和一个独立变量,由f相关:此函数是非线性的,因为它不能表示为两个
β
{displaystyle beta }
的线性组合。系统误差可能存在于自变量中,但其处理不在回归分析的范围内。 如果自变量不是无差错的,那么这是一个变量误差模型 ,也在此范围之外。非线性函数的其他示例包括指数函数 , 对数函数 , 三角函数 , 幂函数 , 高斯函数和洛伦兹曲线 。 某些函数(如指数函数或对数函数)可以进行转换,以使它们是线性的。 如此转换,可以执行标准线性回归,但必须谨慎应用。 有关详细信息,请参阅下面的线性化§Transformation 。通常,对于最佳拟合参数,没有闭合形式表达式,如线性回归 中所示。 通常应用数值优化算法来确定最佳拟合参数。 与线性回归相比,可能存在要优化的函数的许多局部最小值 ,甚至全局最小值也可能产生偏差估计。 在实践中,结合优化算法使用参数的估计值来尝试找到平方和的全局最小值。这个过程的基本假设是模型可以用线性函数近似,即一阶泰勒级数 :其中
J
i
j
=
∂
f
(
x
i
,
β
)
∂
β
j
{displaystyle J_{ij}={frac {partial f(x_{i},{boldsymbol {beta }})}{partial beta _{j}}}}
,由此得出最小二乘估计量由下式给出 .计算非线性回归统计量并将其用作线性回归统计量,但在公式中使用J代替X. 线性近似将偏差引入统计中。 因此,在解释从非线性模型得到的统计数据时,需要比平常更多的谨慎。最佳拟合曲线通常假定应该看起来平方的总和最小化残差 。 这是普通的最小二乘 (OLS)方法。 然而,在因变量不具有恒定方差的情况下,可以最小化加权平方残差的总和;看加权最小二乘法 。 理想情况下,每个权重应等于观察方差的倒数,但是在迭代加权最小二乘算法中,可以在每次迭代时重新计算权重。通过模型公式的适当变换,可以将一些非线性回归问题移动到线性域。例如,考虑非线性回归问题带有参数a和b以及乘法误差项U.如果我们采用双方的对数,那就变成了其中u = ln( U ),建议通过x上的ln( y )的线性回归估计未知参数,该计算不需要迭代优化。 但是,使用非线性变换需要谨慎。 数据值的影响将发生变化,模型的误差结构和任何推论结果的解释也将发生变化。 这些可能不是期望的效果。 另一方面,取决于最大误差源是什么,非线性变换可以以高斯方式分布误差,因此必须通过建模考虑来选择执行非线性变换。对于米-门二氏动力学 ,线性双倒数图1 / v对1 / 已被大量使用。 但是,由于它对数据错误非常敏感,并且强烈偏向于将数据拟合到自变量的特定范围内,因此强烈建议不要使用它。对于属于指数族的误差分布,可以使用链接函数来变换广义线性模型框架下的参数。独立或解释变量 (比如X)可以分成类或段,并且可以对每个段执行线性回归 。 具有置信度分析的分段回归可以产生依赖或响应变量 (假设Y)在各个段中表现不同的结果。该图显示土壤盐度 (X)最初对芥菜的作物产量 (Y)没有影响,直到临界 值或阈值( 断点 ),之后产量受到负面影响。
相关
- 演化的树状图现代生物分类群体从它们的 共同祖先遗传分化的图示。进化论介绍(英语:Introduction to evolution) 演化的证据 共同起源 共同起源的证据群体遗传学 · 遗传多样性 突变 · 自
- 外毒素外毒素(英语:Exotoxin)是细菌分泌到菌体外的毒性物质,能损坏宿主细胞或引起宿主细胞代谢紊乱,其毒性甚强,可造成重大损害。医学导航:毒理学毒理学 / 毒素中毒和毒性解毒剂
- 哌嗪哌嗪(音:派秦(pài qín)。英语:Piperazine)是一种有机化合物。哌嗪是包含两个氮原子的六元杂环,两个氮原子处于对位。很多哌嗪类化合物有一些重要的药理性质,其都包含哌嗪官能团
- 视黄醇维生素A(英语:Retinol)又称为视黄醇是维生素A的动物形式之一,它是一个二萜和醇的结构,它可以转换为其他形式的维生素A,并且以醇的衍生物视黄酯充当动物中维生素的储存形式。当转换
- 密克罗尼西亚联邦面积以下资讯是以2013年估计国家领袖国内生产总值(购买力平价) 以下资讯是以2016年估计国内生产总值(国际汇率) 以下资讯是以2016年估计人类发展指数 以下资讯是以2018年估计密
- 无衬线体无衬线体(英语:sans-serif)指没有衬线的字体,与衬线字体相反,完全抛弃装饰衬线,只剩下主干,造型简明有力,更具现代感,起源也很晚。适用于标题、广告,瞬间的识别性高。在汉字等东亚字体
- 达那唑达那唑(Danazol)为一种用于治疗子宫内膜异位症、乳腺小叶增生、遗传性血管性水肿(英语:hereditary angioedema)及其他疾病的药物,主要经口服给药。达那唑具有雄性化的副作用,使其用
- 镉-113m镉-113m(也写作“113mCd”)镉元素的一种放射性同位素及同质异能素,具有约14.1年的半衰期。在普通热核反应堆中,它的裂变产物产额很低;而且它具有极强的中子俘获能力,使得核反应中
- 圭亚那圭亚那(英语:Guyana)是今日圭亚那共和国的前身,是一个存在于1966年和1970年之间的独立国家。英国在圭亚那的统治结束于1966年5月26日,当时英国通过《1966年圭亚那独立法》给予圭
- 前王朝第八第十前王朝时期是埃及文明的第一时期。约前40世纪,埃及人开始在各地建立城邦,当中包括底比斯、孟斐斯、布陀、希拉康波利斯、厄勒芬廷、阿拜多斯、提尼斯、赛伊斯、索伊斯
