高斯-马尔可夫定理

✍ dations ◷ 2025-04-27 15:39:20 #数学定理,统计学

在统计学中,高斯-马尔可夫定理(Gauss-Markov Theorem)陈述的是:在线性回归模型中,如果误差满足零均值、同方差且互不相关,则回归系数的最佳线性无偏估计(BLUE, Best Linear unbiased estimator)就是普通最小二乘法估计。

对于简单(一元)线性回归模型,

其中 β 0 {\displaystyle \beta _{0}} β 1 {\displaystyle \beta _{1}} 是非随机但不能观测到的参数, x i {\displaystyle x_{i}} 是非随机且可观测到的一般变量, ε i {\displaystyle \varepsilon _{i}} 是不可观测的随机变量,或称为随机误差或噪音,因此 y i {\displaystyle y_{i}} 是可观测的随机变量。

高斯-马尔可夫定理的假设条件是:

则对 β 0 {\displaystyle \beta _{0}} β 1 {\displaystyle \beta _{1}} 的最佳线性无偏估计为,

对于多元线性回归模型,

使用矩阵形式,线性回归模型可简化记为 Y = X β + ε {\displaystyle \mathbf {Y} =\mathbf {X} {\boldsymbol {\beta }}+{\boldsymbol {\varepsilon }}} ,其中采用了以下记号:

Y = ( y 1 , y 2 , , y n ) T {\displaystyle \mathbf {Y} =(y_{1},y_{2},\dots ,y_{n})^{T}} (观测值向量,Vector of Responses),

X = ( x i j ) = {\displaystyle \mathbf {X} =(x_{ij})={\begin{bmatrix}1&x_{11}&x_{12}&\cdots &x_{1p}\\1&x_{21}&x_{22}&\cdots &x_{2p}\\\vdots &\vdots &\vdots &\ddots &\vdots \\1&x_{n1}&x_{n2}&\cdots &x_{np}\end{bmatrix}}} (设计矩阵,Design Matrix),

β = ( β 0 , β 1 , , β p ) T {\displaystyle {\boldsymbol {\beta }}=(\beta _{0},\beta _{1},\dots ,\beta _{p})^{T}} (参数向量,Vector of Parameters),

ε = ( ε 1 , ε 2 , , ε n ) T {\displaystyle {\boldsymbol {\varepsilon }}=(\varepsilon _{1},\varepsilon _{2},\dots ,\varepsilon _{n})^{T}} (随机误差向量,Vectors of Error)。

高斯-马尔可夫定理的假设条件是:

则对 β {\displaystyle {\boldsymbol {\beta }}} 的最佳线性无偏估计为

首先,注意的是这里数据是 Y {\displaystyle \mathbf {Y} } 而非 X {\displaystyle \mathbf {X} } ,我们希望找到 β {\displaystyle {\boldsymbol {\beta }}} 对于 Y {\displaystyle \mathbf {Y} } 的线性估计量,记作

其中 β ^ {\displaystyle {\hat {\boldsymbol {\beta }}}} M {\displaystyle \mathbf {M} } N {\displaystyle \mathbf {N} } Y {\displaystyle \mathbf {Y} } 分别是 ( p + 1 ) × 1 {\displaystyle (p+1)\times 1} ( p + 1 ) × 1 {\displaystyle (p+1)\times 1} ( p + 1 ) × n {\displaystyle (p+1)\times n} n × 1 {\displaystyle n\times 1} 矩阵。

根据零均值假设所得,

其次,我们同时限制寻找的估计量为无偏的估计量,即要求 E ( β ^ ) = β {\displaystyle {\rm {E}}\left({\hat {\boldsymbol {\beta }}}\right)={\boldsymbol {\beta }}} ,因此有

相关

  • 国家卫生研究院美国国家卫生院(英语:National Institutes of Health,缩写为NIH),隶属于美国卫生及人类服务部,是美国联邦政府中首要的生物医学研究机构。2006年的资料显示,此机构花费美国全国28%
  • 前视人体解剖学方位是解剖学中用来描述人体器官的相对位置、以及运动方向的标准术语,以两手放在身体两侧且掌心面向前方的标准解剖姿势(英语:Standard anatomical position)为准。在
  • 流行音乐流行音乐(英语:Popular Music),亦称流行歌曲、现代流行音乐,是指一段时期内广泛被大众所接受和喜欢的音乐。现代流行音乐又可作商业化运作,有时称作商业音乐。和流行音乐形成对比
  • 洛伦茨大公奥地利-埃斯特大公,洛伦兹亲王(德语:Lorenz Habsburg-Lothringen;英语:Prince Lorenz of Belgium, Archduke of Austria-Este,全名:洛伦佐·奥托·卡尔·阿梅迪乌斯·玛利亚·庇护
  • 鹿豚鹿豚(学名:Babyrousa)又名鹿猪,为偶蹄目猪科鹿豚亚科下的唯一一个属,分布于印尼苏拉威西岛、托吉安群岛、苏拉群岛及布鲁岛。此属原被认为是单型,但现已分成几个物种。最初鹿豚被
  • 文学评论文学批评或文学评论(英语:Literary criticism)乃是对文学的研究、评价和解读。现代文学批评经常受到文学理论的影响,而后者专注于对文学的技巧和目标进行哲学性的探讨。二者虽然
  • 时越时越(1991年1月11日-),中国河南省洛阳市人,中国棋院职业九段。时越6岁学棋,2003年初夺得晚报杯业余围棋锦标赛冠军,同年入段。2007年升为四段,2010年升为五段。2013年,夺得第17届LG杯
  • 化学工业化学工业是生产化学产品的工业。是一个多行业、多品种,为国民经济各部门和人民生活各方面服务的工业,是重工业的支柱。一般可分为无机化学工业、基本有机化学工业、高分子化学
  • A1GP汽车大奖赛A1GP汽车大奖赛(英语:A1 Grand Prix,简称 A1 GP或A1)同时也被称为赛车的“世界杯”,是一项国际性的赛车运动,在赛车界由于其车手以国家身份,而不是私人车队身份参赛而独一无二。此
  • 短时间负载短时间负载(short time duty)或短时间运作(short time operation)是指只能在短暂时间内运作,但有较好特性的运作模式。通常是指设备的最大负载(或性能),同时标示在此条件下运作,在设