高斯-马尔可夫定理

✍ dations ◷ 2025-07-20 17:06:01 #数学定理,统计学

在统计学中,高斯-马尔可夫定理(Gauss-Markov Theorem)陈述的是:在线性回归模型中,如果误差满足零均值、同方差且互不相关,则回归系数的最佳线性无偏估计(BLUE, Best Linear unbiased estimator)就是普通最小二乘法估计。

对于简单(一元)线性回归模型,

其中 β 0 {\displaystyle \beta _{0}} β 1 {\displaystyle \beta _{1}} 是非随机但不能观测到的参数, x i {\displaystyle x_{i}} 是非随机且可观测到的一般变量, ε i {\displaystyle \varepsilon _{i}} 是不可观测的随机变量,或称为随机误差或噪音,因此 y i {\displaystyle y_{i}} 是可观测的随机变量。

高斯-马尔可夫定理的假设条件是:

则对 β 0 {\displaystyle \beta _{0}} β 1 {\displaystyle \beta _{1}} 的最佳线性无偏估计为,

对于多元线性回归模型,

使用矩阵形式,线性回归模型可简化记为 Y = X β + ε {\displaystyle \mathbf {Y} =\mathbf {X} {\boldsymbol {\beta }}+{\boldsymbol {\varepsilon }}} ,其中采用了以下记号:

Y = ( y 1 , y 2 , , y n ) T {\displaystyle \mathbf {Y} =(y_{1},y_{2},\dots ,y_{n})^{T}} (观测值向量,Vector of Responses),

X = ( x i j ) = {\displaystyle \mathbf {X} =(x_{ij})={\begin{bmatrix}1&x_{11}&x_{12}&\cdots &x_{1p}\\1&x_{21}&x_{22}&\cdots &x_{2p}\\\vdots &\vdots &\vdots &\ddots &\vdots \\1&x_{n1}&x_{n2}&\cdots &x_{np}\end{bmatrix}}} (设计矩阵,Design Matrix),

β = ( β 0 , β 1 , , β p ) T {\displaystyle {\boldsymbol {\beta }}=(\beta _{0},\beta _{1},\dots ,\beta _{p})^{T}} (参数向量,Vector of Parameters),

ε = ( ε 1 , ε 2 , , ε n ) T {\displaystyle {\boldsymbol {\varepsilon }}=(\varepsilon _{1},\varepsilon _{2},\dots ,\varepsilon _{n})^{T}} (随机误差向量,Vectors of Error)。

高斯-马尔可夫定理的假设条件是:

则对 β {\displaystyle {\boldsymbol {\beta }}} 的最佳线性无偏估计为

首先,注意的是这里数据是 Y {\displaystyle \mathbf {Y} } 而非 X {\displaystyle \mathbf {X} } ,我们希望找到 β {\displaystyle {\boldsymbol {\beta }}} 对于 Y {\displaystyle \mathbf {Y} } 的线性估计量,记作

其中 β ^ {\displaystyle {\hat {\boldsymbol {\beta }}}} M {\displaystyle \mathbf {M} } N {\displaystyle \mathbf {N} } Y {\displaystyle \mathbf {Y} } 分别是 ( p + 1 ) × 1 {\displaystyle (p+1)\times 1} ( p + 1 ) × 1 {\displaystyle (p+1)\times 1} ( p + 1 ) × n {\displaystyle (p+1)\times n} n × 1 {\displaystyle n\times 1} 矩阵。

根据零均值假设所得,

其次,我们同时限制寻找的估计量为无偏的估计量,即要求 E ( β ^ ) = β {\displaystyle {\rm {E}}\left({\hat {\boldsymbol {\beta }}}\right)={\boldsymbol {\beta }}} ,因此有

相关

  • 大气层大气层,均源自及也许是一层受到重力吸引聚拢在拥有巨大质量天体周围的气体,而如果重力够大且气体的温度够低,就能长期保留住。有些行星拥有许多不同的主要气体,并且有非常深厚的
  • 22iR-羟基胆固醇22R-羟基胆固醇(英语:22R-Hydroxycholesterol)是一种内源性的胆固醇代谢中间产物,参与甾体激素的生物合成。 胆固醇被细胞色素P450家族的CYP11A1胆固醇侧链裂解酶(P450scc)羟基化
  • 补语英语补语的作用对象是主语和宾语,具有鲜明的定语性描写或限制性功能,在句法上是不可或缺的。补语是起补充说明作用的成分。最常见的是宾语补足语。名词、动名词、形容词、副词
  • 细小病毒细小病毒(英语:Parvovirus)是细小病毒科物种的简称。细小病毒科分为两个亚科:细小病毒亚科(主要寄生有脊椎动物)和浓核病毒亚科(主要寄生无脊椎动物)。细小病毒亚科是最常见的依
  • 捕食者捕食(英语:Predation,或称猎食或掠食)是生态学中一种生物互动方式,在这种方式中,捕食者会捕食其他的生命,而这些被捕食者则称为猎物。在进食或行动的过程里,捕食者不一定会杀死它们
  • 少年感化院未成年犯管教所(英语:Youth detention center)是很多国家犯罪或违反法律的未成年人服徒刑或接受强制管教辅导的场所。不少国家认为被判刑的少年犯问题比其他接受管教的少年严重
  • 伦敦郡伦敦郡(英语:County of London)是一个存在于1889年至1965年间的英格兰的郡,相当于今天的内伦敦。本身是根据《1888年当地政府法令》选出郡政府的一个郡。当地政府是伦敦郡政厅,最
  • 拉美拉丁美洲,简称拉美,是美洲的一部分,狭义上包括了以拉丁语族(也称罗曼语族,主要是西班牙语、葡萄牙语和法语)语言为官方语言的美洲国家和地区;广义上包括了美国以南的全部美洲国家与
  • 2019冠状病毒病岐阜县疫情2019冠状病毒病岐阜县疫情(日语:岐阜県における2019年コロナウイルス感染症の流行/ぎふけんにおける2019ねんコロナウイルスかんせんしょうのりゅうこう),介绍日本的2019冠状病毒
  • 莱斯特座堂莱斯特座堂(英语:Leicester Cathedral)是位于英国城市莱斯特的一座英格兰教会的教堂。莱斯特座堂在1922年升格为学院教堂,并在1926年圣公会莱斯特教区成立之后于1927年成为莱斯