高斯-马尔可夫定理

✍ dations ◷ 2025-06-09 03:42:56 #数学定理,统计学

在统计学中,高斯-马尔可夫定理(Gauss-Markov Theorem)陈述的是:在线性回归模型中,如果误差满足零均值、同方差且互不相关,则回归系数的最佳线性无偏估计(BLUE, Best Linear unbiased estimator)就是普通最小二乘法估计。

对于简单(一元)线性回归模型,

其中 β 0 {\displaystyle \beta _{0}} β 1 {\displaystyle \beta _{1}} 是非随机但不能观测到的参数, x i {\displaystyle x_{i}} 是非随机且可观测到的一般变量, ε i {\displaystyle \varepsilon _{i}} 是不可观测的随机变量,或称为随机误差或噪音,因此 y i {\displaystyle y_{i}} 是可观测的随机变量。

高斯-马尔可夫定理的假设条件是:

则对 β 0 {\displaystyle \beta _{0}} β 1 {\displaystyle \beta _{1}} 的最佳线性无偏估计为,

对于多元线性回归模型,

使用矩阵形式,线性回归模型可简化记为 Y = X β + ε {\displaystyle \mathbf {Y} =\mathbf {X} {\boldsymbol {\beta }}+{\boldsymbol {\varepsilon }}} ,其中采用了以下记号:

Y = ( y 1 , y 2 , , y n ) T {\displaystyle \mathbf {Y} =(y_{1},y_{2},\dots ,y_{n})^{T}} (观测值向量,Vector of Responses),

X = ( x i j ) = {\displaystyle \mathbf {X} =(x_{ij})={\begin{bmatrix}1&x_{11}&x_{12}&\cdots &x_{1p}\\1&x_{21}&x_{22}&\cdots &x_{2p}\\\vdots &\vdots &\vdots &\ddots &\vdots \\1&x_{n1}&x_{n2}&\cdots &x_{np}\end{bmatrix}}} (设计矩阵,Design Matrix),

β = ( β 0 , β 1 , , β p ) T {\displaystyle {\boldsymbol {\beta }}=(\beta _{0},\beta _{1},\dots ,\beta _{p})^{T}} (参数向量,Vector of Parameters),

ε = ( ε 1 , ε 2 , , ε n ) T {\displaystyle {\boldsymbol {\varepsilon }}=(\varepsilon _{1},\varepsilon _{2},\dots ,\varepsilon _{n})^{T}} (随机误差向量,Vectors of Error)。

高斯-马尔可夫定理的假设条件是:

则对 β {\displaystyle {\boldsymbol {\beta }}} 的最佳线性无偏估计为

首先,注意的是这里数据是 Y {\displaystyle \mathbf {Y} } 而非 X {\displaystyle \mathbf {X} } ,我们希望找到 β {\displaystyle {\boldsymbol {\beta }}} 对于 Y {\displaystyle \mathbf {Y} } 的线性估计量,记作

其中 β ^ {\displaystyle {\hat {\boldsymbol {\beta }}}} M {\displaystyle \mathbf {M} } N {\displaystyle \mathbf {N} } Y {\displaystyle \mathbf {Y} } 分别是 ( p + 1 ) × 1 {\displaystyle (p+1)\times 1} ( p + 1 ) × 1 {\displaystyle (p+1)\times 1} ( p + 1 ) × n {\displaystyle (p+1)\times n} n × 1 {\displaystyle n\times 1} 矩阵。

根据零均值假设所得,

其次,我们同时限制寻找的估计量为无偏的估计量,即要求 E ( β ^ ) = β {\displaystyle {\rm {E}}\left({\hat {\boldsymbol {\beta }}}\right)={\boldsymbol {\beta }}} ,因此有

相关

  • p734GUQ、​1COK、​1DXS、​2KBY、​2MPS、​2WQI、​2WQJ、​2WTT、​2XWC、​3VD0、​3VD1、​3VD2、​4A63、​4G82、​4G83、​4GUO716122062ENSG00000078900ENSMUSG00000
  • 罗格斯大学罗格斯大学,全称新泽西州立罗格斯大学,简称罗大(Rutgers, The State University of New Jersey /ˈrʌtɡərz/)是美国新泽西州的最大高等学府,是一所公立研究型大学,名列公立常春
  • 整体适应度整体适应度(英语:Inclusive fitness)是指某个体的直接与非直接适应度(fitness)的总合。直接是指影响个体本身的适应度;非直接则是指影响个体在群体(社会)中其他同伴的适应度,血缘关系
  • 邵族邵族(邵语:Thau或Thao),是一个台湾的原住民族,聚居于南投县日月潭及雨社山一带。相传邵族的祖先是追逐白鹿翻越“阿里山”一带('arithan / 'ari a hundun)而来。人口甚少,但与分部
  • 虞美人虞美人,词牌名亦为变体诗。亦称《玉壶冰》、《忆柳曲》、《虞美人令》、《一江春水》。双调五十六字,前后阕各两仄韵、两平韵,平仄换韵, 每句不同韵,方式是“甲乙丙丁”。注:平表
  • 地震带地震带是指地震集中发生及分布的地方。地球上主要有四处地震带。地震带皆位于板块交界处或者板块内部的断裂带上。在地球上主要有四大地震带:中国地震局地质研究所研究员徐锡
  • 豫菜豫菜,即河南菜系,是对在带有中原传统文化内涵的烹饪理论指导下,运用具备中原地域特点的技术和材料所制作的菜肴、面点和筵席的总称。豫菜是中国各大菜系的渊源,被中国烹饪界称为
  • 打字打字(英语:typing)是按下打字机、电脑键盘或手机上的按键来输入文本的过程,其中文本可以是字母、数字或符号等。早期人类发明打字机开始逐渐演变为电脑键盘,之后能够在手持设备上
  • 中国铁道出版社中国铁道出版社于1951年成立,是中华人民共和国铁道部直属的中央级出版社,20世纪80年代初实行事业单位企业化管理。
  • 2020年马来西亚超级足球联赛2020年马来西亚超级足球联赛(马来语:CIMB Liga Super Malaysia),是2004年马来西亚超级足球联赛创立和改版以来,由马来西亚超级联赛MPL主办的第17届马来西亚足球顶级联赛,冠军可以