高斯-马尔可夫定理

✍ dations ◷ 2025-05-19 13:53:56 #数学定理,统计学

在统计学中,高斯-马尔可夫定理(Gauss-Markov Theorem)陈述的是:在线性回归模型中,如果误差满足零均值、同方差且互不相关,则回归系数的最佳线性无偏估计(BLUE, Best Linear unbiased estimator)就是普通最小二乘法估计。

对于简单(一元)线性回归模型,

其中 β 0 {\displaystyle \beta _{0}} β 1 {\displaystyle \beta _{1}} 是非随机但不能观测到的参数, x i {\displaystyle x_{i}} 是非随机且可观测到的一般变量, ε i {\displaystyle \varepsilon _{i}} 是不可观测的随机变量,或称为随机误差或噪音,因此 y i {\displaystyle y_{i}} 是可观测的随机变量。

高斯-马尔可夫定理的假设条件是:

则对 β 0 {\displaystyle \beta _{0}} β 1 {\displaystyle \beta _{1}} 的最佳线性无偏估计为,

对于多元线性回归模型,

使用矩阵形式,线性回归模型可简化记为 Y = X β + ε {\displaystyle \mathbf {Y} =\mathbf {X} {\boldsymbol {\beta }}+{\boldsymbol {\varepsilon }}} ,其中采用了以下记号:

Y = ( y 1 , y 2 , , y n ) T {\displaystyle \mathbf {Y} =(y_{1},y_{2},\dots ,y_{n})^{T}} (观测值向量,Vector of Responses),

X = ( x i j ) = {\displaystyle \mathbf {X} =(x_{ij})={\begin{bmatrix}1&x_{11}&x_{12}&\cdots &x_{1p}\\1&x_{21}&x_{22}&\cdots &x_{2p}\\\vdots &\vdots &\vdots &\ddots &\vdots \\1&x_{n1}&x_{n2}&\cdots &x_{np}\end{bmatrix}}} (设计矩阵,Design Matrix),

β = ( β 0 , β 1 , , β p ) T {\displaystyle {\boldsymbol {\beta }}=(\beta _{0},\beta _{1},\dots ,\beta _{p})^{T}} (参数向量,Vector of Parameters),

ε = ( ε 1 , ε 2 , , ε n ) T {\displaystyle {\boldsymbol {\varepsilon }}=(\varepsilon _{1},\varepsilon _{2},\dots ,\varepsilon _{n})^{T}} (随机误差向量,Vectors of Error)。

高斯-马尔可夫定理的假设条件是:

则对 β {\displaystyle {\boldsymbol {\beta }}} 的最佳线性无偏估计为

首先,注意的是这里数据是 Y {\displaystyle \mathbf {Y} } 而非 X {\displaystyle \mathbf {X} } ,我们希望找到 β {\displaystyle {\boldsymbol {\beta }}} 对于 Y {\displaystyle \mathbf {Y} } 的线性估计量,记作

其中 β ^ {\displaystyle {\hat {\boldsymbol {\beta }}}} M {\displaystyle \mathbf {M} } N {\displaystyle \mathbf {N} } Y {\displaystyle \mathbf {Y} } 分别是 ( p + 1 ) × 1 {\displaystyle (p+1)\times 1} ( p + 1 ) × 1 {\displaystyle (p+1)\times 1} ( p + 1 ) × n {\displaystyle (p+1)\times n} n × 1 {\displaystyle n\times 1} 矩阵。

根据零均值假设所得,

其次,我们同时限制寻找的估计量为无偏的估计量,即要求 E ( β ^ ) = β {\displaystyle {\rm {E}}\left({\hat {\boldsymbol {\beta }}}\right)={\boldsymbol {\beta }}} ,因此有

相关

  • 西属尼德兰西属尼德兰(西班牙语:Países Bajos españoles;荷兰语:Spaanse Nederlanden)是低地国家中的一部分神圣罗马帝国领地的统称,于1581年至1714年与西班牙(哈布斯堡王朝)为共主邦联关系
  • 叔醇叔醇,或称第三醇(tertiary alcohol),是指羟基直接连接在一个叔碳原子上的醇。它也可以说是含有基团“≡COH”的醇。 例如 : 2-甲基-2-丙醇,又称第三丁醇,叔丁醇(tert-Butanol)或
  • 平清盛平清盛(1118年-1181年3月20日、元永元年-治承5年闰2月4日)是日本平安时代后期的武将、公卿、政治家。伊势平氏的栋梁平忠盛的嫡长子。1156年的保元之乱后赢得后白河天皇的信赖,11
  • 镰仓坐标:35°19′N 139°33′E / 35.317°N 139.550°E / 35.317; 139.550镰仓市(日语:鎌倉市/かまくらし Kamakura shi */?)位于日本神奈川县三浦半岛西面,是人口约为18万人的小型
  • 塞维鲁王朝塞维鲁王朝,是罗马帝国的塞维鲁家族掌握的王朝,由原潘诺尼亚总督北非人塞普蒂米乌斯·塞维鲁创建,在卡拉卡拉执政的212年,罗马帝国境内所有自由民被授予罗马公民身份,235年军队爆
  • 故乡的风故乡的风(日语:ふるさとの風,ふるさとのかぜ;英语:Furusato No Kaze)是日本的一个广播电台,由日本政府的绑架问题对策本部向朝鲜民主主义人民共和国进行短波广播。2007年7月开始向
  • 乌山空军基地37°05′26″N 127°01′47″E / 37.09056°N 127.02972°E / 37.09056; 127.02972 (Osan AB)乌山空军基地(英语:Osan Air Base;朝鲜语:오산공군기지/烏山空軍基地),基地代码K-55,是
  • 凹凸性 (几何)在几何学中,一个几何图形可分为凸或凹的。例如多边形和多面体。其中,凸的多边形称为凸多边形、凹的多边形则可称为凹多边形或非凸多边形,多面体与多胞体亦然。然而在三维或更高
  • 台中市公共自行车租赁系统站点列表台中市公共自行车租赁系统(iBike)是台中市的公共自行车租赁系统,采无人化自助式服务。由台中市政府交通局提案、微笑单车公司(原为捷安特公司负责,后捷安特将YouBike事业部单独
  • 双头动物双头动物,顾名思义,就是拥有两个头的动物。是一个近年来并不少见的现象,个中有不少是经加工过的照片所虚构的情况,但亦有部分是真实存在的个案。多发生于爬行类动物和两栖类动物