高斯-马尔可夫定理

✍ dations ◷ 2025-01-31 11:16:31 #数学定理,统计学

在统计学中,高斯-马尔可夫定理(Gauss-Markov Theorem)陈述的是:在线性回归模型中,如果误差满足零均值、同方差且互不相关,则回归系数的最佳线性无偏估计(BLUE, Best Linear unbiased estimator)就是普通最小二乘法估计。

对于简单(一元)线性回归模型,

其中 β 0 {\displaystyle \beta _{0}} β 1 {\displaystyle \beta _{1}} 是非随机但不能观测到的参数, x i {\displaystyle x_{i}} 是非随机且可观测到的一般变量, ε i {\displaystyle \varepsilon _{i}} 是不可观测的随机变量,或称为随机误差或噪音,因此 y i {\displaystyle y_{i}} 是可观测的随机变量。

高斯-马尔可夫定理的假设条件是:

则对 β 0 {\displaystyle \beta _{0}} β 1 {\displaystyle \beta _{1}} 的最佳线性无偏估计为,

对于多元线性回归模型,

使用矩阵形式,线性回归模型可简化记为 Y = X β + ε {\displaystyle \mathbf {Y} =\mathbf {X} {\boldsymbol {\beta }}+{\boldsymbol {\varepsilon }}} ,其中采用了以下记号:

Y = ( y 1 , y 2 , , y n ) T {\displaystyle \mathbf {Y} =(y_{1},y_{2},\dots ,y_{n})^{T}} (观测值向量,Vector of Responses),

X = ( x i j ) = {\displaystyle \mathbf {X} =(x_{ij})={\begin{bmatrix}1&x_{11}&x_{12}&\cdots &x_{1p}\\1&x_{21}&x_{22}&\cdots &x_{2p}\\\vdots &\vdots &\vdots &\ddots &\vdots \\1&x_{n1}&x_{n2}&\cdots &x_{np}\end{bmatrix}}} (设计矩阵,Design Matrix),

β = ( β 0 , β 1 , , β p ) T {\displaystyle {\boldsymbol {\beta }}=(\beta _{0},\beta _{1},\dots ,\beta _{p})^{T}} (参数向量,Vector of Parameters),

ε = ( ε 1 , ε 2 , , ε n ) T {\displaystyle {\boldsymbol {\varepsilon }}=(\varepsilon _{1},\varepsilon _{2},\dots ,\varepsilon _{n})^{T}} (随机误差向量,Vectors of Error)。

高斯-马尔可夫定理的假设条件是:

则对 β {\displaystyle {\boldsymbol {\beta }}} 的最佳线性无偏估计为

首先,注意的是这里数据是 Y {\displaystyle \mathbf {Y} } 而非 X {\displaystyle \mathbf {X} } ,我们希望找到 β {\displaystyle {\boldsymbol {\beta }}} 对于 Y {\displaystyle \mathbf {Y} } 的线性估计量,记作

其中 β ^ {\displaystyle {\hat {\boldsymbol {\beta }}}} M {\displaystyle \mathbf {M} } N {\displaystyle \mathbf {N} } Y {\displaystyle \mathbf {Y} } 分别是 ( p + 1 ) × 1 {\displaystyle (p+1)\times 1} ( p + 1 ) × 1 {\displaystyle (p+1)\times 1} ( p + 1 ) × n {\displaystyle (p+1)\times n} n × 1 {\displaystyle n\times 1} 矩阵。

根据零均值假设所得,

其次,我们同时限制寻找的估计量为无偏的估计量,即要求 E ( β ^ ) = β {\displaystyle {\rm {E}}\left({\hat {\boldsymbol {\beta }}}\right)={\boldsymbol {\beta }}} ,因此有

相关

  • 阿德福韦阿德福韦酯(adefovir)是一种核苷类似物抗病毒药物,能在抑制逆转录酶,用于治疗乙肝,但不能用于HIV感染。捷克科学院有机化学与生物化学研究所的Antonín Holý首先合成了阿德福韦
  • 人口金字塔人口金字塔(Population pyramid),是用于表现某时间点上的年龄直方图,能反映一地区人口男女比例与年龄构成。这种表示方式显示了年龄和性别资料,为一种可直接且清晰知晓人口组成的
  • 十七世纪1601年1月1日至1700年12月31日的这一段期间被称为17世纪,也称巴洛克时期。17世纪是殖民主义发展的一个世纪。伏尔泰称17世纪是“路易十四的世纪”。科学史上,怀特海称之为“天
  • 天干天干,是中国古代的一种文字计序符号,共10个字: 甲、乙、丙、丁、戊、己、庚、辛、壬、癸,循环使用。中国等汉字文化圈国家古代常以之来命名、排序、纪时。天干最晚在先商已经开
  • 首尔大学首尔大学(朝鲜语:서울대학교/서울大學校,英语:Seoul National University)是一所位于韩国首尔的国立大学。最早的直接前身是朝鲜高宗在1895年创建的法官养成所,后来的京城法学专门
  • 1945年5月8日欧战胜利纪念日,美国以及西欧国家定于每年的5月8日,俄罗斯等东欧国家定于每年的5月9日。以纪念1945年5月8日纳粹德国在柏林正式签订投降书,宣布在第二次世界大战中无条件投降。
  • 寄螨总目见内文寄螨总目(Parasitiformes),是蛛形纲蜱螨亚纲下的一个分类元。本总目包含了所有蜱螨类的生物。这个总目的生物大多数都是寄生生物,但并非所有均是。举例说:总目内约五千种属
  • 苏迪曼山脉苏迪曼山脉(Sudirman Range或Dugunduguoo、Nassau Range)是印度尼西亚巴布亚省的一座山脉,包括毛克山脉的西部。最高峰是查亚峰(海拔4,884m)。格拉斯伯格矿场位于山脉中部,由印尼
  • 克拉克国际机场克拉克国际机场(英语:Clark International Airport;他加禄语:Paliparang Pandaigdig ng Clark;IATA代码:CRK;ICAO代码:RPLC),又称马嘉柏臬国际机场,是一位于菲律宾邦板牙省安赫莱斯市克
  • 上原杏美上原杏美(日文:上原 あずみ、 本名“越川茜(こしかわあかね)”1984年4月10日-)是日本AV女优。静冈县滨松市中区出生,现在居住在东京都。滨松市立北部初中毕业。