在统计学中,高斯-马尔可夫定理(Gauss-Markov Theorem)陈述的是:在线性回归模型中,如果误差满足零均值、同方差且互不相关,则回归系数的最佳线性无偏估计(BLUE, Best Linear unbiased estimator)就是普通最小二乘法估计。
对于简单(一元)线性回归模型,
其中
和
是非随机但不能观测到的参数,
是非随机且可观测到的一般变量,
是不可观测的随机变量,或称为随机误差或噪音,因此
是可观测的随机变量。
高斯-马尔可夫定理的假设条件是:
则对
和
的最佳线性无偏估计为,
对于多元线性回归模型,
使用矩阵形式,线性回归模型可简化记为
,其中采用了以下记号:
(观测值向量,Vector of Responses),
(设计矩阵,Design Matrix),
(参数向量,Vector of Parameters),
(随机误差向量,Vectors of Error)。
高斯-马尔可夫定理的假设条件是:
则对
的最佳线性无偏估计为
首先,注意的是这里数据是
而非
,我们希望找到
对于
的线性估计量,记作
其中
,
,
和
分别是
,
,
和
矩阵。
根据零均值假设所得,
其次,我们同时限制寻找的估计量为无偏的估计量,即要求
,因此有