估计量的偏差

✍ dations ◷ 2025-11-26 14:31:50 #统计理论,估计理论,认知偏误

在统计学中，估计量的偏差（或偏差函数）是此估计量的期望值与估计参数的真值之差。偏差为零的估计量或决策规则称为无偏的。否则该估计量是有偏的。在统计中，“偏差”是一个函数的客观陈述。

偏差也可以相对于中位数来衡量，而非相对于均值（期望值），在这种情况下为了与通常的“均值”无偏性区别，称作“中值”无偏。偏差与一致性相关联，一致估计量都是收敛并且无偏的（因此会收敛到正确的值），虽然一致序列中的个别估计量可能是有偏的（只要偏差收敛于零）；参见偏差与一致性。

当其他量相等时，无偏估计量比有偏估计量更好一些，但在实践中，并不是所有其他统计量的都相等，于是也经常使用有偏估计量，一般偏差较小。当使用一个有偏估计量时，也会估计它的偏差。有偏估计量可能用于以下原因：由于如果不对总体进一步假设，无偏估计量不存在或很难计算（如标准差的无偏估计（英语：unbiased estimation of standard deviation））；由于估计量是中值无偏的，却不是均值无偏的（或反之）；由于一个有偏估计量较之无偏估计量（特别是收缩估计量（英语：shrinkage estimator））可以减小一些损失函数（尤其是均方差）；或者由于在某些情况下，无偏的条件太强，而这些无偏估计量没有太大用处。此外，在非线性变换下均值无偏性不会保留，不过中值无偏性会保留（参见变换的效应）；例如样本方差是总体方差的无偏估计量，但它的平方根标准差则是总体标准差的有偏估计量。下面会进行说明。

设我们有一个参数为实数的概率模型，产生观测数据的概率分布 $P_{\theta }(x)=P(x\mid \theta )$ 的估计量。也就是说，我们假定我们的数据符合某种未知分布 $P_{\theta }(x)=P(x\mid \theta )$ 是一个固定常数，而且是该分布的一部分，但具体值未知），于是我们构造估计量 ${\hat {\theta }}$ 的值对应起来。因此这个估量的（相对于参数的）偏差定义为

其中 $\operatorname {E} _{\theta }$ 对于条件分布 $P(x\mid \theta )$ 的所有值的偏差都等于零的估计量称为无偏估计量。

在一次关于估计量性质的模拟实验中，估计量的偏差可以用平均有符号离差（英语：mean signed difference）来评估。

随机变量的样本方差从两方面说明了估计量偏差：首先，自然估计量（naive estimator）是有偏的，可以通过比例因子校正；其次，无偏估计量的均方差（MSE）不是最优的，可以用一个不同的比例因子来最小化，得到一个比无偏估计量的MSE更小的有偏估计量。

具体地说，自然估计量就是将离差平方和加起来然后除以，是有偏的。不过除以 − 1 会得到一个无偏估计量。相反，MSE可以通过除以另一个数来最小化（取决于分布），但这会得到一个有偏估计量。这个数总会比 − 1 大，所以这就叫做收缩估计量（英语：shrinkage estimator），因为它把无偏估计量向零“收缩”；对于正态分布，最佳值为 + 1。

设 ₁, ..., 是期望为、方差为 2 的独立同分布（i.i.d.）随机变量。如果样本均值与未修正样本方差定义为

则 2 是 2 的一个有偏估计量，因为

换句话说，未修正的样本方差的期望值不等于总体方差 2，除非乘以归一化因子。而样本均值是总体均值的无偏估计量。

2 是有偏的原因源于样本均值是的普通最小二乘（英语：ordinary least squares）（OLS）估计量这个事实： ${\overline {X}}$ $\overline{X}$ 是令 $\sum _{i=1}^{n}(X_{i}-{\overline {X}})^{2}$ $\sum _{i=1}^{n}(X_{i}-{\overline {X}})^{2}$ 尽可能小的数。也就是说，当任何其他数代入这个求和中时，这个和只会增加。尤其是，在选取 $\mu \neq {\overline {X}}$ $\mu \neq {\overline {X}}$ 就会得出，

于是

注意到，通常的样本方差定义为

而这时总体方差的无偏估计量。可以由下式看出：

方差的有偏（未修正）与无偏估计之比称为贝塞尔修正（英语：Bessel's correction）。

相关

秘教秘教，又称秘仪、密仪、密教、密意主义、密传教义等，指在一小众人间相传的秘密知识，及其组织和传授方式，被广泛认为是一个宗教术语，通常涉及神秘性、精神性或隐匿性的观点。秘教的
阿斯图里亚斯语阿斯图里亚斯语（阿斯图里亚斯语：Asturianu，阿斯图里亚斯语发音： /astuˈɾjanʊ/）又称作llïonés、mirandés或Bable，是罗曼语族下的一种语言，在西班牙的阿斯图里亚斯、莱昂、萨
海军武官驻外武官，即外交代表机构（大使馆、领事馆）的武职专员（法语：Attaché）。多由陆海空三军种的校官或将官中选派，处理军事性业务，为使馆中专司国防的馆员，也是一国军队的驻外代表。驻外武
受体拮抗剂受体拮抗剂（英语：receptor antagonist），也叫阻断剂（英语：blocker），是药理学术语，指能与受体结合，并能阻止激动剂产生效应的一类配体物质。拮抗剂对相应受体有化学亲和性，但没有效能，从而
载脂蛋白A11AV1, 1GW3, 1GW4, 1ODP, 1ODQ, 1ODR, 2A01, 3J00, 3K2S, 3R2P· protein binding · phospholipid binding · phospholipid transporter activity · high-density lip
气枪气枪（英语：air gun或airgun），是所有用压缩气体为动力发射抛射物（弹丸）的枪械的统称，包括气步枪、气手枪、气霰弹枪等。气枪与常见的火器类枪械最大的不同是弹丸的动能来源：火器依赖
井深大井深大（日语：井深大，1908年4月11日－1997年12月19日），日本著名企业家、教育家，索尼公司的共同创办人，日本发明协会会长、才能教育研究会理事长、索尼公司名誉会长。井深大1933年毕业
陆地卫星4号陆地卫星4号是陆地卫星计划的第四颗卫星，1982年7月16日发射，它的主要目的是成为一个全球性的卫星影像图库；虽然当时陆地卫星计划是由美国国家航空航天局管理，但其数据的管理与提
99分女朋友《99分女朋友》（英语：My Girl），是一部优酷、浙江东阳辣骄传媒有限公司出品，由钟青执导，赵弈钦、厉嘉琪主演的都市美妆剧。该剧于2020年6月17日在优酷播出。本剧讲述带疤化妆师孟茴
夏禹书夏禹书是传说中禹所制书体或所书字迹，即钟鼎书或蜾匾篆，总共只有12个字。根据目前的研究结果，夏禹书其中5个是古彝文，7个是甲骨文，直译为：“生地？子，留皮齐？，新尚往还。”意译为：“生地