BP检验

✍ dations ◷ 2025-12-05 08:31:22 #统计检验

在统计学中,BP检验(英语:Breusch–Pagan test)是1979年由布伦斯(英语:Trevor Breusch)和帕甘(英语:Adrian Pagan)提出的方法,用来检验线性回归模型中是否存在异方差的问题。另外,丹尼斯·库克(英语:R. Dennis Cook)和韦斯伯格在1983年独立地提出了类似的方法。异方差的存在意味着模型的方差与自变量是相关的。

设回归模型为

对其进行回归可以得到一组残差 u ^ {\displaystyle {\widehat {u}}} 。普通最小二乘法(英语:Ordinary least squares)要求方差与自变量无关,这时方差可以由残差平方和的平均值估计得到。但如果这个前提不成立,例如方差与自变量线性相关,就可以通过下列辅助回归,即残差平方对自变量进行回归检验出来:

这就是BP检验的一个情形。它实质上是卡方检验,检验统计量渐进于 n χ 2 {\displaystyle n\chi ^{2}} ,自由度与除常数项外的解释变量数相等。如果得到的p值小于一定阈值(如0.05)就可以拒绝零假设并认为异方差存在。

如果BP检验表明存在异方差存在,可以视情况使用加权最小二乘法(英语:weighted least squares)(适用于异方差的分布已知时)或异方差稳健标准误(英语:heteroscedasticity-consistent standard errors)方法。

根据高斯-马尔可夫定理,在同方差的前提下,普通最小二乘估计是最佳的线性无偏估计,意即其方差相较其他任何估计量都更小。如果异方差存在,估计结果仍是无偏的,但其方差并不是最小的。在决定使用哪种估计方法之前,可以先进行BP测试来判断是否存在异方差。BP检验的前提是方差 σ i 2 = h ( x i T γ ) {\displaystyle \sigma _{i}^{2}=h(x_{i}^{T}\gamma )} 与各个自变量有关,其中 x i = ( 1 , x 2 i , , x p i ) {\displaystyle x_{i}=(1,x_{2i},\ldots ,x_{pi})} 是自变量,这里除去常数项以外共有 p 1 {\displaystyle p-1} 个解释变量。零假设亦即异方差不存在等价于 ( p 1 ) {\displaystyle (p-1)} 个约束:

BP测试分为以下三个步骤:

并对每个观测都计算出残差 e i {\displaystyle e_{i}}

如果同方差的零假设成立,LM统计量是渐进于 χ p 1 2 {\displaystyle \chi _{p-1}^{2}} 分布的。

在R语言中,能够完成BP检验的函数包括car包中的ncvTest函数、lmtest包中的bptest函数以及plm包中的plmtest函数等。

而Stata中计算回归后使用estat hettest命令,参数填写所有独立变量,即可进行BP检验。

在Python中,statsmodels.stats.diagnosticstatsmodels包)中的函数het_breuschpagan可进行BP检验。

相关

  • 头昏头晕(英语:Dizziness),是一种空间认知和稳定度的功能性障碍。头晕(dizziness)一词的定义较含糊不清,因为头晕可能是眩晕、晕厥前期(英语:presyncope) 、重心平衡障碍(英语:Balance disor
  • 埤仔头埤仔头或称埤子头,是台湾高雄市左营区内的一个聚落,大致分布在现今之埤东、埤西及埤北里等地。自明郑时期即开始开发,清初因而将凤山县治设于埤仔头地区。埤仔头街的形成最早约
  • 感染性休克败血性休克(septic shock),又称感染性休克,是指罹患严重败血症(sepsis)的部分病人,简单来说,败血症是种身体对感染的反应。病人出现无法由抢救输液(fluid resuscitation)挽回的低血压,
  • 安东尼与克利奥帕特拉安东尼与克丽奥佩托拉是莎士比亚所作之悲剧,首次公演时间可能在1607年,目前所知最早的印刷版本是1623年的第一对开本。剧情是来自于汤玛士诺斯(Thomas North)翻译普鲁塔克所著之
  • 曝光补偿曝光补偿也称为EV(曝光值)调整,是指在摄影过程中通过对曝光值的调整以达到最佳效果的一种技术手段。虽然有些照相机能够自动运算得出曝光值,但是得到的未必绝对正确,而且也可能不
  • 右京区右京区(日语:右京区/うきょうく  */?)是构成京都市的11区之一,为京都市内面积最大的区。南部是过去皇族与公家别庄的所在、现在主要为住宅区;西部和北部是山区,北部被称为“京北
  • 陈宇晖陈宇晖(英语:Danny Chen,1992年5月26日-2011年10月3日)是一名驻扎在阿富汗的华裔美军二等兵,2011年因不堪军中同袍凌虐而于阿富汗自杀身亡。1992年5月26日,陈宇晖生于美国纽约州纽
  • 模型选择模型选择(英语:model selection)是在给定数据的情况下,在一组候选模型中选定最优模型的过程。在最简单的情形之下,给定数据可以是已存在的数据。不过,在复杂的情形下,模型选择也可
  • 近江盆地近江盆地,占据日本近畿地方滋贺县的中部和南部,西临比良山地,东邻铃鹿山脉,西北临野坂山地。因为断层而形成的巨大盆地,中央低地有日本最大的湖——琵琶湖。湖东地方与湖南地方为
  • 王得禄王得禄(1770年1月19日-1842年2月7日),字百遒,号玉峯,室号慎斋,谥果毅。福建省台湾府诸罗县沟尾(今嘉义县太保市)人,清治时期著名将领,协助平定林爽文事件,击溃朱�、蔡牵等海盗势力,并于第