BP检验

✍ dations ◷ 2025-11-28 06:56:42 #统计检验

在统计学中,BP检验(英语:Breusch–Pagan test)是1979年由布伦斯(英语:Trevor Breusch)和帕甘(英语:Adrian Pagan)提出的方法,用来检验线性回归模型中是否存在异方差的问题。另外,丹尼斯·库克(英语:R. Dennis Cook)和韦斯伯格在1983年独立地提出了类似的方法。异方差的存在意味着模型的方差与自变量是相关的。

设回归模型为

对其进行回归可以得到一组残差 u ^ {\displaystyle {\widehat {u}}} 。普通最小二乘法(英语:Ordinary least squares)要求方差与自变量无关,这时方差可以由残差平方和的平均值估计得到。但如果这个前提不成立,例如方差与自变量线性相关,就可以通过下列辅助回归,即残差平方对自变量进行回归检验出来:

这就是BP检验的一个情形。它实质上是卡方检验,检验统计量渐进于 n χ 2 {\displaystyle n\chi ^{2}} ,自由度与除常数项外的解释变量数相等。如果得到的p值小于一定阈值(如0.05)就可以拒绝零假设并认为异方差存在。

如果BP检验表明存在异方差存在,可以视情况使用加权最小二乘法(英语:weighted least squares)(适用于异方差的分布已知时)或异方差稳健标准误(英语:heteroscedasticity-consistent standard errors)方法。

根据高斯-马尔可夫定理,在同方差的前提下,普通最小二乘估计是最佳的线性无偏估计,意即其方差相较其他任何估计量都更小。如果异方差存在,估计结果仍是无偏的,但其方差并不是最小的。在决定使用哪种估计方法之前,可以先进行BP测试来判断是否存在异方差。BP检验的前提是方差 σ i 2 = h ( x i T γ ) {\displaystyle \sigma _{i}^{2}=h(x_{i}^{T}\gamma )} 与各个自变量有关,其中 x i = ( 1 , x 2 i , , x p i ) {\displaystyle x_{i}=(1,x_{2i},\ldots ,x_{pi})} 是自变量,这里除去常数项以外共有 p 1 {\displaystyle p-1} 个解释变量。零假设亦即异方差不存在等价于 ( p 1 ) {\displaystyle (p-1)} 个约束:

BP测试分为以下三个步骤:

并对每个观测都计算出残差 e i {\displaystyle e_{i}}

如果同方差的零假设成立,LM统计量是渐进于 χ p 1 2 {\displaystyle \chi _{p-1}^{2}} 分布的。

在R语言中,能够完成BP检验的函数包括car包中的ncvTest函数、lmtest包中的bptest函数以及plm包中的plmtest函数等。

而Stata中计算回归后使用estat hettest命令,参数填写所有独立变量,即可进行BP检验。

在Python中,statsmodels.stats.diagnosticstatsmodels包)中的函数het_breuschpagan可进行BP检验。

相关

  • 辅酶B辅酶B(英语:Coenzyme B)是一种辅酶,在产甲烷菌的氧化还原反应中需要被用到。 辅酶B的完整化学名称为7-巯基庚酰苏氨酸磷酸酯(7-mercaptoheptanoylthreoninephosphate)。分子中含
  • 冬季奥运会第四届冬季奥林匹克运动会(英语:the IV Olympic Winter Games,法语:les IVes Jeux olympiques d'hiver,德语:die IV. Olympischen Winterspiele),于1936年2月6日至16日在纳粹德国的
  • 喹喔啉喹喔啉( quinoxaline,benzopyrazine)是一种杂环化合物,化学式C8H6N2,由一个苯环与一个吡嗪环稠合而成。喹喔啉也可看做萘环的两个CH被N原子替换,这样的结构称为萘啶,其同分异构体还
  • 长毛绒长毛绒(英语:plush)是表面起毛,状似裘皮的立绒织物。多以毛纱为经、棉线为纬而织成。绒面丰满平整,具亮光及弹性,保暖性能良好。适合做冬季的服装及绒毛玩具等。
  • 自然语言理解自然语言理解是研究如何让电脑读懂人类语言的一门技术,是自然语言处理技术中最困难的一项。自然语言理解这个概括的术语,适用于多样的电脑应用,从小型、相对简单之事,例如发给机
  • 萨瑟克坐标:51°29′56″N 0°05′24″W / 51.4988°N 0.0901°W / 51.4988; -0.0901萨瑟克(Southwark /ˈsʌðərk/ SUDH-ərk)或译南华克,是英国中伦敦的一个地区,是萨瑟克区的一部
  • 多项式多项式(Polynomial)是代数学中的基础概念,是由称为未知数的变量和称为系数的常数通过有限次加减法、乘法以及自然数幂次的乘方运算得到的代数表达式。多项式是整式的一种。未知
  • 托尼·邓恩托尼·邓恩(英语:Tony Dunne,1941年7月24日-2020年6月8日),都柏林人,爱尔兰足球运动员,司职后卫。曾在1968年帮助曼联力夺欧洲冠军杯。1941年生于都柏林。早年在当地的斯特拉·马里
  • 孟�,字彦重,平昌郡安丘县(今山东安丘)人,中国南北朝刘宋政治人物,卫将军孟昶之弟。孟昶、孟�有美好的风度,当时人称他为双珠。孟昶尊贵名盛,孟�不应召就职。孟昶死后,孟�历任侍中、仆射、
  • 红线传《红线传》是一篇唐传奇,收录于袁郊所著《甘泽谣》。叙述虚拟人物侠女红线,帮助主公潞州节度使薛嵩抵抗魏博节度使田承嗣的故事,是一篇知名的武侠传奇。“红线”是潞州节度使薛