格鲁布斯检验法

✍ dations ◷ 2025-11-24 15:18:26 #统计检验

格拉布斯检验法(Grubbs's test),有时也被称为最大归一化残差检验,是一种在统计学中用于分析异常值(英语:Outlier)的方法,因发明者弗兰克·E·格拉布斯(英语:Frank E. Grubbs)而得名。

格拉布斯检验法基于数据服从正态分布的假设,用于检验单变量(英语:Univariate)数据集内的离群值。因此,在使用格拉布斯检验法时,必须先检验数据的分布是否可以用正态分布进行近似。

格拉布斯检验法定义于如下假设之上:

定义格拉布斯检验统计量为:

其中, X ¯ {\displaystyle {\overline {X}}} s {\displaystyle s} 分别指代的是样本的均值和标准偏差。

如果采用双边检验(英语:two-sided test)的方法,则格拉布斯检验可按照以下步骤进行:

将数据集中的 n {\displaystyle n} 个数值由最小排列到最大,则最小值 X 1 {\displaystyle X_{1}} 或最大值 X n {\displaystyle X_{n}} 为可能的可疑数值。若要检验最小值是否为离群值,则可以按如下公式计算:

检验最大值时,则为:

对该双边检验,若下式成立,则在置信度为 α {\displaystyle \alpha } 处,无偏差值的假设不成立:

其中, t α / ( 2 N ) , N 2 2 {\displaystyle {t_{\alpha /(2N),N-2}^{2}}} 表示t-分布中当自由度为 N 2 {\displaystyle N-2} 、显著性水平为 α 2 N {\displaystyle {\frac {\alpha }{2N}}} 时的上临界值。如果采用单边检验方式,则应该将显著性水平改为 α N {\displaystyle {\frac {\alpha }{N}}}

相关

  • 电子显微镜电子显微镜(英语:electron microscope,简称电镜或电显)是使用电子来展示物件的内部或表面的显微镜。高速的电子的波长比可见光的波长短(波粒二象性),而显微镜的分辨率受其使用的波
  • Azithromycin11–14 h (single dose) 68 h (multiple dosing)阿奇霉素(Azithromycin, /əˌzɪθroʊˈmaɪsᵻn/ )是一种属于大环内酯的抗生素,于1980年被发现,1981年推出。又翻译作阿红霉
  • 波斯尼亚和黑塞哥维那波斯尼亚和黑塞哥维那国家和大学图书馆(NUBBiH,Nacionalna i univerzitetska biblioteka Bosne i Hercegovine)是波斯尼亚和黑塞哥维那的国家图书馆,位于萨拉热窝。图书馆修建于
  • 安德雷亚斯·维萨里安德雷亚斯·维萨里 (拉丁语:Andreas Vesalius,荷兰语:Andries van Wesel;1514年12月31日于布鲁塞尔-1564年10月15日于扎金索斯)是一名文艺复兴时期的解剖学家、医生,他编写的《人体
  • 菲律宾众议院菲律宾众议院,是菲律宾的下议院立法机构。目前共设有300个议席。现任议长是Alan Peter Cayetano,他于2019年7月22日开始担任该职务。菲律宾众议院有80%的议席是地区议席,代表特
  • 玛莉·居里玛丽亚·斯克沃多夫斯卡-居里(波兰语:Maria Skłodowska-Curie,1867年11月7日-1934年7月4日),通常称为玛丽·居里(法语:Marie Curie)或居里夫人(Madame Curie),波兰裔法国籍物理学家、化
  • 虐待老人虐待老人 (也称“高龄人虐待”、“不尽孝”)是“单一的、重复性活动,或缺乏合适的行为,出现在本应相互信任、满足期待的关系中,导致对老年人的伤害和痛苦。”这一定义被世界卫
  • 加利福尼亚大学圣地牙哥分校圣迭戈加利福尼亚大学 (英语:University of California, San Diego;常用缩写“UCSD”或“UC San Diego”),简称“圣迭戈加州大学”,民间多译作“加利福尼亚大学圣迭戈分校”,是美国
  • 多明尼昂山脉坐标:85°20′S 166°30′E / 85.333°S 166.500°E / -85.333; 166.500多明尼昂山脉(英语:Dominion Range)是南极洲的山脉,位于杜费克海岸,属于毛德王后山脉的一部分,处于比尔德摩
  • 里德-所罗门码里德-所罗门码(Reed-solomon codes,简称里所码或 RS codes)是一种前向错误更正的信道编码,对由校正过采样数据所产生的有效多项式。编码过程首先在多个点上对这些多项式求冗余,然