卡方检验

✍ dations ◷ 2025-10-11 03:09:45 #卡方检验
卡方检验(Chi-Squared Test或 χ 2 {displaystyle chi ^{2}} Test)是一种统计量的分布在零假设成立时近似服从卡方分布( χ 2 {displaystyle chi ^{2}} 分布)的假设检验。在没有其他的限定条件或说明时,卡方检验一般指代的是皮尔森卡方检验。在卡方检验的一般运用中,研究人员将观察量的值划分成若干互斥的分类,并且使用一套理论(或零假设)尝试去说明观察量的值落入不同分类的概率分布的模型。而卡方检验的目的就在于去衡量这个假设对观察结果所反映的程度。在十九世纪,统计分析方法主要被用于生物数据分析。当时主流意见认为正态分布普遍适用于此类数据,例如乔治·比德尔·艾里爵士以及梅里曼教授(英语:Mansfield Merriman),而卡尔·皮尔森在他1900年的论文中就针对了他们的研究数据作出了指正。直到十九世纪末期,皮尔森指出了部分数据具有明显的偏态,正态分布并不是普遍适用。为了更好地对这些观察数据进行建模,皮尔森在1893年至1916年发表的系列文章中提出了一个包含正态分布以及众多偏态分布的连续概率分布族——皮尔森分布族(英语:Pearson Distribution)。同时,他指出数据统计分析的步骤应该是在从皮尔森分布族中选取合适的分布来进行建模后,使用拟合优度检验技术来评价模型和实验数据间的拟合优度。在1900年,皮尔森发表了著名的关于 χ 2 {displaystyle chi ^{2}} 检验的文章,该文章被认为是现代统计学的基石之一。在该文章中,皮尔森研究了拟合优度检验:假设实验中从总体中随机取样得到的 n {displaystyle n} 个观察值被划分为 k {displaystyle k} 个互斥的分类,这样每个分类都有一个对应的实际观察次数 x i {displaystyle x_{i}} ( i = 1 , 2 , . . . , k {displaystyle i=1,2,...,k} )。研究人员会对实验中各个观察值落入第 i {displaystyle i} 个分类的概率 p i {displaystyle p_{i}} 的分布提出零假设,从而获得了对应所有第 i {displaystyle i} 分类的理论期望次数 m i = n p i {displaystyle m_{i}=np_{i}} 以及限制条件皮尔森提出,在上述零假设成立以及 n {displaystyle n} 趋向 ∞ {displaystyle infty } 的时候,以下统计量的极限分布趋向 χ 2 {displaystyle chi ^{2}} 分布。皮尔森首先讨论零假设中所有分类的理论期望次数 m i {displaystyle m_{i}} 均为足够大且已知的情况,同时假设各分类的实际观测次数 x i {displaystyle x_{i}} 均服从正态分布。皮尔森由此得到当样本容量 n {displaystyle n} 足够大时, X 2 {displaystyle X^{2}} 趋近服从自由度为 ( k − 1 ) {displaystyle (k-1)} 的 χ 2 {displaystyle chi ^{2}} 分布。然而,皮尔森在讨论当零假设中的理论期望次数 m i {displaystyle m_{i}} 未知并依赖于必须由样本去进行估计的若干参数的情况时,记 m i {displaystyle m_{i}} 为实际的理论期望次数以及 m i ′ {displaystyle m'_{i}} 为估计的理论期望次数,认为的值通常为正且足够小以至于可以忽略。皮尔森总结为,如果我们认为 X ′ 2 {displaystyle X'^{2}} 也服从自由度为 ( k − 1 ) {displaystyle (k-1)} 的 χ 2 {displaystyle chi ^{2}} 分布,那么由此近似带来的误差通常足够小并不会对实际决策的结论带来实质性的影响。这个结论在应用层面造成了长达20年的争论,直到费歇尔在1922年及1924年的论文发表后才暂告一段落。

相关

  • 原生动物原生动物是动物界中最低级、最原始、最简单的一类动物,属于原生生物当中较接近动物的一类,简称原虫。身体由单个细胞所构成,因此也被称为单细胞动物。多营自由生活,也有的生活在
  • 邱奇阿隆佐·邱奇(Alonzo Church,1903年6月14日-1995年8月11日)是美国数学家,1936年发表可计算函数的第一份精确定义,对算法理论的系统发展做出巨大贡献。邱奇在普林斯顿大学受教并工
  • 形声陶文 ‧ 甲骨文 ‧ 金文 ‧ 古文 ‧ 石鼓文籀文 ‧ 鸟虫书 ‧ 篆书(大篆 ‧  小篆)隶书 ‧ 楷书 ‧ 行书 ‧ 草书漆书 ‧  书法 ‧ 飞白书笔画 ‧ 
  • 生抽生抽又称淡酱油,是酱油的一种。特色是色泽较淡,呈红褐色,以及味道较咸。生抽颜色淡,咸味重,在烹调中主要用来调味。而老抽颜色重,咸味淡,主要用来调色。生抽以大豆和面粉作为主要原
  • 羽扇豆羽扇豆属(学名:Lupinus)又称鲁冰花,是豆科中的一个属,主要分布于北美洲西部、南美洲、地中海地区以及非洲。这类植物大多为多年生草本植物,高约0.3到1.5米;另外也有少数为一年生植
  • T细胞受体结构 / ECODT细胞受体(T cell receptor, TCR)是T细胞表面的特异性受体,负责识别由主要组织相容性复合体(MHC)所呈递的抗原,它与B细胞受体(英语:B-cell receptor)不同,并不能识别游离的
  • 茧是昆虫在蛹期时,蛹外的椭圆形丝质构造。通常茧在鳞翅目中只有蛾类才拥有,因为蛾类造蛹时都在角落或者地底下,而蝶类则通常在叶背或树枝上,以一条丝将自己的腰部固定住,之后就蜕
  • 裴 钢裴钢(1953年12月11日-),辽宁沈阳人,中国细胞生物学家、分子药理学家,中国科学院院士,中国科学院上海生命科学研究院院长。曾任同济大学校长、台湾世新大学荣誉教授。1953年12月11日
  • 杰马里·莱恩让-马里·莱恩(法语:Jean-Marie Lehn,1939年9月30日-),法国化学家,1987年诺贝尔化学奖获得者之一。他主要的研究领域是超分子化学 ,尤其是穴醚的合成。1901年:范托夫 | 1902年:费歇尔
  • 退化性脑部疾病神经退化障碍(英语:neurodegenerative disease) ,又称为神经退化性疾病,是一种大脑和脊髓的细胞神经元逐渐退化 (死亡) 的所直接导致的疾病。大脑和脊髓由神经元组成,神经元有不同