卡方检验

✍ dations ◷ 2025-05-16 17:10:14 #卡方检验
卡方检验(Chi-Squared Test或 χ 2 {displaystyle chi ^{2}} Test)是一种统计量的分布在零假设成立时近似服从卡方分布( χ 2 {displaystyle chi ^{2}} 分布)的假设检验。在没有其他的限定条件或说明时,卡方检验一般指代的是皮尔森卡方检验。在卡方检验的一般运用中,研究人员将观察量的值划分成若干互斥的分类,并且使用一套理论(或零假设)尝试去说明观察量的值落入不同分类的概率分布的模型。而卡方检验的目的就在于去衡量这个假设对观察结果所反映的程度。在十九世纪,统计分析方法主要被用于生物数据分析。当时主流意见认为正态分布普遍适用于此类数据,例如乔治·比德尔·艾里爵士以及梅里曼教授(英语:Mansfield Merriman),而卡尔·皮尔森在他1900年的论文中就针对了他们的研究数据作出了指正。直到十九世纪末期,皮尔森指出了部分数据具有明显的偏态,正态分布并不是普遍适用。为了更好地对这些观察数据进行建模,皮尔森在1893年至1916年发表的系列文章中提出了一个包含正态分布以及众多偏态分布的连续概率分布族——皮尔森分布族(英语:Pearson Distribution)。同时,他指出数据统计分析的步骤应该是在从皮尔森分布族中选取合适的分布来进行建模后,使用拟合优度检验技术来评价模型和实验数据间的拟合优度。在1900年,皮尔森发表了著名的关于 χ 2 {displaystyle chi ^{2}} 检验的文章,该文章被认为是现代统计学的基石之一。在该文章中,皮尔森研究了拟合优度检验:假设实验中从总体中随机取样得到的 n {displaystyle n} 个观察值被划分为 k {displaystyle k} 个互斥的分类,这样每个分类都有一个对应的实际观察次数 x i {displaystyle x_{i}} ( i = 1 , 2 , . . . , k {displaystyle i=1,2,...,k} )。研究人员会对实验中各个观察值落入第 i {displaystyle i} 个分类的概率 p i {displaystyle p_{i}} 的分布提出零假设,从而获得了对应所有第 i {displaystyle i} 分类的理论期望次数 m i = n p i {displaystyle m_{i}=np_{i}} 以及限制条件皮尔森提出,在上述零假设成立以及 n {displaystyle n} 趋向 ∞ {displaystyle infty } 的时候,以下统计量的极限分布趋向 χ 2 {displaystyle chi ^{2}} 分布。皮尔森首先讨论零假设中所有分类的理论期望次数 m i {displaystyle m_{i}} 均为足够大且已知的情况,同时假设各分类的实际观测次数 x i {displaystyle x_{i}} 均服从正态分布。皮尔森由此得到当样本容量 n {displaystyle n} 足够大时, X 2 {displaystyle X^{2}} 趋近服从自由度为 ( k − 1 ) {displaystyle (k-1)} 的 χ 2 {displaystyle chi ^{2}} 分布。然而,皮尔森在讨论当零假设中的理论期望次数 m i {displaystyle m_{i}} 未知并依赖于必须由样本去进行估计的若干参数的情况时,记 m i {displaystyle m_{i}} 为实际的理论期望次数以及 m i ′ {displaystyle m'_{i}} 为估计的理论期望次数,认为的值通常为正且足够小以至于可以忽略。皮尔森总结为,如果我们认为 X ′ 2 {displaystyle X'^{2}} 也服从自由度为 ( k − 1 ) {displaystyle (k-1)} 的 χ 2 {displaystyle chi ^{2}} 分布,那么由此近似带来的误差通常足够小并不会对实际决策的结论带来实质性的影响。这个结论在应用层面造成了长达20年的争论,直到费歇尔在1922年及1924年的论文发表后才暂告一段落。

相关

  • 受精受精也称作配子结合或受胎,指来自同一物种的生殖细胞(配子)结合并形成新生物个体的过程。对动物来说,这个过程是由精子及卵子融合,最后发育形成胚胎。依照不同的动物物种,受精可以
  • 医师誓词希波克拉底誓词(希腊语:Όρκος του Ιπποκράτη,英语:Hippocratic Oath),俗称医师誓词,是西方医生传统上行医前的誓言,希波克拉底乃古希腊医者,被誉为西方“医学之父”
  • 脂类组学脂类组学(英语:Lipidomics)是生物系统中细胞脂类途径和网络的大规模研究。“脂类组(英语:Lipidome)(Lipidome)”一词用于描述细胞,组织,生物或生态系统中的完整脂类谱, 是“代谢物组(Met
  • 福氏耐格里变形虫福氏耐格里虫(学名:Naegleria fowleri)是异叶足纲(Heterolobosea)的内格里虫,俗称食脑菌、食脑变形虫(brain-eating amoeba)、福氏阿米巴虫。在其生物生命周期有三种型态:囊胞、类阿
  • 电石碳化钙(英文:Calcium carbide)是电石(又称电土)的主要成分,异名乙炔钙,化学式CaC2,UN No.1402。电石是一种呈绿色或灰黑色的粉末或块状固体,带有大蒜味,工业上常用电石与水混合制取乙
  • 永定县坐标:24°49′0″N 116°46′0″E / 24.81667°N 116.76667°E / 24.81667; 116.76667永定区是中国福建省龙岩市下辖的一个区,位于福建省西南部,北纬24°23′-25°06′,东经116
  • 拉尔夫·本奇拉尔夫·约翰逊·本奇(Ralph Johnson Bunche,1903年8月7日-1971年12月9日),美国政治学家、外交家,由于1940年代后期在巴勒斯坦的调停工作而获得1950年诺贝尔和平奖。他是第一位获
  • 马斯喀特坐标:23°36′N 58°35′E / 23.600°N 58.583°E / 23.600; 58.583马斯喀特(阿拉伯语:محافظة مسقط‎)是阿曼的首都,也是该国第一大城市,人口646,024人(2005年)。《郑和航
  • 南达科他州南达科他州(英语:State of South Dakota),简称南达州,是美国中西部平原上地势较高的一州,过去曾是美国印地安人苏族中拉科他族(Lakota)的聚落所在。南达科他州在1889年11月2日加入美
  • 总鳍鱼类肉鳍鱼总纲(学名:Sarcopterygii)是硬骨鱼类的一个演化支。此类鱼的特点是鱼鳍中有一个中轴骨,在前鳍的基部上有明显的肌肉组织与分开的两片腹鳍,和之后两栖动物和四足类动物的演